Alteryx — это инструмент трансформации данных, который можно легко использовать для очистки, агрегации и объединения больших наборов данных.
- Разработан с понятным графическим интерфейсом и функцией drag-and-drop
- Позволяет легко повторять анализ
- Работает путём объединения базовых инструментов фильтрации, формул, агрегации и других преобразований
Типичный сценарий: Excel → Alteryx (трансформация) → SQL / Tableau
- Alteryx — не универсальное решение для любой трансформации данных. Excel по-прежнему подходит для небольших и простых данных.
- Alteryx — не инструмент визуализации и не инструмент глубокой аналитики. Он используется для подготовки данных для специализированных технологий — Tableau, Python или R.
Сценарий 1
Многократные изменения маппинга продуктов, правки от клиента и фильтры к данным требуют часов ручной работы для воссоздания прошлых анализов.
🚀 Быстрая итерация
Вместо пересоздания сводных таблиц — просто добавьте или удалите инструмент и нажмите «play». Результат без лишних часов ручной работы.
Сценарий 2
Похожие анализы (Price/Volume, Margin Trending, Renewal Rates) выполняются на каждом проекте с незначительными изменениями.
🔄 Повторяемый анализ
Быстрая адаптация источников данных к существующим workflow позволяет масштабировать один анализ на несколько проектов.
Сценарий 3
Офшорная команда предоставляет работу, которую сложно проверить, а изменения в расчётах трудно отследить.
📊 Отслеживаемые расчёты
Визуальный интерфейс workflow позволяет руководителям легко видеть шаги расчётов, которые привели к текущим результатам.
Alteryx Workflow — это последовательность инструментов Alteryx, которая принимает входные данные и производит некий результат.
Пример: Простая сортировка
▶ Запуск Workflow
Кнопка запуска в верхней части экрана — запускает весь workflow от начала до конца.
🧰 Палитра инструментов
Перетаскивайте инструменты из палитры на холст. Разделена на категории: Favorites, In/Out, Preparation, Join, Parse, Transform и др.
🎨 Canvas (Холст)
Рабочая область для построения workflow. Инструменты располагаются и соединяются здесь.
⚙️ Окно конфигурации
Отображает настройки выбранного инструмента. Здесь задаются параметры каждого инструмента.
📋 Окно результатов
Показывает ошибки, предупреждения, конверсионные ошибки и сообщения при выполнении workflow.
➕ Добавить инструмент
Перетащите инструмент из палитры на холст.
🔗 Соединить инструменты
Перетащите один инструмент правее другого. Или вручную — кликните на зелёный выходной таб и перетащите на входной таб следующего инструмента.
🗑️ Удалить связи или инструменты
Кликните на значок инструмента (или линию для связи) и нажмите Delete на клавиатуре.
📝 Важно: Документируйте ваш Workflow
Два основных способа документирования:
- Аннотации (Annotations) — короткие заметки к каждому инструменту в панели конфигурации. Отлично подходят для понимания что происходит внутри инструмента.
- Инструмент Comment — текстовый блок на холсте. Отлично подходит для описания групп инструментов. Находится во вкладке Documentation.
📥 Входные данные
- Excel-файл с данными по счетам-фактурам
- 2 года данных
- Сопроводительная информация о клиентах
📤 Результат
- Excel-файл с отсортированными и агрегированными метриками по клиентам
- Продажи, затраты, единицы, валовая прибыль, валовая маржа
Подключение к данным
- Перетащите 3 инструмента Input на холст.
- Для каждого инструмента выберите один из листов обучающей книги в выпадающем меню «Connect to a File or Database».
- У вас должно быть 3 инструмента Input, каждый соответствующий одному из листов книги.
Детали инструмента
- Alteryx поддерживает множество типов входных данных: SQL базы данных, Excel, текстовые файлы.
- Alteryx автоматически определяет типы полей, но некоторые могут требовать ручного задания через Select Tool (например, даты).
Очистка полей с помощью Formula Tool
- Перетащите Select Tool после каждого входного файла. Добавьте Formula Tool после Select Tool для данных 2013.
- В Formula Tool выберите поле Customer ID в выпадающем списке выходного поля.
- Во вкладке «Functions» дважды кликните функцию ReplaceChar. Замените «String» на [Customer ID], «y» на «'» и x на «».
Детали инструмента
- Formula Tool выполняет стандартные функции очистки: удаление пробелов, замена символов и др.
- Select Tool переименовывает поля, меняет типы и удаляет лишние поля (ускоряет обработку).
Объединение данных: Union и Join
- Перетащите Union Tool после входных файлов 2013 и 2014. Подключите выходы Formula Tool и Select Tool к Union Tool.
- Используйте Join Tool для соединения Union Tool с Customer Mapping. Выберите «Customer ID» как поле соединения.
Детали инструмента
- Union Tool — добавляет два похожих набора данных друг к другу (например, 2014 к 2013). Работает по именам столбцов автоматически.
- Join Tool — соединяет две таблицы для получения одной с дополнительными деталями (аналог VLOOKUP).
Фильтрация данных с Filter Tool
- Перетащите Filter Tool и подключите к выходу Join Tool.
- Добавьте ещё один Filter Tool после первого (к выходу «T»). Выберите «Sales» → «>» → введите 0. Это удалит все строки с нулевой или отрицательной выручкой.
Детали инструмента
- Filter Tool разделяет поток данных на два потока по условию — True и False.
- Примеры: удаление возвратов из списка счетов, фильтрация неповторяющихся строк выручки.
Агрегация данных с Summarize Tool
- Перетащите Summarize Tool и подключите к верхнему выходу Filter Tool.
- Кликните на поле Product Category, откройте «Add» → «Group By».
- Добавьте: Group By Year, Sum Sales, Sum Cost, Sum Units.
Детали инструмента
- Summarize Tool группирует данные по выбранным категориям и суммирует метрики.
- Примеры: выручка по клиентам, средняя маржа по странам.
Создание новых полей с Formula Tool
- Перетащите Formula Tool после Summarize Tool.
- Создайте поле Gross Profit (тип Double). Выражение: [Sum_Sales] – [Sum_Cost].
- Для Gross Margin: [Gross_Profit] / [Sum_Sales].
Детали инструмента
- Multi-Row Formula Tool позволяет выполнять расчёты на основе разных строк (например, рост выручки год к году).
Сортировка с Sort Tool
- Перетащите Sort Tool после Formula Tool.
- В окне конфигурации выберите сортировку по Sales по убыванию.
Детали инструмента
- Несколько уровней сортировки для удобного упорядочивания данных.
- Top-N анализ: сначала Sort Tool, затем Sample Tool для выбора первых N записей.
Output Tool — Вывод данных
- Перетащите Output Tool после Sort Tool.
- В конфигурации нажмите выпадающее меню для выбора файла или базы данных.
- Выберите .xlsx и создайте название листа.
- Нажмите зелёную кнопку «Play» — workflow запустится и создаст файл.
Детали инструмента
- Alteryx поддерживает множество форматов: Excel, Tableau Data Extracts, SQL, CSV и другие.
- Можно выводить данные на несколько листов одного Excel-файла одновременно.
Цель: Unpivot кросс-таблицы для Tableau/Alteryx
- Загрузите файл Crosstab_Example через Input Tool.
- Добавьте Transpose Tool (вкладка Transform).
- В конфигурации выберите «BU / Region» как ключевое поле, оставьте все месячные столбцы как поля данных.
Зачем: Unpivot данных необходим для Tableau или дальнейшего использования в Alteryx. Transpose Tool переставляет поля для получения плоского формата файла, который нужен Tableau для корректного отображения данных.
Tool Container — это инструмент, позволяющий группировать, включать и отключать части workflow.
- Найдите во вкладке «Documentation» палитры инструментов.
- Перетащите Tool Container на холст, затем поместите внутрь инструменты, которые может потребоваться отключить.
- Чтобы отключить контейнер: выберите его → в панели конфигурации поставьте галочку «Disabled».
Применение: Тестирование части workflow, отключение SQL-вывода при разработке, группировка логических этапов анализа.
| Задача | Excel | Alteryx |
|---|---|---|
| Изменить типы данных, переименовать/удалить столбцы | Форматирование ячеек, переименование заголовков, удаление столбцов | Select Tool — смена типов, переименование, удаление и переупорядочивание полей |
| Изменить типы данных автоматически | Меню формата ячеек | Auto Field Tool — автоматически подбирает наилучший тип поля |
| Удалить строки | Ручной выбор или быстрый фильтр | Filter Tool — простые или сложные фильтры строк |
| Сортировка | Выделить столбцы → обычная/настраиваемая сортировка | Sort Tool |
| Формулы | Формула в ячейке, протянуть вниз | Formula Tool — создание и обновление полей с широким набором формул |
| Формулы по нескольким строкам (накопительная сумма) | Формула с опорой на предыдущую строку, протянуть вниз | Multi-Row Formula Tool |
| Формула для нескольких столбцов | Сводная таблица | Multi-Field Formula Tool — одна функция для нескольких полей |
| Задача | Excel | Alteryx |
|---|---|---|
| Разбить данные | Text to Columns Wizard | Text to Columns Tool — разделить поле по разделителю |
| Объединить таблицы по общему полю | VLOOKUP | Join Tool |
| Добавить строки | Копировать/вставить, выровняв поля | Union Tool — объединить по именам или позиции столбцов |
| Сводная таблица (вертикальные поля → горизонтальные) | Pivot Table | Cross Tab Tool |
| Сводная таблица (горизонтальные поля → вертикальные) | Pivot Table | Transpose Tool |
| Агрегация и суммирование | Формула SUM или автосумма | Summarize Tool |
Возможности Alteryx: Подготовьте и объедините все ваши данные → Запустите предиктивную, пространственную и статистическую аналитику → Получите глубокие инсайты за часы, а не недели.