🔍 Что такое Alteryx?

Alteryx — это инструмент трансформации данных, который можно легко использовать для очистки, агрегации и объединения больших наборов данных.

  • Разработан с понятным графическим интерфейсом и функцией drag-and-drop
  • Позволяет легко повторять анализ
  • Работает путём объединения базовых инструментов фильтрации, формул, агрегации и других преобразований

Типичный сценарий: Excel → Alteryx (трансформация) → SQL / Tableau

⚠️ Заблуждения
  • Alteryx — не универсальное решение для любой трансформации данных. Excel по-прежнему подходит для небольших и простых данных.
  • Alteryx — не инструмент визуализации и не инструмент глубокой аналитики. Он используется для подготовки данных для специализированных технологий — Tableau, Python или R.
💡 Зачем это мне?

Сценарий 1

Многократные изменения маппинга продуктов, правки от клиента и фильтры к данным требуют часов ручной работы для воссоздания прошлых анализов.

🚀 Быстрая итерация

Вместо пересоздания сводных таблиц — просто добавьте или удалите инструмент и нажмите «play». Результат без лишних часов ручной работы.

Сценарий 2

Похожие анализы (Price/Volume, Margin Trending, Renewal Rates) выполняются на каждом проекте с незначительными изменениями.

🔄 Повторяемый анализ

Быстрая адаптация источников данных к существующим workflow позволяет масштабировать один анализ на несколько проектов.

Сценарий 3

Офшорная команда предоставляет работу, которую сложно проверить, а изменения в расчётах трудно отследить.

📊 Отслеживаемые расчёты

Визуальный интерфейс workflow позволяет руководителям легко видеть шаги расчётов, которые привели к текущим результатам.

⚙️ Что такое Workflow?

Alteryx Workflow — это последовательность инструментов Alteryx, которая принимает входные данные и производит некий результат.

Пример: Простая сортировка

📂 Input Tool ⚫ Sort Tool 📄 Output Tool
🖥️ Среда построения Workflow

▶ Запуск Workflow

Кнопка запуска в верхней части экрана — запускает весь workflow от начала до конца.

🧰 Палитра инструментов

Перетаскивайте инструменты из палитры на холст. Разделена на категории: Favorites, In/Out, Preparation, Join, Parse, Transform и др.

🎨 Canvas (Холст)

Рабочая область для построения workflow. Инструменты располагаются и соединяются здесь.

⚙️ Окно конфигурации

Отображает настройки выбранного инструмента. Здесь задаются параметры каждого инструмента.

📋 Окно результатов

Показывает ошибки, предупреждения, конверсионные ошибки и сообщения при выполнении workflow.

🛠️ Работа с инструментами

➕ Добавить инструмент

Перетащите инструмент из палитры на холст.

🔗 Соединить инструменты

Перетащите один инструмент правее другого. Или вручную — кликните на зелёный выходной таб и перетащите на входной таб следующего инструмента.

🗑️ Удалить связи или инструменты

Кликните на значок инструмента (или линию для связи) и нажмите Delete на клавиатуре.

Основные инструменты
Select
Переименование или удаление полей. Изменение типов данных, порядка полей.
Formula
Создание новых данных и вычисление полей. Поддерживает широкий набор функций — как в Excel и намного больше.
Filter
Удаление строк по условию. Разделяет поток на True (соответствуют условию) и False (не соответствуют).
Summarize
Группировка данных: суммирование, подсчёт, конкатенация строк и многое другое.
Join
Соединение данных из двух источников по общему полю — аналог VLOOKUP или SQL JOIN.
Sort
Переупорядочивание данных по возрастанию или убыванию одного или нескольких полей.
Browse
Просмотр результатов в любой точке workflow. Используется при разработке для проверки данных.

📝 Важно: Документируйте ваш Workflow

Два основных способа документирования:

  • Аннотации (Annotations) — короткие заметки к каждому инструменту в панели конфигурации. Отлично подходят для понимания что происходит внутри инструмента.
  • Инструмент Comment — текстовый блок на холсте. Отлично подходит для описания групп инструментов. Находится во вкладке Documentation.
🏗️ Строим Workflow!

📥 Входные данные

  • Excel-файл с данными по счетам-фактурам
  • 2 года данных
  • Сопроводительная информация о клиентах

📤 Результат

  • Excel-файл с отсортированными и агрегированными метриками по клиентам
  • Продажи, затраты, единицы, валовая прибыль, валовая маржа
1

Подключение к данным

Цель: Добавить входные файлы на холст
  1. Перетащите 3 инструмента Input на холст.
  2. Для каждого инструмента выберите один из листов обучающей книги в выпадающем меню «Connect to a File or Database».
  3. У вас должно быть 3 инструмента Input, каждый соответствующий одному из листов книги.

Детали инструмента

  • Alteryx поддерживает множество типов входных данных: SQL базы данных, Excel, текстовые файлы.
  • Alteryx автоматически определяет типы полей, но некоторые могут требовать ручного задания через Select Tool (например, даты).
2

Очистка полей с помощью Formula Tool

Цель: Удалить символ ' из поля Customer ID
  1. Перетащите Select Tool после каждого входного файла. Добавьте Formula Tool после Select Tool для данных 2013.
  2. В Formula Tool выберите поле Customer ID в выпадающем списке выходного поля.
  3. Во вкладке «Functions» дважды кликните функцию ReplaceChar. Замените «String» на [Customer ID], «y» на «'» и x на «».

Детали инструмента

  • Formula Tool выполняет стандартные функции очистки: удаление пробелов, замена символов и др.
  • Select Tool переименовывает поля, меняет типы и удаляет лишние поля (ускоряет обработку).
3

Объединение данных: Union и Join

Цель: Объединить данные 2013 и 2014, добавить имена клиентов
  1. Перетащите Union Tool после входных файлов 2013 и 2014. Подключите выходы Formula Tool и Select Tool к Union Tool.
  2. Используйте Join Tool для соединения Union Tool с Customer Mapping. Выберите «Customer ID» как поле соединения.

Детали инструмента

  • Union Tool — добавляет два похожих набора данных друг к другу (например, 2014 к 2013). Работает по именам столбцов автоматически.
  • Join Tool — соединяет две таблицы для получения одной с дополнительными деталями (аналог VLOOKUP).
4

Фильтрация данных с Filter Tool

Цель: Отфильтровать отрицательную выручку
  1. Перетащите Filter Tool и подключите к выходу Join Tool.
  2. Добавьте ещё один Filter Tool после первого (к выходу «T»). Выберите «Sales» → «>» → введите 0. Это удалит все строки с нулевой или отрицательной выручкой.

Детали инструмента

  • Filter Tool разделяет поток данных на два потока по условию — True и False.
  • Примеры: удаление возвратов из списка счетов, фильтрация неповторяющихся строк выручки.
5

Агрегация данных с Summarize Tool

Цель: Суммировать продажи и затраты по клиентам
  1. Перетащите Summarize Tool и подключите к верхнему выходу Filter Tool.
  2. Кликните на поле Product Category, откройте «Add» → «Group By».
  3. Добавьте: Group By Year, Sum Sales, Sum Cost, Sum Units.

Детали инструмента

  • Summarize Tool группирует данные по выбранным категориям и суммирует метрики.
  • Примеры: выручка по клиентам, средняя маржа по странам.
6

Создание новых полей с Formula Tool

Цель: Создать поля Валовая прибыль и Валовая маржа
  1. Перетащите Formula Tool после Summarize Tool.
  2. Создайте поле Gross Profit (тип Double). Выражение: [Sum_Sales] – [Sum_Cost].
  3. Для Gross Margin: [Gross_Profit] / [Sum_Sales].

Детали инструмента

  • Multi-Row Formula Tool позволяет выполнять расчёты на основе разных строк (например, рост выручки год к году).
7

Сортировка с Sort Tool

Цель: Отсортировать клиентов по общей выручке
  1. Перетащите Sort Tool после Formula Tool.
  2. В окне конфигурации выберите сортировку по Sales по убыванию.

Детали инструмента

  • Несколько уровней сортировки для удобного упорядочивания данных.
  • Top-N анализ: сначала Sort Tool, затем Sample Tool для выбора первых N записей.
8

Output Tool — Вывод данных

Цель: Экспортировать данные в Excel
  1. Перетащите Output Tool после Sort Tool.
  2. В конфигурации нажмите выпадающее меню для выбора файла или базы данных.
  3. Выберите .xlsx и создайте название листа.
  4. Нажмите зелёную кнопку «Play» — workflow запустится и создаст файл.

Детали инструмента

  • Alteryx поддерживает множество форматов: Excel, Tableau Data Extracts, SQL, CSV и другие.
  • Можно выводить данные на несколько листов одного Excel-файла одновременно.
🔃 Продвинутый уровень: Transpose Tool

Цель: Unpivot кросс-таблицы для Tableau/Alteryx

  1. Загрузите файл Crosstab_Example через Input Tool.
  2. Добавьте Transpose Tool (вкладка Transform).
  3. В конфигурации выберите «BU / Region» как ключевое поле, оставьте все месячные столбцы как поля данных.

Зачем: Unpivot данных необходим для Tableau или дальнейшего использования в Alteryx. Transpose Tool переставляет поля для получения плоского формата файла, который нужен Tableau для корректного отображения данных.

📦 Tool Containers

Tool Container — это инструмент, позволяющий группировать, включать и отключать части workflow.

  • Найдите во вкладке «Documentation» палитры инструментов.
  • Перетащите Tool Container на холст, затем поместите внутрь инструменты, которые может потребоваться отключить.
  • Чтобы отключить контейнер: выберите его → в панели конфигурации поставьте галочку «Disabled».

Применение: Тестирование части workflow, отключение SQL-вывода при разработке, группировка логических этапов анализа.

📊 Excel vs Alteryx — Подготовка данных
ЗадачаExcelAlteryx
Изменить типы данных, переименовать/удалить столбцыФорматирование ячеек, переименование заголовков, удаление столбцовSelect Tool — смена типов, переименование, удаление и переупорядочивание полей
Изменить типы данных автоматическиМеню формата ячеекAuto Field Tool — автоматически подбирает наилучший тип поля
Удалить строкиРучной выбор или быстрый фильтрFilter Tool — простые или сложные фильтры строк
СортировкаВыделить столбцы → обычная/настраиваемая сортировкаSort Tool
ФормулыФормула в ячейке, протянуть внизFormula Tool — создание и обновление полей с широким набором формул
Формулы по нескольким строкам (накопительная сумма)Формула с опорой на предыдущую строку, протянуть внизMulti-Row Formula Tool
Формула для нескольких столбцовСводная таблицаMulti-Field Formula Tool — одна функция для нескольких полей
🔗 Excel vs Alteryx — Парсинг, Объединение, Трансформация
ЗадачаExcelAlteryx
Разбить данныеText to Columns WizardText to Columns Tool — разделить поле по разделителю
Объединить таблицы по общему полюVLOOKUPJoin Tool
Добавить строкиКопировать/вставить, выровняв поляUnion Tool — объединить по именам или позиции столбцов
Сводная таблица (вертикальные поля → горизонтальные)Pivot TableCross Tab Tool
Сводная таблица (горизонтальные поля → вертикальные)Pivot TableTranspose Tool
Агрегация и суммированиеФормула SUM или автосуммаSummarize Tool
📋 Форматирование вывода и Отчётность
Select Output Data Summarize Table Charting Report Text Layout Report Header Render
Select
Выбрать поля для финального вывода. Изменить позицию, размер, тип, переименовать поля.
Output Data
Запись данных в различные форматы: CSV, Excel (.xlsx), Tableau TDE, SQL, JSON, PDF, SPSS, SAS и многие другие.
Summarize
Группировка, суммирование, подсчёт, обработка пространственных объектов, конкатенация строк и многое другое.
Table
Создание базовых таблиц данных и сводных таблиц из входных данных.
Charting
Визуализация данных через стандартные типы диаграмм: Area, Column, Bar, Line, Pie, Scatter, Bubble, Radar и другие.
Report Text
Добавление текста в отчёты с поддержкой данных из входных полей и настройкой стиля.
Layout
Расположение отчётных сниппетов горизонтально или вертикально. Настройка выравнивания, границ, разделителей.
Report Header
Макрос для добавления заголовка к отчёту с логотипом, датой и названием.
Render
Преобразование сниппетов в готовые отчёты профессионального качества: PDF, HTML, XLSX, DOCX, PPTX, RTF.

Возможности Alteryx: Подготовьте и объедините все ваши данные → Запустите предиктивную, пространственную и статистическую аналитику → Получите глубокие инсайты за часы, а не недели.