Избранные инструменты

11 инструментов
Browse
Добавление точек просмотра данных в поток для проверки и верификации данных в любом месте процесса.
Позволяет пользователям просматривать данные на любом этапе обработки.
Filter
Запрос записей по условию с разделением данных на два потока: True (соответствуют условию) и False (не соответствуют).
Оставить только клиентов с более 10 транзакциями или определённым уровнем продаж.
Formula
Создание или обновление полей с помощью одного или нескольких выражений для выполнения широкого спектра вычислений.
Замена NULL-значений нулями. Поддерживает все формулы Excel и многое сверх того.
Input
Загрузка данных в модуль путём выбора файла или подключения к базе данных (опционально с запросом).
Подключение к разнородным наборам данных различных форматов.
Join
Объединение двух входных потоков по общему полю. Функция аналогична SQL JOIN, создаёт 3 выхода: L (только левый), J (совпадения), R (только правый).
Объединение профиля клиента с транзакционными данными по уникальному ID клиента.
Output
Вывод содержимого потока данных в файл или базу данных.
Загрузка обогащённых данных обратно в базу данных.
Sample
Ограничение потока данных до заданного числа, процента или случайного набора записей.
Выбор первых 10 записей для каждого региона — топ-10 магазинов по регионам.
Select
Выбор, отмена выбора, переупорядочивание и переименование полей, изменение типа или размера поля.
Если workflow требует 5 из 50 полей — отмените выбор остальных для ускорения обработки.
Sort
Сортировка записей по значениям одного или нескольких полей.
Ранжирование клиентов по сумме расходов в порядке возрастания/убывания.
Summarize
Агрегация данных путём группировки, суммирования, подсчёта, пространственной обработки, конкатенации строк и многого другого.
Количество клиентов в штате NY и общая сумма их расходов.
Comment
Добавление аннотаций или изображений на холст для заметок или описания процессов.
Документирование определённой части анализа для понимания другими пользователями.
Union
Объединение двух и более потоков данных со схожей структурой по именам или позициям полей.
Объединение данных о продажах за март и апрель в единый поток для дальнейшей обработки.
📂

Ввод / Вывод

9 инструментов
Date Time Now
Ввод текущей даты и времени в момент запуска модуля в выбранном формате.
Легкое добавление заголовка с датой и временем для отчёта.
Directory
Ввод списка имён файлов и атрибутов из указанной директории.
Список всех файлов в директории — используется совместно с Dynamic Input для загрузки актуального файла данных.
Dynamic Input In-DB
Принимает имена подключений In-DB и поля запроса из стандартного потока и вводит их в поток In-DB.
Используется при создании In-DB макроса для предиктивного анализа.
Dynamic Output In-DB
Выводит информацию о In-DB workflow в стандартный workflow для Predictive In-DB.
Вывод информации о In-DB workflow в стандартный workflow для Predictive In-DB.
Map Input
Ручное рисование или выбор пространственных объектов (точки, линии, полигоны) для хранения в модуле.
Выбор пространственного объекта для использования в модуле (приложении).
Text Input
Ручной ввод данных, которые будут храниться в модуле.
Таблица подстановки со значениями для поиска и замены на новые классификации.
XDF Input
Доступ к файлам формата XDF (Revolution R Enterprise's RevoScaleR) для использования в качестве ввода для предиктивных инструментов.
Предиктивная аналитика на больших данных: линейная регрессия, деревья решений, случайный лес.
XDF Output
Запись потока данных Alteryx в файл формата XDF для масштабируемой предиктивной аналитики.
Предиктивная аналитика на больших данных с RevoScaleR.
🔧

Подготовка данных

13 инструментов
Auto Field
Автоматическая установка типа поля для каждого строкового поля до минимально возможного размера.
Минимизация данных для ускорения обработки и обеспечения правильных форматов.
Data Cleansing
Автоматическая очистка данных с простой настройкой галочками.
Удаление NULL-значений, лишних пробелов, чисел из строковых полей.
Date Filter
Макрос для фильтрации данных по критерию даты с помощью интерфейса на основе календаря.
Возврат транзакций за указанный период с начальной и конечной датой.
Generate Rows
Создание новых строк данных — полезно для создания последовательностей чисел, транзакций или дат.
Создание временных рядов: 365 уникальных записей для каждого дня года.
Impute Values
Обновление конкретных значений в числовом поле другим выбранным значением — для замены NULL().
Замена NULL-значений зарплаты средним или медианным значением для точности анализа.
Multi-Field Binning
Группировка нескольких числовых полей в плитки или корзины — особенно для предиктивного анализа.
Группировка транзакционных данных в покупательские персоны: мужчины 30–35 лет с расходами >$1К/мес.
Multi-Field Formula
Создание или обновление нескольких полей с помощью одного выражения.
Замена NULL-значений нулями сразу в нескольких полях.
Multi-Row Formula
Создание или обновление поля с помощью выражения, ссылающегося на данные из соседних строк. Полезно для накопительных итогов.
Создание уникальных идентификаторов на уровне группы, сравнение продаж по годам в разных строках.
Random % Sample
Генерация случайного числа или процента записей, проходящих через поток данных.
Анализ на основе случайных 35% данных.
Record ID
Присвоение уникального идентификатора каждой записи.
Присвоение ID клиента для более точного прямого маркетинга в будущем.
Select Records
Выбор конкретных записей и/или диапазонов, включая несмежные диапазоны. Полезно для устранения неполадок и выборки.
Поиск записей со значением менее $100 или в диапазоне $100–$150.
Tile
Группировка данных в наборы (плитки) на основе диапазонов значений поля.
Создание логических групп: высокоценные клиенты vs. низкоценные клиенты.
Unique
Разделение данных на два потока: дублирующиеся и уникальные записи на основе выбранных полей.
Отправка письма только одному человеку на основе уникального идентификатора клиента.
🔗

Объединение данных

6 инструментов
Append Field
Добавление полей из исходного ввода к каждой записи целевого ввода.
Добавление временных меток и имени пользователя ко всем записям базы данных.
Find Replace
Поиск данных в одном поле из одного потока и замена значением из другого потока. Аналог Excel VLOOKUP.
Поиск и замена значений — аналог Excel Find & Replace.
Join Multiple
Объединение двух и более входов по общим полям. В выходных данных каждая строка содержит данные из всех входов.
Объединение профиля клиента, транзакционных данных и справочников по уникальному ID.
Make Group
Принимает связи между данными и собирает данные в группы на основе этих связей.
Используется преимущественно с Fuzzy Matching — ID 1 может совпадать с 10 значениями из источника 2, формируя группу.
Fuzzy Match
Выявление неидентичных дубликатов в потоке данных.
Сопоставление двух наборов данных с разными ID на основе имён и адресов.
Union
Объединение двух и более потоков данных со схожей структурой по именам или позициям полей.
Объединение данных о продажах за разные периоды в единый файл для анализа.
✂️

Парсинг

4 инструмента
Date Time
Преобразование данных дата/время в различные форматы, включая форматы для выражений и для чтения человеком.
Конвертация военного времени в стандартное. Преобразование «Jan 1, 2012» в «1.1.12».
RegEx
Парсинг, сопоставление или замена данных с использованием синтаксиса регулярных выражений.
Парсинг неструктурированных текстовых файлов — веблогов или данных из Twitter.
Text to Columns
Разбивка текста из одного поля на отдельные строки или столбцы.
Разделение поля «Имя и фамилия» на два отдельных поля для удобства сортировки.
XML Parse
Чтение XML-фрагментов и их парсинг в отдельные поля.
Очистка XML-файла, парсинг XML-текста в структурированные данные.
🔄

Трансформация

7 инструментов
Arrange
Ручная транспозиция и перестановка полей в презентационных целях.
Подготовка данных для отчётов с нужной компоновкой.
Count Records
Подсчёт записей, проходящих через поток данных. Возвращает 0, если записей нет.
Возвращает количество записей, проходящих через инструмент.
Cross Tab
Поворот ориентации потока данных: вертикальные поля переводятся на горизонтальную ось с агрегацией.
Преобразование столбца ID клиентов и столбца выручки: два столбца → две строки.
Running Total
Вычисление накопительной суммы для каждой записи в потоке данных.
Суммирование продаж за 3 года: год1 $10К, год2 $15К, год3 $25К → накопительные итоги.
Summarize
Агрегация: группировка, суммирование, подсчёт, пространственная обработка, конкатенация строк.
Группировка клиентов по возрасту или уровню дохода, подсчёт клиентов в штате NY.
Transpose
Поворот ориентации потока данных: горизонтальные поля переводятся на вертикальную ось.
Преобразование строки ID клиентов и строки выручки: две строки → два столбца.
Weighted Average
Вычисление взвешенного среднего набора значений, где одни записи вносят больший вклад, чем другие.
Расчёт средних расходов с учётом веса отдельных клиентов в формировании среднего.
📊

Отчётность

12 инструментов
Charting
Создание диаграмм (площадь, столбцы, линии, круговые и т.д.) для вывода через инструмент Render.
Создание столбчатых, линейных, круговых диаграмм.
Email
Отправка писем для каждой записи с вложениями или автоматически сгенерированными отчётами.
Создание динамически обновляемого содержимого писем.
Image
Добавление изображения для вывода через инструмент Render.
Добавление графики/изображения в отчёт.
Layout
Расположение двух и более отчётных сниппетов горизонтально или вертикально для вывода через Render.
Организация компонентов отчёта в нужном порядке.
Report Map
Создание карты для вывода через инструмент Render.
Создание карты для включения в отчёт.
Map Legend Builder
Повторная сборка компонентов легенды карты в единую таблицу легенды после настройки.
Принимает настроенную легенду и повторно её собирает.
Map Legend Splitter
Разбивка легенды из Report Map на составные части для настройки другими инструментами.
Настройка легенды: добавление символов $ или %, удаление избыточного текста.
Overlay
Расположение отчётных сниппетов поверх друг друга для вывода через Render.
Наложение таблицы и диаграммы на карту.
Render
Вывод отчётных сниппетов в готовые отчёты: PDF, HTML, XLSX, DOCX, PPTX, RTF.
Сохранение отчётов из Alteryx в различных форматах.
Report Footer
Добавление нижнего колонтитула к отчёту для вывода через Render.
Применение нижнего колонтитула к отчёту.
Report Header
Добавление верхнего колонтитула к отчёту для вывода через Render.
Применение верхнего колонтитула к отчёту.
Table
Создание таблицы данных для вывода через инструмент Render.
Создание таблицы для выбранных полей данных.
Report Text
Добавление и настройка текста для вывода через инструмент Render.
Настройка заголовка или других текстовых элементов отчёта.
📝

Документация

3 инструмента
Comment
Добавление аннотаций или изображений на холст модуля для заметок или описания процессов.
Документирование части анализа для понимания другими пользователями.
Explorer Box
Добавление веб-страницы или окна Windows Explorer на холст.
Отображение веб-страницы для справки в модуле или общей директории макросов.
Tool Container
Организация инструментов в единый блок, который можно свернуть или отключить.
Организация и группировка частей workflow по логическим этапам.
🗺️

Пространственные инструменты

13 инструментов
Buffer
Расширение или сужение границ пространственного объекта (обычно полигона).
Определение всех предприятий на дороге с помощью буфера вокруг неё.
Create Points
Создание пространственных точек в потоке данных на основе числовых полей координат.
Нахождение пространственного объекта по долготе и широте.
Distance
Вычисление расстояния или времени поездки между точкой и другой точкой, линией или полигоном.
Расстояние или время поездки до местоположения клиента.
Find Nearest
Определение ближайших точек или полигонов в одном файле к точкам в другом файле.
Найти ближайший к клиенту магазин с оптимизацией маршрута.
Generalize
Упрощение полигона или ломаной линии путём уменьшения количества узлов.
Генерация выходной карты береговой линии без лишней детализации.
Heat Map
Генерация полигонов, представляющих уровни «теплоты» (например, спроса) в заданной области.
Визуализация плотности домохозяйств в определённом месте.
Make Grid
Создание сетки внутри пространственных объектов в потоке данных.
Разбиение территории на ячейки для анализа источников клиентов.
Non Overlap Drivetime
Создание торговых зон в виде полигонов времени поездки, которые не перекрываются.
Создание непересекающихся торговых зон для точек продаж.
Poly-Build
Создание полигона или ломаной линии из набора точек.
Построение торговой зоны — полигона вокруг всех клиентов.
Poly-Split
Разбивка полигона или ломаной линии на составляющие полигоны, линии или точки.
Разбивка полигона на последовательный набор точек.
Spatial Info
Извлечение информации о пространственном объекте: площадь, центроид, ограничивающий прямоугольник.
Получение широты/долготы точки или площади зоны покрытия.
Spatial Match
Объединение двух потоков данных на основе взаимосвязи двух наборов пространственных объектов.
Нахождение всех клиентов в пределах торговой зоны по географической близости.
Trade Area
Определение радиусов (включая непересекающиеся) или полигонов времени поездки вокруг заданных точек.
Определение границ притока клиентов и потенциальных покупателей.
🤖

Предиктивные инструменты

Ключевые инструменты
Linear Regression
Связывает целевую переменную с одной или несколькими переменными-предикторами (метод наименьших квадратов).
Количество посещений магазина в зависимости от уровня дохода клиента.
Logistic Regression
Связывает бинарную (да/нет) целевую переменную с предикторами.
Вероятность пожертвования от выпускника университета в зависимости от специальности и года выпуска.
Decision Tree
Предсказание целевой переменной с помощью набора правил if-then. Классификационное или регрессионное дерево.
Оценка заявок на кредит: выявление клиентов с очень низким риском дефолта.
Forest Model
Предсказание целевой переменной путём построения и объединения набора деревьев решений (ансамбль).
Голосование ансамбля моделей — наиболее популярный предсказанный результат побеждает.
Boosted Model
Градиентный бустинг (метод Фридмана) — последовательное добавление простых деревьев решений к ансамблю.
Определение важнейших переменных, связанных с оттоком клиентов.
Score
Вычисление предсказанного значения целевой переменной — добавляет поле Score к каждой записи.
Применение обученной модели к новым данным для скоринга клиентов.
Lift Chart
Сравнение различных моделей с «случайным угадыванием» — диаграммы прироста и инкрементального отклика.
Топ-10% клиентов по модели = 40% всех положительных откликов на маркетинговую кампанию.
K-Centroids Analysis
Разбивка записей на K групп вокруг центроидов: K-Means, K-Medians или Neural Gas.
Создание сегментов клиентов на основе поведения покупок для специализированных маркетинговых программ.
Neural Network
Многослойный перцептрон с одним скрытым слоем. Поддерживает бинарную/мультиклассовую классификацию и регрессию.
Оценка финансового риска или обнаружение мошеннических транзакций в страховой БД.
TS ARIMA
Оценка модели прогнозирования временных рядов методом ARIMA (авторегрессионное интегрированное скользящее среднее).
Автоматическое нахождение лучшей ARIMA-модели для прогнозирования ежемесячных продаж продукта.
TS ETS
Оценка модели прогнозирования временных рядов методом экспоненциального сглаживания.
Понимание влияния экономических условий, демографии и маркетинговых активностей на бизнес.
TS Forecast
Предоставление прогнозов из ARIMA или ETS модели на указанное число будущих периодов.
Управление запасами: прогноз уровня запасов на следующие 3 месяца.
Market Basket Rules
Создание правил ассоциаций или частых наборов элементов из транзакционных данных.
Кто покупает пиво, скорее всего купит и пиццу. Кто берёт рыбу — тот берёт белое вино.