Справочник инструментов Alteryx

Browse

Добавление точек просмотра данных в поток для проверки и верификации данных в любом месте процесса.

Позволяет пользователям просматривать данные на любом этапе обработки.

Filter

Запрос записей по условию с разделением данных на два потока: True (соответствуют условию) и False (не соответствуют).

Оставить только клиентов с более 10 транзакциями или определённым уровнем продаж.

Formula

Создание или обновление полей с помощью одного или нескольких выражений для выполнения широкого спектра вычислений.

Замена NULL-значений нулями. Поддерживает все формулы Excel и многое сверх того.

Input

Загрузка данных в модуль путём выбора файла или подключения к базе данных (опционально с запросом).

Подключение к разнородным наборам данных различных форматов.

Join

Объединение двух входных потоков по общему полю. Функция аналогична SQL JOIN, создаёт 3 выхода: L (только левый), J (совпадения), R (только правый).

Объединение профиля клиента с транзакционными данными по уникальному ID клиента.

Output

Вывод содержимого потока данных в файл или базу данных.

Загрузка обогащённых данных обратно в базу данных.

Sample

Ограничение потока данных до заданного числа, процента или случайного набора записей.

Выбор первых 10 записей для каждого региона — топ-10 магазинов по регионам.

Select

Выбор, отмена выбора, переупорядочивание и переименование полей, изменение типа или размера поля.

Если workflow требует 5 из 50 полей — отмените выбор остальных для ускорения обработки.

Sort

Сортировка записей по значениям одного или нескольких полей.

Ранжирование клиентов по сумме расходов в порядке возрастания/убывания.

Summarize

Агрегация данных путём группировки, суммирования, подсчёта, пространственной обработки, конкатенации строк и многого другого.

Количество клиентов в штате NY и общая сумма их расходов.

Comment

Добавление аннотаций или изображений на холст для заметок или описания процессов.

Документирование определённой части анализа для понимания другими пользователями.

Union

Объединение двух и более потоков данных со схожей структурой по именам или позициям полей.

Объединение данных о продажах за март и апрель в единый поток для дальнейшей обработки.

Date Time Now

Ввод текущей даты и времени в момент запуска модуля в выбранном формате.

Легкое добавление заголовка с датой и временем для отчёта.

Directory

Ввод списка имён файлов и атрибутов из указанной директории.

Список всех файлов в директории — используется совместно с Dynamic Input для загрузки актуального файла данных.

Dynamic Input In-DB

Принимает имена подключений In-DB и поля запроса из стандартного потока и вводит их в поток In-DB.

Используется при создании In-DB макроса для предиктивного анализа.

Dynamic Output In-DB

Выводит информацию о In-DB workflow в стандартный workflow для Predictive In-DB.

Вывод информации о In-DB workflow в стандартный workflow для Predictive In-DB.

Map Input

Ручное рисование или выбор пространственных объектов (точки, линии, полигоны) для хранения в модуле.

Выбор пространственного объекта для использования в модуле (приложении).

Text Input

Ручной ввод данных, которые будут храниться в модуле.

Таблица подстановки со значениями для поиска и замены на новые классификации.

XDF Input

Доступ к файлам формата XDF (Revolution R Enterprise's RevoScaleR) для использования в качестве ввода для предиктивных инструментов.

Предиктивная аналитика на больших данных: линейная регрессия, деревья решений, случайный лес.

XDF Output

Запись потока данных Alteryx в файл формата XDF для масштабируемой предиктивной аналитики.

Предиктивная аналитика на больших данных с RevoScaleR.

Auto Field

Автоматическая установка типа поля для каждого строкового поля до минимально возможного размера.

Минимизация данных для ускорения обработки и обеспечения правильных форматов.

Data Cleansing

Автоматическая очистка данных с простой настройкой галочками.

Удаление NULL-значений, лишних пробелов, чисел из строковых полей.

Date Filter

Макрос для фильтрации данных по критерию даты с помощью интерфейса на основе календаря.

Возврат транзакций за указанный период с начальной и конечной датой.

Generate Rows

Создание новых строк данных — полезно для создания последовательностей чисел, транзакций или дат.

Создание временных рядов: 365 уникальных записей для каждого дня года.

Impute Values

Обновление конкретных значений в числовом поле другим выбранным значением — для замены NULL().

Замена NULL-значений зарплаты средним или медианным значением для точности анализа.

Multi-Field Binning

Группировка нескольких числовых полей в плитки или корзины — особенно для предиктивного анализа.

Группировка транзакционных данных в покупательские персоны: мужчины 30–35 лет с расходами >$1К/мес.

Multi-Field Formula

Создание или обновление нескольких полей с помощью одного выражения.

Замена NULL-значений нулями сразу в нескольких полях.

Multi-Row Formula

Создание или обновление поля с помощью выражения, ссылающегося на данные из соседних строк. Полезно для накопительных итогов.

Создание уникальных идентификаторов на уровне группы, сравнение продаж по годам в разных строках.

Random % Sample

Генерация случайного числа или процента записей, проходящих через поток данных.

Анализ на основе случайных 35% данных.

Record ID

Присвоение уникального идентификатора каждой записи.

Присвоение ID клиента для более точного прямого маркетинга в будущем.

Select Records

Выбор конкретных записей и/или диапазонов, включая несмежные диапазоны. Полезно для устранения неполадок и выборки.

Поиск записей со значением менее $100 или в диапазоне $100–$150.

Tile

Группировка данных в наборы (плитки) на основе диапазонов значений поля.

Создание логических групп: высокоценные клиенты vs. низкоценные клиенты.

Unique

Разделение данных на два потока: дублирующиеся и уникальные записи на основе выбранных полей.

Отправка письма только одному человеку на основе уникального идентификатора клиента.

Append Field

Добавление полей из исходного ввода к каждой записи целевого ввода.

Добавление временных меток и имени пользователя ко всем записям базы данных.

Find Replace

Поиск данных в одном поле из одного потока и замена значением из другого потока. Аналог Excel VLOOKUP.

Поиск и замена значений — аналог Excel Find & Replace.

Join Multiple

Объединение двух и более входов по общим полям. В выходных данных каждая строка содержит данные из всех входов.

Объединение профиля клиента, транзакционных данных и справочников по уникальному ID.

Make Group

Принимает связи между данными и собирает данные в группы на основе этих связей.

Используется преимущественно с Fuzzy Matching — ID 1 может совпадать с 10 значениями из источника 2, формируя группу.

Fuzzy Match

Выявление неидентичных дубликатов в потоке данных.

Сопоставление двух наборов данных с разными ID на основе имён и адресов.

Union

Объединение двух и более потоков данных со схожей структурой по именам или позициям полей.

Объединение данных о продажах за разные периоды в единый файл для анализа.

Date Time

Преобразование данных дата/время в различные форматы, включая форматы для выражений и для чтения человеком.

Конвертация военного времени в стандартное. Преобразование «Jan 1, 2012» в «1.1.12».

RegEx

Парсинг, сопоставление или замена данных с использованием синтаксиса регулярных выражений.

Парсинг неструктурированных текстовых файлов — веблогов или данных из Twitter.

Text to Columns

Разбивка текста из одного поля на отдельные строки или столбцы.

Разделение поля «Имя и фамилия» на два отдельных поля для удобства сортировки.

XML Parse

Чтение XML-фрагментов и их парсинг в отдельные поля.

Очистка XML-файла, парсинг XML-текста в структурированные данные.

Arrange

Ручная транспозиция и перестановка полей в презентационных целях.

Подготовка данных для отчётов с нужной компоновкой.

Count Records

Подсчёт записей, проходящих через поток данных. Возвращает 0, если записей нет.

Возвращает количество записей, проходящих через инструмент.

Cross Tab

Поворот ориентации потока данных: вертикальные поля переводятся на горизонтальную ось с агрегацией.

Преобразование столбца ID клиентов и столбца выручки: два столбца → две строки.

Running Total

Вычисление накопительной суммы для каждой записи в потоке данных.

Суммирование продаж за 3 года: год1 $10К, год2 $15К, год3 $25К → накопительные итоги.

Summarize

Агрегация: группировка, суммирование, подсчёт, пространственная обработка, конкатенация строк.

Группировка клиентов по возрасту или уровню дохода, подсчёт клиентов в штате NY.

Transpose

Поворот ориентации потока данных: горизонтальные поля переводятся на вертикальную ось.

Преобразование строки ID клиентов и строки выручки: две строки → два столбца.

Weighted Average

Вычисление взвешенного среднего набора значений, где одни записи вносят больший вклад, чем другие.

Расчёт средних расходов с учётом веса отдельных клиентов в формировании среднего.

Charting

Создание диаграмм (площадь, столбцы, линии, круговые и т.д.) для вывода через инструмент Render.

Создание столбчатых, линейных, круговых диаграмм.

Отправка писем для каждой записи с вложениями или автоматически сгенерированными отчётами.

Создание динамически обновляемого содержимого писем.

Image

Добавление изображения для вывода через инструмент Render.

Добавление графики/изображения в отчёт.

Layout

Расположение двух и более отчётных сниппетов горизонтально или вертикально для вывода через Render.

Организация компонентов отчёта в нужном порядке.

Report Map

Создание карты для вывода через инструмент Render.

Создание карты для включения в отчёт.

Map Legend Builder

Повторная сборка компонентов легенды карты в единую таблицу легенды после настройки.

Принимает настроенную легенду и повторно её собирает.

Map Legend Splitter

Разбивка легенды из Report Map на составные части для настройки другими инструментами.

Настройка легенды: добавление символов $ или %, удаление избыточного текста.

Overlay

Расположение отчётных сниппетов поверх друг друга для вывода через Render.

Наложение таблицы и диаграммы на карту.

Render

Вывод отчётных сниппетов в готовые отчёты: PDF, HTML, XLSX, DOCX, PPTX, RTF.

Сохранение отчётов из Alteryx в различных форматах.

Report Footer

Добавление нижнего колонтитула к отчёту для вывода через Render.

Применение нижнего колонтитула к отчёту.

Report Header

Добавление верхнего колонтитула к отчёту для вывода через Render.

Применение верхнего колонтитула к отчёту.

Table

Создание таблицы данных для вывода через инструмент Render.

Создание таблицы для выбранных полей данных.

Report Text

Добавление и настройка текста для вывода через инструмент Render.

Настройка заголовка или других текстовых элементов отчёта.

Comment

Добавление аннотаций или изображений на холст модуля для заметок или описания процессов.

Документирование части анализа для понимания другими пользователями.

Explorer Box

Добавление веб-страницы или окна Windows Explorer на холст.

Отображение веб-страницы для справки в модуле или общей директории макросов.

Tool Container

Организация инструментов в единый блок, который можно свернуть или отключить.

Организация и группировка частей workflow по логическим этапам.

Buffer

Расширение или сужение границ пространственного объекта (обычно полигона).

Определение всех предприятий на дороге с помощью буфера вокруг неё.

Create Points

Создание пространственных точек в потоке данных на основе числовых полей координат.

Нахождение пространственного объекта по долготе и широте.

Distance

Вычисление расстояния или времени поездки между точкой и другой точкой, линией или полигоном.

Расстояние или время поездки до местоположения клиента.

Find Nearest

Определение ближайших точек или полигонов в одном файле к точкам в другом файле.

Найти ближайший к клиенту магазин с оптимизацией маршрута.

Generalize

Упрощение полигона или ломаной линии путём уменьшения количества узлов.

Генерация выходной карты береговой линии без лишней детализации.

Heat Map

Генерация полигонов, представляющих уровни «теплоты» (например, спроса) в заданной области.

Визуализация плотности домохозяйств в определённом месте.

Make Grid

Создание сетки внутри пространственных объектов в потоке данных.

Разбиение территории на ячейки для анализа источников клиентов.

Non Overlap Drivetime

Создание торговых зон в виде полигонов времени поездки, которые не перекрываются.

Создание непересекающихся торговых зон для точек продаж.

Poly-Build

Создание полигона или ломаной линии из набора точек.

Построение торговой зоны — полигона вокруг всех клиентов.

Poly-Split

Разбивка полигона или ломаной линии на составляющие полигоны, линии или точки.

Разбивка полигона на последовательный набор точек.

Spatial Info

Извлечение информации о пространственном объекте: площадь, центроид, ограничивающий прямоугольник.

Получение широты/долготы точки или площади зоны покрытия.

Spatial Match

Объединение двух потоков данных на основе взаимосвязи двух наборов пространственных объектов.

Нахождение всех клиентов в пределах торговой зоны по географической близости.

Trade Area

Определение радиусов (включая непересекающиеся) или полигонов времени поездки вокруг заданных точек.

Определение границ притока клиентов и потенциальных покупателей.

Linear Regression

Связывает целевую переменную с одной или несколькими переменными-предикторами (метод наименьших квадратов).

Количество посещений магазина в зависимости от уровня дохода клиента.

Logistic Regression

Связывает бинарную (да/нет) целевую переменную с предикторами.

Вероятность пожертвования от выпускника университета в зависимости от специальности и года выпуска.

Decision Tree

Предсказание целевой переменной с помощью набора правил if-then. Классификационное или регрессионное дерево.

Оценка заявок на кредит: выявление клиентов с очень низким риском дефолта.

Forest Model

Предсказание целевой переменной путём построения и объединения набора деревьев решений (ансамбль).

Голосование ансамбля моделей — наиболее популярный предсказанный результат побеждает.

Boosted Model

Градиентный бустинг (метод Фридмана) — последовательное добавление простых деревьев решений к ансамблю.

Определение важнейших переменных, связанных с оттоком клиентов.

Score

Вычисление предсказанного значения целевой переменной — добавляет поле Score к каждой записи.

Применение обученной модели к новым данным для скоринга клиентов.

Lift Chart

Сравнение различных моделей с «случайным угадыванием» — диаграммы прироста и инкрементального отклика.

Топ-10% клиентов по модели = 40% всех положительных откликов на маркетинговую кампанию.

K-Centroids Analysis

Разбивка записей на K групп вокруг центроидов: K-Means, K-Medians или Neural Gas.

Создание сегментов клиентов на основе поведения покупок для специализированных маркетинговых программ.

Neural Network

Многослойный перцептрон с одним скрытым слоем. Поддерживает бинарную/мультиклассовую классификацию и регрессию.

Оценка финансового риска или обнаружение мошеннических транзакций в страховой БД.

TS ARIMA

Оценка модели прогнозирования временных рядов методом ARIMA (авторегрессионное интегрированное скользящее среднее).

Автоматическое нахождение лучшей ARIMA-модели для прогнозирования ежемесячных продаж продукта.

TS ETS

Оценка модели прогнозирования временных рядов методом экспоненциального сглаживания.

Понимание влияния экономических условий, демографии и маркетинговых активностей на бизнес.

TS Forecast

Предоставление прогнозов из ARIMA или ETS модели на указанное число будущих периодов.

Управление запасами: прогноз уровня запасов на следующие 3 месяца.

Market Basket Rules

Создание правил ассоциаций или частых наборов элементов из транзакционных данных.

Кто покупает пиво, скорее всего купит и пиццу. Кто берёт рыбу — тот берёт белое вино.

Справочник инструментов Alteryx

Избранные инструменты

Ввод / Вывод

Подготовка данных

Объединение данных

Парсинг

Трансформация

Отчётность

Документация

Пространственные инструменты

Предиктивные инструменты