Узел Адаптивный бустинг
Адаптивный бустинг (от англ. Adaptive Boosting, AdaBoost) – алгоритм машинного обучения, который позволяет исправлять ошибки предыдущих классификаторов. Каждый классификатор обучается на тренировочной выборке данных для прогнозирования классов объектов. Выявленные ошибки классификации передаются в следующий классификатор по цепочке до тех пор, пока не будет получена оптимальная модель.
Общий объем данных рассчитывается как произведение трех переменных: число строк, число столбцов и sizeof(double). Максимальный объем данных для обработки одним компьютером ограничивается 1 ГБ. Если объем данных превышает 1 ГБ, отметьте галочкой опцию Использовать выборку, если объем данных слишком велик для одного компьютера в окне настройки свойств узла для обработки строк, общий объем которых не превышает 1 ГБ. Переключение в данный режим не влияет на производительность итоговой модели.
Если исходный объем данных превышает 1 ГБ, соответствующие данные разбиваются по значениям одной из колонок и распределяются между несколькими компьютерами. Соответствующая колонка определяется посредством параллельного поиска. Фактически подобное разбиение аналогично начальному этапу построения дерева решений. Объем данных в ветвях дерева не превышает 1 ГБ, при этом каждая ветка обрабатываются отдельно для достижения стандартного бустинга. Таким образом, бустинг основывается на ветвях, образованных в результате первоначального разбиения.
Соединения на скрипте
Узлу Адаптивный бустинг необходимо одно входящее соединение с узлом, который производит таблицу данных, например узел-источник данных, узел операций со строками, колонками или таблицами.
Узел Адаптивный бустинг создает модель классификации. Полученные результаты могут быть переданы в узел Применение моделей для дальнейшего применения полученной модели.
Математические обоснование алгоритма, используемого узлом Адаптивный бустинг, представлено в специальном разделе.