Подготвыливается выборка в зависимости от вида задачи и пула данных.
Выборка делится на тренировочную и тестовую ( на которой будет проверяться " точность")
Производится обучение "на прецентентах". Применяются различные алгоритмы: градиентный бустинг,логистическая регрессия и так далее.
Кросс- валидация ( или проверка качества модели)