Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Для чего нужно масштабировать признаки перед подачей в модель машинного обучения?

ПрограммированиеМатематика+2
Сослан Табуев
  ·   · 959
Junior in Data Science  · 31 июл 2021

Есть такой вариант объяснения простыми словами.

Например, мы имеем дело с линейной регрессией. Нам нужно минимизировать функцию потерь методом градиентного спуска.

В случае разных масштабов признаков (например, год рождения и количество детей) её линии уровня будут иметь вид вытянутых эллипсов. Тогда вектор антиградиента и направление от текущей точки к минимуму функции потерь могут не совпадать, мы можем уйти далеко и не в ту сторону, и, в зависимости от шага градиентного спуска, либо придётся сделать больше итераций, либо вообще не будет сходимости.

Если же признаки отмасштабированы, то линии уровня похожи на окружности. И проблема несовпадения антиградиента и направления к минимуму не так выражена.

1 эксперт согласен
Увлекаюсь естественными науками и математикой...  · 31 июл 2021
Это требуется для корректного использования метрических алгоритмов классификации и регрессивного анализа. Кроме того, когда данные представляют собой нормализованный массив, их проще сравнивать визуально, проще отслеживать закон... Читать далее