Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Почему нормализация данных перед KNN не повышает точность?

KNN ведь метрический алгоритм? Если что, датасет вот этот: https://www.kaggle.com/kashnitsky/mlcourse?select=telecom_churn.csv

ОбразованиеМатематика+3
Анонимный вопрос
  ·   · 2,3 K
Data Science. Meditation. Surrealism.  · 26 июл 2021

Мне кажется, вопрос не совсем корректный. kNN - действительно метрический алгоритм, а значит он чувствителен к размерности величин. Когда вы обучаете его на ненормализованных величинах - он, естественно, даёт больший вес большим по амплитуде отклонениям. В итоге, качество предсказаний может как совпасть, так и не совпасть с обученным на ненормализованных данных.
Ваш случай может говорить например о том, что оба классификатора одинаково плохие (вы могли неверно настроить гиперпараметры, взять слишком большую размерность или ещё что угодно).

кандидат физико-математических наук, математик, ис...  · 27 июл 2021  · novikovlabs.ru
Лучший вопрос - а почему kNN вообще должно здесь работать? KNN - какой-то непонятный выбор. Во-первых, потому что нет уверенности, что близость значений длины аккаунта или близость значений кода зоны как-то отражают реальную... Читать далее
Анонимный комментарий
27 июл 2021
Да, я не уточнил. Я предсказываю последний параметр "Churn" и перед этим обрабатываю датасет, оставляя там только... Читать дальше