Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Какая метрика линейной регрессии является наиболее информативной?

Data scienceСтатистика+2
alex-devgru
  ·   · 4,2 K
Увлекаюсь физикой, астрономией и финансами.  · 13 июл 2022  · forecast.nanoquant.ru
Если вы уверены, что в ваших данных нет очень больших выбросов (качественные данные, например, собранные исправными датчиками), то самой информативной является RMSE (или MSE, если не важна физическая размерность прогнозируемой величины).
Если вы ничего не знаете о ваших данных или уверены, что в них есть выбросы (некачественные данные, например, которые вводились людьми с клавиатуры), то лучше использовать MAE.
Что касается относительных метрик, которые что-то показывают в процентах или относительных единицах, то они бывают очень коварными.
Особенно коварен коэффициент детерминации R2. Рекомендую только проверять знак R2. Сравнивать разные модели по R2 можно только на одном и том же наборе данных. Добавление новых данных или удаление части данных обрушивает всякое такое сравнение разных моделей по R2.
Например, модель с R2=0.1 может прогнозировать гораздо лучше, чем модель с R2=0.9, если первая модель прогнозирует на данных с почти горизонтальным трендом, а вторая модель прогнозирует на данных с почти вертикальным трендом.
Эксперт по оптимизации инвестиционного портфеля и прогнозированию биржевых цен.Перейти на forecast.nanoquant.ru
3 эксперта согласны
Логично - MSE наказывает большие ошибки.MAE в меньшей степени. Отрицательный R² означает, что ваши дела хуже, чем... Читать дальше
Руководитель направления моделирования банка.   · 27 окт 2021
Если вы имеете в виду ошибку, то все зависит от задачи. В каких то задачах можно использовать mse, в каких-то mae, особо извращённые msle. Я же предпочитаю MAPE - mean absolute percentage error. Она более универсальная, но... Читать далее