Если один столбец в датасете содержит более 80% NaN значений, как вы их заполните, или вообще избавитесь от этого признака?

Question

Стас Торгашов · Accepted Answer

В наших задачах приходилось или а) отбраковывать весь датасет и собирать/запрашивать новый, или б) отбрасывать столбец и строить в итоге модель без этого параметра (применимо для некоторых задач: в...

Павел · Answer

Добрый день
на самом деле все зависит от контекста.
К примеру вы прогнозируете вероятность покупки какого-то продукта клиентом по историческим действиям клиента. Допустим, покупки телевизора. У вас...

Бюро Важных Дел · Answer

Добрый день. Решение использовать эти данные или нет это магия аналитика. Данное решение зависит от набора данных. Какой тип данных в этом столбце. Какой общий объём. Можно ли найти корреляции межд...

Теперь Кью работает в режиме чтения

Если один столбец в датасете содержит более 80% NaN значений, как вы их заполните, или вообще избавитесь от этого признака?