я попробую написать несколько решений навскидку:
1/ дропнуть те строки, в которых имеется Null / NA / что там у вас.
Хорошее решение, если датасет большой, плохое - если маленький (или дикий дисбаланс классов
2/ Заполнить средним / максимумом / минимумом/ медианой - тут поиграться надо. Может сработать, но обязательно надо смотреть
3/ для категориальных фичей - заполнить наибольшим классом (в классической задаче титаника иногда так делают)
4/ Неплохой вариант - не просто средние, а сначала кластеризовать (напр, k-means), а потом применить уже варианты выше. Работает еще лучше, т.к. заполняете "средним по кластеру".
Good luck