Должен ли новичок в машинном обучении сразу переходить к глубокому обучению?

ТехнологииМашинное обучение+3

Алена Каменецких · 7 дек 2021 · 10,6 K

Экс-преподаватель msu.ai, специалист образовательн... · 7 дек 2021

Я лично не рекомендовал бы новичкам сразу переходить к глубокому обучению.

Для затравки, приведу простую и понятную очень многим аналогию извне мира науки о данных. Какой из этих языков программирования Вы бы порекомендовали изучать раньше другого: C++ или Python? Полагаю, большая часть из Вас склонится к первому варианту - хоть Python и проще в освоении, однако C++ требует большей аккуратности в обращении с памятью, да и в целом преисполнен тонкостей. Если человек освоит Python до C++, ему будет очень сложно освоить сложные концепции, отсутствовавшие в Python - указатели, к примеру. В обратную же сторону: человек с трудом освоит C++ и различные его тонкости, однако потом ему будет очень легко выучить Python - достаточно просто "забыть" о некоторых сложных механизмах.

По аналогии, методы глубокого обучения отличаются от методов классического машинного обучения тем, что последние требуют куда более аккуратной работы с данными. Предобработка данных является очень важным элементом работы с классическими методами машинного обучения, включает она большое количество задач: обработку отсутствующих значений, разведывательный анализ данных, генерацию новых признаков (нередко - с использованием знаний предметной области), отбор признаков, нормализацию и так далее...

При использовании методов глубокого обучения, нередко вся предобработка сводится к обработке отсутствующих значений и нормализации данных: нейронные сети сами по себе являются прекрасными генераторами признаков, способными самостоятельно находить важные закономерности, отбрасывать малозначимые признаки, учитывать важные... И делается это всё автоматически, без серьёзного вмешательства программиста. Нередко, при преподавании глубокого обучения практически полностью опускается тема предобработки данных - казалось бы, зачем на неё тратить время, если практически любая обучающая задача прекрасно решается и без сложной предобработки данных - всё равно преподаватель не может показать необходимость изощрённой предобработки.

В результате, люди, не столкнувшиеся в процессе обучения с необходимостью в сложной предобработке данных, даже не задумываются о её применении в задачах из реальной жизни, что негативно сказывается на качестве создаваемых ими моделей. Отдельно отмечу, что навыки работы с данными позволяют специалистам в общем случае более точно оценивать реальность и сложность выполнения той или иной задачи, что позволяет не просто выполнять "спущенные сверху" задачи, но и "на месте" предлагать интересные и перспективные применения науки о данных.

Резюмируя, рекомендую новичкам начинать путь с классических методов машинного обучения, и лишь после их изучения переходить к глубокому обучению. К тому же, многие идеи из глубого обучения (Dropout, к примеру) гораздо проще понять, имея представления о классических методах.

2 эксперта согласны

Эмиль Пилецкий

подтверждает

12 дек 2021

Да, нужно сначала научиться понимать более простые алгоритмы. Без понимания задачи с помощью глубокого обучения... Читать дальше

василий Садовников

Мне 81 год. Я кхн., автор монографий. https://www... · 7 дек 2021

Я хочу ответить на вопрос о личном достижении. Оно состоит в том, что я написал математический аппарат, описывающий перемещения частиц по анизотропной поверхности. Применил это к описанию хемосорбции. Это позволило... Читать далее

1 эксперт согласен

Дмитрий Кравченко

По образованию физик, работаю программистом · 7 дек 2021

Глубокое обучение принципиально не отличатся от обычного, просто для глубокого обучения нужно гораздо больше времени и ресурсов. В зависимости от целей, обучающийся может как начинать с простых моделей, так и сразу изучать... Читать далее