Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Должен ли новичок в машинном обучении сразу переходить к глубокому обучению?

ТехнологииМашинное обучение+3
Алена Каменецких
  ·   · 10,6 K
Экс-преподаватель msu.ai, специалист образовательн...  · 7 дек 2021
Я лично не рекомендовал бы новичкам сразу переходить к глубокому обучению.
Для затравки, приведу простую и понятную очень многим аналогию извне мира науки о данных. Какой из этих языков программирования Вы бы порекомендовали изучать раньше другого: C++ или Python? Полагаю, большая часть из Вас склонится к первому варианту - хоть Python и проще в освоении, однако C++ требует большей аккуратности в обращении с памятью, да и в целом преисполнен тонкостей. Если человек освоит Python до C++, ему будет очень сложно освоить сложные концепции, отсутствовавшие в Python - указатели, к примеру. В обратную же сторону: человек с трудом освоит C++ и различные его тонкости, однако потом ему будет очень легко выучить Python - достаточно просто "забыть" о некоторых сложных механизмах.
По аналогии, методы глубокого обучения отличаются от методов классического машинного обучения тем, что последние требуют куда более аккуратной работы с данными. Предобработка данных является очень важным элементом работы с классическими методами машинного обучения, включает она большое количество задач: обработку отсутствующих значений, разведывательный анализ данных, генерацию новых признаков (нередко - с использованием знаний предметной области), отбор признаков, нормализацию и так далее...
При использовании методов глубокого обучения, нередко вся предобработка сводится к обработке отсутствующих значений и нормализации данных: нейронные сети сами по себе являются прекрасными генераторами признаков, способными самостоятельно находить важные закономерности, отбрасывать малозначимые признаки, учитывать важные... И делается это всё автоматически, без серьёзного вмешательства программиста. Нередко, при преподавании глубокого обучения практически полностью опускается тема предобработки данных - казалось бы, зачем на неё тратить время, если практически любая обучающая задача прекрасно решается и без сложной предобработки данных - всё равно преподаватель не может показать необходимость изощрённой предобработки.
В результате, люди, не столкнувшиеся в процессе обучения с необходимостью в сложной предобработке данных, даже не задумываются о её применении в задачах из реальной жизни, что негативно сказывается на качестве создаваемых ими моделей. Отдельно отмечу, что навыки работы с данными позволяют специалистам в общем случае более точно оценивать реальность и сложность выполнения той или иной задачи, что позволяет не просто выполнять "спущенные сверху" задачи, но и "на месте" предлагать интересные и перспективные применения науки о данных.
Резюмируя, рекомендую новичкам начинать путь с классических методов машинного обучения, и лишь после их изучения переходить к глубокому обучению. К тому же, многие идеи из глубого обучения (Dropout, к примеру) гораздо проще понять, имея представления о классических методах.
2 эксперта согласны
Да, нужно сначала научиться понимать более простые алгоритмы. Без понимания задачи с помощью глубокого обучения... Читать дальше
Мне 81 год. Я кхн., автор монографий. https://www...  · 7 дек 2021
Я хочу ответить на вопрос о личном достижении. Оно состоит в том, что я написал математический аппарат, описывающий перемещения частиц по анизотропной поверхности. Применил это к описанию хемосорбции. Это позволило... Читать далее
1 эксперт согласен
По образованию физик, работаю программистом  · 7 дек 2021
Глубокое обучение принципиально не отличатся от обычного, просто для глубокого обучения нужно гораздо больше времени и ресурсов. В зависимости от целей, обучающийся может как начинать с простых моделей, так и сразу изучать... Читать далее