Проблема в том, что никто не знает, что такое Data Science. Это такой зонтичный термин, который в устах говорящего приобретает собственный смысл. Входит ли, например, Data Engineering в Data Science или стоит рядом? Ответ зависит от говорящего.
----------------------------------------------------------------------------------------------
Разделим вопрос на два подвопроса. Первый: правда ли, что сама область знаний Data Science настолько огромна, что может и жизни не хватить, чтобы все узнать? Второй: правда ли, что чтобы начать работать в DS нужно всё это знать?
---------------------------------------------------------------------------------------------
Итак, первый вопрос и короткий ответ на него:
Конечно, да.
Data Science - это феномен схождения до этого совершенно разных дисциплин, которые существовали отдельно в отдельных вселенных, в единую технологическую базу.
Такая вещь как инженерия машинного обучения являющаяся собственным подмножеством Data Science сегодня включают компетенции, которые сочетают в себе несколько стереотипных областей знаний на хорошем уровне: статистики, информатики и программной инженерии. Но сама ML-engineering включает в себя как минимум три общепризнанные ветви, которые в действительности являются самостоятельными научными ветвями (принципиально не являются исчерпаемыми на данный момент и обладают вопросами, не имеющими пока, а может быть и принципиально ответами): обработку естественного языка, временные ряды и компьютерное зрение.
Я тут даже не говорю, что, скажем, есть отдельные задачи теории массового обслуживания, задачи цепей управления поставками, и т.д., которые образуют совершенно отдельные математические дисциплины или информационного поиска в которых можно быть узким специалистом. Или, скажем, одна только задача составления расписаний (ОДНА ЗАДАЧА) является в общей постановке NP-полной.
Каждая из названных подветок - это целая отдельная наука, которая в принципе может в одиночку быть прдеметом изучения всей жизни, причем не одной. Это примерно как желание "знать всю математику" - заранее невыполнимая вещь. Считается невозможным знать "математику" целиком в данный момент на одинаково хорошем уровне во всех дициплинах.
------------------------------------------------------------------------------------------
Второй вопрос:
Очевидно, что если на первый вопрос ответ положительный, то положительным ответ на второй вопрос быть не может, а то не существовало бы специалистов в Data Science.
Не смотря на все сказанное выше, есть определенный "starter pack", который может начать позволить зарабатывать деньги на Data Science, который объективно можно с уровня первокурсника математического направления (человека, который просто хорошо знает школьную программу по математике и как-то хлипенько умеет программировать) получить за 2-3 года.