Есть три больших подраздела в DS - это Data-инженеры, ML-инженеры и MLDevOps.
Задача первого - организовать сбор, хранение и безопасность данных.
Задача второго - создать хорошие предсказательные модели, основываясь на данных
Задача третьего - организовать интеграцию разработок первых двух и некоторое взаимодействие с заказчиком, включая поставку продукта.
Если хотя бы две из этих задач посильны специалисту - он обычно начинается называть себя DataScientist-ом, хотя по-хорошему надо иметь все три компетенции.
-------------------------------------------------------------------------------
Датасаентист — это специалист, который строит на основе различных данных модели, помогающие принимать решения в науке, бизнесе и повседневной жизни. Сфер применения миллион: от выявления элементарных частиц в экспериментах на БАК, анализа метеорологических факторов, анализа данных о перемещениях автотранспорта до исследования финансовых операций, поисковых запросов, поведения пользователей в Интернете.
Этапы работы датасаентистов отлично отражены на картинке:
Результат труда датасаентиста — модель, код, написанный на основе анализа. В этом главное отличие между датасаентистом и аналитиком данных. Первый это инженер, который решает задачу бизнеса как техническую. Второй — бизнес-аналитик, больше погруженный в бизнес-составляющую задачи, он изучает потребности, анализирует данные, тестирует гипотезы и визуализирует результат.
Больше про специалиста в области Data Science рассказали мои коллеги из Яндекс.Практикума в своей статье для Академии Яндекса.
Профильных учебных заведений в России по данному направлению пока, к сожалению, нет. Для того, чтобы стать экспертом аналитических данных нужно обладать знаниями в области IT технологий и программирования, статистики и аналитики, математики. Лучше всего подойдет хороший технический ВУЗ с направлениями подготовки программистов.
Привет) Стать специалистом по Data Scientist помогают курсы по программированию. Если полностью с нуля обучаться, то отлично подойдёт курс в "Яндекс.Практикум". Скилбокс или Гикбрейнс примерно за ту же стоимость не предлагают обучения для новичков и на старте будет мега-сложно. Ещё одним преимуществом является "песочница", где можно обучаться и получать дополнительные скиллы по теме. В "Яндекс.Практикум" идёт бесплатная подготовка. Она там рассчитана примерно на 20 часов, но по факту займёт около 100 часов+конспекты и шпаргалки по вводным частям с объяснениями можно будет распечатать потом.
Но кроме курсов следует самостоятельно изучать тему DS и машинного обучения в целом. Возьми на вооружение IT-блоги в Ютубе и просматривай уроки. В рамках обучения изучишь Python и библиотеки, начиная от Pandas и Numpy и заканчивая теми что дял машинного обучения и компьютерного зрения.
За этим будущее, поэтому всё же советую попробовать, а отсталые дисциплины вроде информатики в ВУЗе или школе с Паскалем пора забыть
Направление очень перспективное! Хотелось бы получить больше знаний, хотя бы азы. Вот только меня лично пугает тот факт, что программирование будет сложно освоить. В те годы когда я училась в школе информатики не было совсем, в институте дисциплина "Информатика" была чисто номинальной. 99% группы вообще не понимали о чём это и зачем. Да, честно говоря, и преподавтелей хороших не было. Что касается прогнозов, то куда ж без них? Да и логистики хватает. Я учитель, который составляет расписание уроков, сопоставляю все данные и выстраиваю. Это примерно как высчитывать в столбик математические задания, причём под рукой калькулятор, но... ты тупо не умеешь им пользоваться:((((