Data Science

60303 участника сообщества

С чего начать изучать Data Science новичку?

Data science

Мария Снегова · 28 сент 2021 · 3,2 K

На Кью задали 3 похожих вопроса

Ответить

Александр Клянчин

Data science

Программирование. Машинное обучение. · 9 окт 2021

Если кратко, то сначала английский, далее https://www.kaggle.com/c/titanic

Изучайте данные, их взаимосвязи. Python поможет.

# get titanic & test csv files as a DataFrame
titanic_df = pd.read_csv("../input/train.csv")
test_df    = pd.read_csv("../input/test.csv")

# preview the data
titanic_df.head()

titanic_df.info()

# drop unnecessary columns, these columns won't be useful in analysis and prediction
titanic_df = titanic_df.drop(['PassengerId','Name','Ticket'], axis=1)
test_df    = test_df.drop(['Name','Ticket'], axis=1)

1 эксперт не согласен

2 оценили · 311

Владимир Афанасьев

возражает

10 окт 2021

Это просто реклама! Спрашивают, что изучать, а не как.

Комментировать ответ…Комментировать…

Павел

Data science

Руководитель направления моделирования банка. · 1 нояб 2021

Добрый день Начните с того, что задайте себе вопрос, для чего вам это надо? Если вас привлекают высокие зарплаты в первую очередь, а потом уже все остальное, то есть смысл найти себя в другом. DS - это многогранная специализация... Читать далее

7 оценили · 1,1 K

Комментировать ответ…Комментировать…

Artyom

Data science

Специалист в области управления и информатики в... · 6 окт 2021

С программирования на Python. Если не потяните математику, сможете быть программистом))) Да и навык программирования еще никому не повредил.

4 оценили · 771

Комментировать ответ…Комментировать…

Леонид Никифоров

преподавание математики, высшей математики, data... · 29 сент 2021

Вме5сто того, чтобы посоветовать вам абстрактное чтиво, могу порекомендовать свою книгу, = Математика для DATA SCIENTIST Анализ данных и математическое моделирование (путеводитель) - так вы хоть сможете чего-то спросить. Предста... Читать далее

1 эксперт не согласен

1 оценил · 544

Владимир Афанасьев

возражает

3 окт 2021

Автор вопроса спрашивает о том, с чего начать изучение Data science, а не математики!

Комментировать ответ…Комментировать…

Вы знаете ответ на этот вопрос?

Поделитесь своим опытом и знаниями

Войти и ответить на вопрос

1 ответ скрыт(Почему?)

Ответы на похожие вопросы

С чего начать изучение Data Science? — 9 ответов, задан 14 мар 2016

Сослан Табуев

Data science

Аналитик/разработчик в Яндексе, преподаватель... · 22 июл 2021 · datascience.xyz

Изучение Data Science стоит начать с построения фундамента, а в фундаменте чего только нет, математика, статистика, алгоритмы, языки программирования. Собрал список курсов которые помогут заложить качественный фундамент под изучение DS.

https://yandex.ru/q/article/n_078769a5/

6 оценили · 718

Комментировать ответ…Комментировать…

С чего начать изучение Data Science? — 1 ответ, задан 16 янв 2022

Artyom

Data science

Специалист в области управления и информатики в... · 26 янв 2022

Начните с программирования на Python. Далее математика.

1 оценил · 160

Комментировать ответ…Комментировать…

С чего начать изучение Data Science? — 9 ответов, задан 14 мар 2016

Игорь Маленький Ph.D.

Data science

преподаватель, аналитик данных · 17 сент 2021 · youtube.com/channel/UCqj7Cz7revf5maW9g5pgNcg

Я бы начал с курса, где анализ данных разбирается на визуальном языке программирования - где код рисуют, а не пишут. На таких курсах порог вхождения минимальный - с первого урока.

Сделал бы такой курс посмотрел бы и решил как продолжать дальше, и стоит ли продолжать дальше.

Если речь о материале на русском языке.

То первые шаги могут быть такие

1) курс "Анализ данных просто" на степике - бесплатно

2) учебник "Анализ данных" от профессора Стивена Скиена есть на русском и английском.

Nullius in verba

Перейти на youtube.com/playlist

Нет оценок · 409

Комментировать ответ…Комментировать…

С чего начать изучение Data Science? — 3 ответа, задан 16 янв 2022

Yriy

Data science

IT-Architect( + CTO, FullStack ), свои проекты... · 17 февр 2022

Если вкратце, то в этом направлении(в моём случае больше в сторону ML и плюс у меня уже был опыт программирования ботов в NLP) я начинал примерно так:

Линейная регрессия -https://ru.wikipedia.org/wiki/Линейная_регрессия
Python(лучше последнюю актуальную версию(3+) и особенно детально библиотеки numpy, pandas, sklearn и др.), Jupyter и наборы данных для тренировки, поставить и научится делать notebooks
Алгоритм перцептрона - https://ru.wikipedia.org/wiki/Перцептрон
Деревья решений - https://ru.wikipedia.org/wiki/Дерево_решений
Наивный Байес - https://ru.wikipedia.org/wiki/Наивный_байесовский_классификатор
Метод опорных векторов - https://ru.wikipedia.org/wiki/Метод_опорных_векторов
Ансамбль методов - https://ru.wikipedia.org/wiki/Ансамбль_методов_(обучение_машин)

3 оценили · 1,7 K

Комментировать ответ…Комментировать…

С чего начать изучение Data Science? — 9 ответов, задан 14 мар 2016

Максим Дробышев

Философия

Основатель небольшой компании аналитического прогр... · 14 мар 2016

На сегодня основная проблема Data Science - недостаток людей, которые могут её грамотно применить с прибылью для компании.

Поэтому начинать лучше с эконометрики, статистики, экономики, правовых основ работы с данными, устраиваться на работу в компании, где данные широко используются (поисковые системы, мобильные операторы, страховые компании, банки), и практиковаться, практиковаться... проверяя всё что вам говорят на прецедентах из реальной жизни.

Например, если говорят, что нужна сертификация для работы с персональными данными, нужно поинтересоваться, сертифицируется ли на эту работу соседний ларёк и почему, есть ли по этому вопросу правоприменительная практика.

Постепенно Вы (как я в своё время) поймете, что модные Big Data и Data Science - это фетиш разработчиков и айтишников в новой обертке, а проработку экономики и постановку задачи нужно делать полностью самому (либо с людьми, хорошо разбирающимися в экономике и праве конкретных отраслей и имеющих в них обширную практику). Именно к этому и нужно готовиться.

21 оценил · 4,5 K

Комментировать ответ…Комментировать…

С чего начать изучение Data Science? — 9 ответов, задан 14 мар 2016

Хекслет

Образовательная платформа Хекслет · 2 мар 2023 · ru.hexlet.io

Отвечает

Александр Литвинов

Если вы хотите начать изучение Data Science, рекомендуется следовать следующим шагам:

Основы математики и статистики: Чтобы стать хорошим специалистом по Data Science, необходимо хорошо понимать математические и статистические понятия. Рекомендуется изучить основные понятия линейной алгебры, дифференциального и интегрального исчисления, теории вероятностей и математической статистики.
Изучение программирования: Важно овладеть как минимум одним языком программирования, используемым в Data Science. Рекомендуется изучить Python, который является наиболее распространенным языком, используемым в этой области.
Работа с инструментарием: Изучите инструменты и библиотеки, используемые в Data Science, такие, как: NumPy, Pandas, Scikit-learn, Matplotlib и другие. Чтобы принимать бизнес решения удобно представлять данные в виде диаграмм и детальных отчетов, с которыми как раз помогают перечисленные выше инструменты.
Знакомство с ML: узнать про модели, датасеты, создание машин, которые могут обучаться и предсказывать или классифицировать значения по признакам. Для этого также обычно используют Python и разные библиотеки, например, SKlearn, NumPy и matplotlib
Работа с базами данных: Вам также пригодится знание SQL. Язык запросов используется при выборке и анализе данных. Не лишним будет разобраться в работе одной из популярных СУБД, например, PostgreSQL, чтобы понимать как можно оптимизировать тяжелые запросы.
Практика и проекты: Для лучшего понимания Data Science необходимо постоянно практиковаться и создавать свои проекты. Это поможет закрепить знания и получить опыт работы с реальными данными.
Обучение и сертификация: Можно также пройти онлайн-курсы, почитать учебники и другие ресурсы для изучения Data Science и получения сертификата, который может улучшить ваше резюме и увеличить шансы на получение работы в этой области.

Помогаем новичкам освоить профессию веб-разработчика

Перейти на ru.hexlet.io/webinars

Нет оценок · 2,6 K

Комментировать ответ…Комментировать…

С чего начать изучение Data Science? — 9 ответов, задан 14 мар 2016

Ivan Bushmakov

Data science

Программист. Python-разработчик, занимаюсь... · 22 сент 2021 · unitbushmakov.ru

Для начала нужно постигнуть азы математики( математическая статистика и теория вероятности) , аналитике и программирования. Так же можно походить на курсы и почитать книги для углубления знаний в этой области. Ну и далее только практика и работы с данными и dataset.

Нет оценок · 244

Комментировать ответ…Комментировать…

С чего начать изучение Data Science? — 3 ответа, задан 16 янв 2022

Достоверно

Катерина С

ВШЭ, Экономика. Аналитик данных · 11 апр 2022

Техническая база.

Математический анализ, теория вероятностей, статистика, теория алгоритмов и графов.

Возможно, эконометрика. Но тут зависит от курсов. Нам преподавали углубленную эконометрику, которая действительно используется и в работе. Те же регрессии, временные ряды и тп.

4 эксперта согласны

4 оценили · 966

Комментировать ответ…Комментировать…

С чего начать изучение Data Science? — 9 ответов, задан 14 мар 2016

Леонид Делицын

Сотрудник группы компаний ФИНАМ · 17 мар 2016

Я бы посоветовал заглядывать на сайт R-bloggers.com Так можно составить представление о том, чем люди вообще занимаются - и не только в какой-нибудь компании, но и в академической среде, в здравоохранении, в госуправлении и т.п. Многие авторы анонсируют там свои книжки при помощи коротких заметок. Часто предлагается решение какой-нибудь задачи, и сразу публикуется код на R. Разумеется, ограничением является использование именно R, а не, скажем, python. Но R фантастически популярен, за последние годы издано более 400 книжек, посвящённых его применению в разных областях науки и практики. Причём практически всегда к задаче прилагаются и наборы данных, и готовый код, т.е. понять, о чём идёт речь, можно довольно быстро.

3 оценили · 466

Комментировать ответ…Комментировать…

С чего начать изучение Data Science? — 9 ответов, задан 14 мар 2016

123 123

--- · 16 мар 2016

Я писала где-то ответ по тому, как научиться работать с базами данных. Копирую еще сюда:

Есть работа с базами данных, есть визуализация баз данных, есть получение информации из баз данных.

Следовательно, начинаем с изучения SQL, чтобы можно было поковыряться в самой базе. Мне больше всего понравился учебник из серии "для чайников".

Для того, чтобы то, что мы вытащили из базы данных, можно было оформить, изучаем визуализацию. Очень круто и просто все рассказывается в учебнике Robert Spence "Information Visualization".

Теперь можно идти к чему-то более крутому - это data mining. Для этого нужно прокачать знание теории вероятности, статистики и выбрать себе язык программирования, которым вы будете пользоваться при работе с базами данных. Очень важно (!) разобраться в machine learning. Учебников и пособий тут миллиард. Я бы не стала брать что-то серьезное, если у вас нет бэкграунда, а совмещала бы этот этап с предыдущими, чтобы можно было делать крутые штуки уже с самого начала - это очень вдохновляет.

5 оценили · 371

Комментировать ответ…Комментировать…