Дата-сайенс — работа с большими неструктурированными данными. Data science используют для решения задач, которые требуют сбора и анализа большого массива данных. Обработка такого объема информации непосильна для человека в силу своей трудоемкости. Поэтому для этих целей разрабатывают алгоритм, а затем обучают ему машину (программу). Однако создание программы было бы невозможно без предварительной работы человека, который собирает базу данных, находит в них закономерности, создает прогнозную модель и закладывает ее в программу.
Чтобы работать с данными и кодом, специалистам необходимо владеть навыками из смежных дисциплин:
- математики;
- статистики;
- программирования;
- бизнес-аналитики;
- стратегического планирования.
Например, для создания лекарства в программу загружают алгоритм, который автоматически сможет быстро проверить тысячи различных химических соединений и выявить наиболее эффективные сочетания для лечения болезни. Программа составляет прогноз о том, окажут ли лекарства положительный эффект на здоровье человека или нет.