"Данные - это новая нефть" (Джек Ма, Alibaba). Сложно спорить с этим утверждением, но мы прекрасно знаем, что нефть начала использоваться относительно недавно. Так и данные, они накапливаются человечеством в огромных масштабах, мы придумываем технологии их хранения и доставки, развиваются технологии обработки и извлечения информации. Успеваем ли мы перерабатывать информацию, извлекаемую из данных? Не всегда. Сейчас делаются попытки выстроить новые системы управления данными и информацией, становится популярной связность данных, большое внимание уделяется метаданным.
Что, на ваш взгляд, появилось интересного в управлении данными и информацией за последнее время? На что стоит обратить внимание?
В первую очередь приходит в голову т.н. «искусственный интеллект» — технологии обработки информации на основе машинного обучения. Современные технологии ИИ — это, как правило, автоматические категоризаторы той или иной степени сложности, способные распознать и разложить по полочкам новые данные на основании аналогичных размеченных старых данных. И хотя концепция глубокого обучения не нова (первые многослойные перцептроны появились ещё в 80-х годах), в последнее десятилетие мы наблюдаем взлёт технологий ИИ, связанный с тем, что большее количество данных стало оцифровываться, человечество в целом стало получать и хранить больше информации. Новаторство же идеи заключается в том, что если в классической схеме программист (или аналитик) явно создаёт (или выбирает) алгоритм обработки данных, то в случае с ИИ этот алгоритм строится автоматически на основании машинного анализа заранее размеченных данных. Оказалось, что на больших объёмах данных такой подход может давать неожиданно эффективные результаты.