Официальный аккаунт компании LabelMe.
Мы... · 5 апр 2022
Dataset – это обработанная и структурированная информация в табличном виде. Строки такой таблицы называются объектами, а столбцы – признаками. В совокупности это и есть размеченные данные, на основе которых происходит машинное обучение.
Данные могут быть самыми разными. Например, вы хотите снабдить своё приложение голосовым поиском. Для этого нейронке нужно скормить набор данных с транскрипцией живой речи. Чтобы ИИ не тупил и понимал запросы как можно лучше - нужно очень много подробных примеров. Каждый пример - фрагмент аудиозаписи речи, отмеченные в ней фрагменты и перевод, о чём там говорится.
Под разные задачи есть разные виды разметки данных:
Занимаюсь маркетингом в loginom.ru, технический... · 13 окт 2020
Если перевести дословно, то датасет — это набор данных. Как правило, термин используется в контектсе анализа данных и обозначает размеченный набор данных, пригодный для использования в алгоритмах машинного обучения.
В качестве... Читать далее