Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Сколько данных нужно, чтобы обучить нейросеть?

Vladislav E.
  ·   · 666
Лучший
Официальный аккаунт компании LabelMe. Мы...  · 11 апр 2022
Конкретного ответа на этот вопрос быть не может. Во всяком случае пока что. Объем датасета зависит от множества факторов:
— Сложность задачи, стоящей перед моделью
— Количество классов 
— Метод обучения 
И это лишь основные факторы. Например, если вам нужно обучить классификатор изображений по двум классам: автомобили и мотоциклы, - то объемы обучающих данных будут одними. Но если вам потребуется дополнительно классифицировать их по маркам производителей, то должны быть представлены примеры под все классы.
Некоторые используют для этого статистические эвристические методы расчета. Вот некоторые из них:
  • Коэффициент количества классов: Для каждого класса должно быть x независимых примеров, где x может быть десятками, сотнями или тысячами (например, 5, 50, 500, 5000).
  • Коэффициент количества входных функций: Должно быть на x% больше примеров, чем входных объектов, где x может быть десятками (например, 10).
  • Коэффициент количества параметров модели: Для каждого параметра в модели должно быть x независимых примеров, где x может быть десятками (например, 10).
Но есть и очень полезные трюки, которые могут упростить работу и сократить необходимый набор данных. Например, предобучение модели на стадии разметки. Мы в LabelMe обычно используем этот метод при классификации изображений, так как каждая метка, поставленная живым разметчиком, позволяет в реальном времени обучать алгоритм. 
Это с одной стороны упрощает сам процесс работы, так как после 100 итераций нейронка начинает сама прогнозировать метки для последующих изображений. А с другой - финальная пред обученная модель может быть использована в качестве фундамента обучения. Вот ссылка на статью, где мы подробно сравнили разметку со встроенной нейронкой и без, чтобы наглядно показать разницу в производительности - https://zen.yandex.ru/media/id/602ce00c6cc0a626e7699094/pochemu-razmetka-dannyh-v-labelme-na-25-bystree-chem-na-birjah-60368112ebccc7516131304a?& 
Источник: https://labelme.ru/