Официальный аккаунт компании LabelMe.
Мы... · 5 апр 2022
Это один из видов разметки данных. Если говорить максимально простыми словами, то это закрашивание определенных объектов в определенные цвета.
Например, нам нужно закрасить дорогу в один цвет, автомобили в другой, пешеходов в третий. Это нужно для того, чтобы нейросеть могла распознавать эти объекты и выполнять определенные операции.
Если сформулировать более точное определение, то семантическая сегментация — это это разделение изображения на отдельные группы пикселей, области, соответствующие одному объекту с одновременным определением типа объекта в каждой области.
Мы в LabelMe выделяем несколько видов сегментации:
Matting сегментация - как правило используется для выделения одного определенного объекта с обилием мелких деталей. У деревьев - листва, у людей - волосы. Для этого используется всего два значение 1 и 0. Логика заключается в том, что все пиксели, относящиеся к главному объекту получает 1, а все посторонние (в том числе и фон) - 0.
Многоклассовая сегментация - когда в одной сцене необходимо выделить сразу несколько объектов. Например, в на фотографиях помещений нужно сегментировать столы, шкафы и стулья.Каждому из этих классов присваивается единое значение и цвет и по их контуру создаются цветовые маски.
Парсинг изображений - когда необходимо присвоить каждому пикселю изображения конкретный класс. В данном случае мы выполняем разметку незамкнутыми полигонами и кривыми Безье, уточняя контуры объектов, и применяем заливку областей. На выходе мы получаем датасеты изображений, полностью покрытых масками классов с не пересекающимися границами.
Подробнее про различные виды сегментации и их применение можно почитать тут.