Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Какая основная идея алгоритма СТОЛП. И как его использовать?

Машинное обучение+3
Анонимный вопрос
  ·   · 976
Люблю изучать что-то новое  · 7 авг 2022
Попробую ответить просто. СТОЛП - алгоритм отбора эталонных объектов для метрического классификатора.
Допустим есть конечный набор, и ещё есть метрика, с ней гипотеза компактности = тру. (Гипотеза что схожие объекты гораздо чаще лежат в одном классе, чем в разных)
Если сортировать объекты метрическим сортировщиком/классификатором (вычисление сходства между объектами), то время которое тратится на каждый объект пропорционально размеру конечного набора… Это очень большой объем данных. И не все объекты набора равноценны.
Есть те, от удаления которых сортировка не изменится, а есть те, от которых ухудшится качество сортировки.
Поэтому алгоритм СТОЛП уменьшает объем набора и оставляет в ней только эталонные(подмножество набора что все объекты сортируются правильно если использовать в наборе множество эталонов) объекты каждого раздела.
Использование СТОЛПА: 
Выбираем набор пусть Xi
Возможная доля ошибок i0
Пороги отсечения выбросов
Алгоритм сортировки
Формула для вычисления величины риска(степень риска для объекта быть сортированный не в тот раздел/класс) 
Теперь опишем алгоритм:
Отбрасываем выбросы
Создаем начальное приближение (из объектов набора выбрать по одному каждого класса который обладает максимальной либо минимальной величиной риска)
Наращиваем множество эталонов (пока число объектов набора, который распознаются неправильно, не станет меньше i0 - возможных долей ошибок)
Классифицируем объекты выбранного набора Xi, используя в качестве обучающего набора начальное приближение
Пересчитываем величины риска для всех объектов (получается Xi/начальное приближение) учитывая изменения обучающего набора
Среди объектов каждого класса, распознанных неправильно, выбрать объекты с максимальной величиной риска и добавить их к начальному приближению
Итог: множество эталонов каждого раздела превращается в новый набор, находящихся на границе класса, и, если в качестве начального приближения выбирались объекты с минимальной величиной риска, один объект, находится в центре класса.