Для поиска похожих картинок, изображение уменьшается до небольшого размера, и для него считается хеш: число, которое требует для хранения небольшое количество памяти фиксированной длины. Это значение сравнивается с базой хешей изображений. Если два изображения имеют разный хеш - то они точно хоть на один пиксель да различаются. Если одинаковый - то они с некоторой вероятностью идентичны и могут быть признаны похожими.
Плюс этого подхода в том, что для хранения и сравнения хешей изображений требуется гораздо меньше памяти и времени, чем для хранения и сравнения самих изображений.
Минус состоит в том, что от двух разных изображений может посчитаться одинаковый хеш. В результате, в качестве похожей картинки поиск может выдать изображение чего-то другого с похожим распределением областей цвета.