Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Какие решения вы можете предложить для выявления плагиата?

ПрограммированиеData science+2
Алена Каменецких
  ·   · 921
Сингулярист, любитель занимательной математики, ра...  · 17 нояб 2021
Надеюсь Вы знакомы с интернет-проектом "Антиплагиат"? Я бы к ней добавил работу с иноязычными документами с переводом. И работу с базой сканированных бумажных копий. (это то что касается текстовых заимствований)
Для визуальной информации вполне успешно работает поиск картинок и поиск схожих картинок.
Трудно, что либо, предложить для глубоко поиска и анализа-сравнения. Ещё, пожалуй, можно попробовать анализировать поведение автора на основе предыдущих контентов - типично ли для него, похоже-не похоже, скорее не он, не характерно для его уровня специализации/квалификации
Отвечает
Skillbox
Можно попробовать использовать ANTLR, описание примера тут. Либо пойти другим путём — выявлять косинусную близость, используя модель word2vec: import gensim import warnings warnings.filterwarnings(action='ignore', category=User... Читать далее