Кандидат физ.-мат. наук, делаю Яндекс, увлекаюсь... · 27 сент 2021
Пусть будут сразу две!
Полезные рекомендации документов. Задача настолько интересная и сложная, что её так толком никто и не решил. Представьте себе аналог Яндекс.Дзена, который подсовывает вам только то, что вам правда полезно, а не то, на что вы кликнете и убьете время. Как отличить "Стартап дня" от "10 деталей Властелина колец, которые вы никогда не замечали", или @gonzo_ML от @profunctor_io? И по популярности, и по кликам, и по лайкам первые всегда проиграют вторым. Фичи и модели фигня, прорвемся, но вот как сконструировать правильный таргет?
Применение больших языковых моделей. Допустим, у вас есть доступ к GPT-3. Если засовывать в неё "просто тексты" и просить продолжить, быстро становится очевидно, что она неплохо "рассуждает" и очень много чего знает -- что огонь горячий, что Наполеон был императором Франции, что человек с интересами "буддизм, йога, Тойота Приус" голосует за демократов, а не за республиканцев, и еще миллионы подобных вещей. Как эту мощь правильней всего применить к стандартным классификации, регрессии, ранжированию etc? Как извлечь из нее пользу в production? Ужасно интересно, и за последний год мое мнение на этот счет полностью изменилось.
"Однажды я сделал крючок в виде интеграла и вытащил из унитаза застрявшую там тряпку" -- вспомнилось... в общем, однажды я так много болтал про АйТи и машобуч, что затащил в постель аж целого кандидата наук по химии и... Читать далее