Классический источник тут - "Speech and Language Processing" за авторством Dan Jurafsky и James H. Martin (отдельные главы: https://web.stanford.edu/~jurafsky/slp3/). Но на русском её, вроде бы, нет.
На русском можно посмотреть "Введение в информационный поиск" Кристофера Маннинга и Ко, тоже очень хорошее.