Точное описание - очень коротко. Мы - не знаем.
Подробно?
Мы знаем, что звуки/буквы речи каким-то образом, в результате многоэтапной интерпретации инициируют возбуждение в нашем мозгу символов (символ - специфическая статистическая активность во времени определённых групп нейронов головного мозга). И лишь небольшая часть этих символов прямо соответствует словам речи. Ну да. Ведь определяются характеристики звуков речи (женская/мужская, человек/запись/попугай и прочая ворона, эмоции, эмоциональные ударения) и (много хуже в случае среднего читателя) характеристики письменной речи. Распознаются несколько смысловых слоёв, включая намёки и собственные ассоциации слушателя/читателя.
На самом деле, "работа" нашего мозга с речью - тот самый ключевой момент, от полного понимания деталей которого до создания полноценного искусственного интеллекта - один шаг. Как и до "цветов у обочины" - близких к идеалу компьютерных переводчиков, писателей и т.д. и т.п.