Это сложный вопрос, на который можно дать разные ответы. Моя версия: это совокупность или последовательность звуков обладающих определенными частотными характеристиками, которые человеческий мозг в силу культурных кодов воспринимает как что-то цельное