Зависит от того, какая музыка и насколько громко она звучит.
Если достаточно громко (сравнимо с голосом) - то полностью убрать ее не выйдет :(
Если она довольно тихая, то:
Банально, но отчасти поможет гейт. В тишине музыку он уберет, а голос немного будет маскировать оставшееся.
Частотная коррекция. Частотный диапазон голоса - от ~120Гц и до 16кГц. Все, что за пределами этого диапазона можно вырезать смело. При этом, если диктор - женщина, то можно попробовать обрезать не до 120Гц, а выше - тут нужно слушать.
Плагины для реставрации звука. Например, iZotope RX, в котором есть Denoise. В том же Adobe Audition это называется Noise Reduction. А еще в нем есть пресет Vocal Enhancer, который заточен как раз на то, чтобы нормализовать голос и приглушить любые остальные звуки. Он не всегда идеально работает, но как правило, результат выдает хороший.