Потому что создается дополнительное измерение (сбсно ядро) на которое линейно несапарабельные изачально данные проецируются. На этом дополнительном измерении их проекции становятся линейно сепарабельными.
По простому если, на пальцах - ядро это как бы взаимное расстояние между точками в n-мерном пространстве - где n - количество измерений в ваших сырых данных. Т. е. ядро - это n+1.
Если у вас 2 измерения, и вы не можете разделить данные вектором, вы создаете ядро, которое по сути набор проекций на вектор ваших точек. И на ядре они оказываются кластеризуемы