Если СЯ не большое и вы в теме, то можно использовать
Кей коллектор с возможность автоматической кластеризации и потом еще пройтись руками. Можно конечно использовать и для большого СЯ.
Также можно использовать хороший сервис
just-magic, который сделает кластеризацию, только за это нужно будет заплатить деньги. в Джастмеджик есть и другие полезные функции, классификатор запросов. текстовый анализатор и т.д.
Еще есть хороший сервис
overlead, тоже можете попробовать.