Чаще всего в Disallow у меня попадают ненужные параметры. Например, utm_source, fbclid и какие-то внутрисайтовые параметры (вроде параметров фильтрации). Для Яндекса дополнительно прописываю Clean-param, чтобы он не учитывал ненужные параметры.
Помимо этого закрываются разные технические страницы: страница поиска по сайту, Политика конфиденциальности и т.п.
Для отдельных движков есть дополнительные исключения. Например, для Wordpress:
- /wp-admin
- /wp-includes
- */trackback
- */feed
- /wp-login.php
- и т.п.
Иногда полностью закрываю сайт
Disallow: /
для отдельных роботов, чаще всего краулеров и парсеров, вроде grub, WebZip, Offline Explorer, Xenu's Link Sleuth и т.п.