Какие файлы могут попасть в поиск

Слишком длинные URL (например, с избытком CGI-параметров или вложенных директорий) могут затруднить индексирование документов.

Яндекс индексирует HTML-документы и файлы размером до 10 МБ следующих форматов:

  • PDF;

  • Microsoft Office: DOC, DOCX, XLS, XLSX, PPT, PPTX;

  • OpenOffice: ODT, ODS, ODP, ODG;

  • Текстовые: RTF, TXT;

  • Flash: SWF.

Допустимо использование тегов <frameset\> и <frame\>. Робот Яндекса индексирует контент, подгружаемый в них, и позволяет найти исходный документ по содержимому фреймов.

Особенности индексирования отдельных форматов:

  • SWF

    SWF-файл будет проиндексирован, если на него ведет прямая ссылка или файл встроен в HTML-код с помощью элемента object или embed.

    Если SWF-файл содержит полезный контент, страница, на которой размещен файл, может быть найдена по этому контенту.

    Роботы Яндекса индексируют контент из следующих блоков Flash-документа:

    • Текст: DefineText, DefineText2, DefineEditText, Metadata.

    • Ссылки: DoAction, DefineButton, DefineButton2.

  • PDF

    В документах PDF индексируется только текстовое содержимое. Текст, представленный в виде картинок, не индексируется.

    Если PDF-документ содержит только изображения, то индексируются первые три страницы. PDF-документ, который содержит текст, индексируется полностью.

  • Open Office XML и OpenDocument

    Яндекс корректно индексирует документы в формате Open Office XML и OpenDocument (в частности, документы Microsoft Office и Open Office), но новые версии этих форматов могут поддерживаться не сразу.

Написать в службу поддержки

Если страницы доступны для робота, отправлены на переобход, но не появляются в поиске больше двух недель, заполните форму ниже: