Какие файлы могут попасть в поиск
Слишком длинные URL (например, с избытком CGI-параметров или вложенных директорий) могут затруднить индексирование документов.
Яндекс индексирует HTML-документы и файлы размером до 10 МБ следующих форматов:
-
PDF;
-
Microsoft Office: DOC, DOCX, XLS, XLSX, PPT, PPTX;
-
OpenOffice: ODT, ODS, ODP, ODG;
-
Текстовые: RTF, TXT;
-
Flash: SWF.
Допустимо использование тегов <frameset\> и <frame\>. Робот Яндекса индексирует контент, подгружаемый в них, и позволяет найти исходный документ по содержимому фреймов.
Особенности индексирования отдельных форматов:
-
SWF
SWF-файл будет проиндексирован, если на него ведет прямая ссылка или файл встроен в HTML-код с помощью элемента
objectилиembed.Если SWF-файл содержит полезный контент, страница, на которой размещен файл, может быть найдена по этому контенту.
Роботы Яндекса индексируют контент из следующих блоков Flash-документа:
-
Текст:
DefineText,DefineText2,DefineEditText,Metadata. -
Ссылки:
DoAction,DefineButton,DefineButton2.
-
-
PDF
В документах PDF индексируется только текстовое содержимое. Текст, представленный в виде картинок, не индексируется.
Если PDF-документ содержит только изображения, то индексируются первые три страницы. PDF-документ, который содержит текст, индексируется полностью.
-
Open Office XML и OpenDocument
Яндекс корректно индексирует документы в формате Open Office XML и OpenDocument (в частности, документы Microsoft Office и Open Office), но новые версии этих форматов могут поддерживаться не сразу.
|
Полезные инструменты |
Сервисы |
|
Технологии |