Текстовый анализатор. Документация.

Что это такое?

Это модуль, который позволяет проанализировать текущую оптимизацию страницы и подсказывает оптимальное количество вхождений. Анализ проводится на базе топ-10 Яндекса, умеет анализировать оптимизацию страницы сразу по нескольким запросам.

Зачем нужно?

  • Проанализировать качество оптимизации своей страницы.
  • Понять правильную (с точки зрения поиска) структуру документа.
  • Сформировать ТЗ на оптимизацию (Текст, тайтл, и.т.д.)

Что нужно для запуска:

  • Файлик со списком запросов. Скачать пример входного файла: ТЫЦ
  • Код региона, по которому проводить анализ (По умолчанию 213 - Москва)
  • Чекбокс "Соответствие по типу страниц" (по умолчанию включено)
  • Чекбокс "Анализировать только пересечения" (по умолчанию выключено)
  • Стоп-лист сайтов (до 10 строк, по умолчанию там яндекс и википедия)

Подробнее о входных данных:

Список запросов (в форме или *.xlsx файлом).

Обычный файл формата *.xlsx В файле должно быть два столбца. В первом столбце - URL, во втором - запрос, этому урлу соответстующий (не перепутайте столбцы местами!). В запросах должны быть только печатные символы (русские/английские буквы (+белорусские и украинские), цифры, пробел, дефис, «/»). Дубликаты система удалит самостоятельно при нахождении.

Внимание! Система принимает до 10 запросов (включительно) на одну страницу. Если на какую-либо страницу в файле будет больше 10ти, будут рассмотрены только первые десять. При распределении запросов по страницам рекомендуем вам использовать наш кластеризатор.

Скачать пример входного файла (бесплатно, без смс и регистрации) === ТЫЦ

Код региона, согласно таблице кодов Яндекса.

По умолчанию 213 - Москва. Если вы продвигаете региональный сайт, необходимо ввести соответствующий ему в Яндексе код.

Чекбокс "Соответствие по типу страниц"

Если выключен - анализируются все страницы. Если включен - только соответствующие вашей по типу (главная/внутренняя). Т.е. если вы анализируете главную, то из топа для анализа будут браться только главные. По умолчанию - включен.

Чекбокс "Анализировать только пересечения"

Если включен - анализурются только те урлы, которые находятся в топ-10 Яндекса по всем указанным для страницы запросам. Может комбинироваться с "соответствием по типу страниц". По умолчанию отключен.

Стоп-лист сайтов

Если какие-то сайты вы подозреваете в попадании в топ-10 через постель по особому благословению Яндекса, можете исключить их из рассмотрения добавив в стоп-лист (без wwww). По умолчанию в стоп-листе Яндекс и Википедия. Убираются из рассмотрения анализатором все урлы, которые находятся на любом из указанных доменов или их субдоменов.

Что вы получаете в выходном файлике?

Выходной результат в файле сегментирован по страницам Вначале идет URL и поданные к нему запросы. Для каждого запроса указан статус - участвовал ли он в анализе. (Может не участвовать, если не нашлось ни одного документа в топ-10 Яндекса, подходящего требованиям).

Далее идет таблица фраз и вхождений. В левом столбце - фразы, вхождения которых нужно добавить или убрать. При этом * - обозначает любое слово, кроме слова запроса. Например, для запроса "купить розового слона" вхождение купить * слона может обозначать "купить большого слона", "купить комнатного слона", и.т.п.

Если фраза взята в квадратные скобки (например: [розовый слон]), то это означает вхождение в любой словоформе кроме указанных. Например, если в файле указано:
розовые слоны
[розовый слон]
То в качестве вхождения для [розовый слон] могут выступить "розовый слон", "розовых слонов", "розового слона", и.т.п.

Есть 3 раздела в таблице - top-10, diff и src.

  • top-10 - это "эталон", посчитанный по топ-10 Яндекса.
  • diff - разница между вашей страницей и эталоном.
  • src - данные по вашей странице.

В каждом разделе есть данные по 5 зонам документа.

  • <title> - число вхождений фразы в мета-тег
  • <body> - вхождения, которые можно разместить в любом месте в body (<a>, текстовые фрагменты или сео-текст)
  • <a> - число вхождений фразы в тег <a> (исходящие со страницы ссылки, внутренние и внешние).
  • text-fragment - число вхождений в маленькие кусочки текста (например - в описаниях товара в листинге магазина)
  • plain-text - число вхождений в seo-текст

Для каждой фразы указано оптимальное число вхождений в каждой зоне (в top-10), сколько нужно исправить на странице и сколько на ней есть сейчас.
Под фразами расположена строка с числом слов. Также приводится оптимальное значение для каждой зоны и текущее на странице.
Внимание! Слов! Не символов!

Наверх