Расширение семантического ядра и кластеризация по данным SERP. Документация.

Что это такое?

Расширение (семантики) – это модуль, который позволяет вначале автоматически подобрать запросы похожие на ваши, а затем сгруппировать полученный результат на основании топа Яндекса.

Зачем нужно?

- Быстро расширяет ваше ядро на основании тех запросов, что у вас уже есть.
- Все плюшки кластеризации включены.

Как работает?

  • Для запуска расширения семантики:
  • - Выбираем базу запросов, с которой будем работать.
  • - Определяем число итераций расширения (0..10)
  • - Выбираем порог одной итерации расширения (3..9)
  • - (опционально) включаем/нет галочку "Удалить исходные ключи из финальной группировки"
  • - (опционально) включаем/нет галочку "альтернативный формат нумерации групп"
  • - Подаем список запросов в виде *.xlsx файла или вставляем в форму

И на выходе вы получаете кластеризованный результат.

Подробнее

Выбор базы для кластеризации

Здесь все просто. Вы выбираете базу, по которой система будет работать. Можете выбрать одну из наших или свою (Если подключена. Опция для корпоративных тарифов only). Кластеризовать одновременно по нескольким базам, к сожалению, невозможно. Будут кластеризованы только те запросы из файла, которые присутствуют в выбранной базе.

Число итераций расширения

Число от 0 до 10. Задает число итераций поиска новых запросов. На первой итерации находятся запросы, похожие на поданные на вход. На второй — запросы, похожие на найденные на первой итерации, и.т.д.

Если поставить 0, то новые запросы искаться не будут, просто кластеризуются поданные на вход (по выбранной базе).

Если вы подаете на вход большое число запросов — ставьте число итераций 1 или 2. Если малое (или вообще один запрос) — можно ставить больше.

Примечание:
Реальное число итераций может отличаться от заданного вами, т.к. общее число обрабатываемых запросов зависит от вашего персонального лимита на группировку.
Лимит составляет ваш разовый лимит на одну операцию * 10. Например, для "Чатланина" разовый лимит 1 000 запросов. Значит, в результате расширения вы можете получить не более 10 000 запросов.

Как это выглядит на практике?
Например, ваш лимит на результат расширения — 100 000 запросов (тарифы - Желтые Штаны).
Вы подали на вход 10 000 запросов и число итеарций поиска 3.
На первой итерации поиска нашлось еще 20 000 запросов. Общее число — 30 000.
На второй итерации поиска нашлось еще 40 000 запросов. Общее число — 70 000.
На третьей итерации поиска нашлось еще 50 000 запросов. Общее число — 130 000.
Число запросов после третьей итерации превышает ваш лимит на группировку (100 000), поэтому система откатывает поиск до второй итерации и группирует 70 000 запросов.

Порог одной итерации расширения

Число от 3 до 10. Чем меньше порог одной итерации — тем больше запросов будет найдено на каждой итерации, но тем больше вероятность нахождения менее релевантных.

Галочка "Удалить исходные ключи из финальной группировки" (опционально).

Вы можете исключить из конечного результата поданные на вход запросы, если поставите эту галочку. Тогда после поиска похожих запросов и перед группировкой будут исключены поданные на вход запросы. Это актуально, например, когда у вас есть полное ядро сайта, и вы хотите понять какие еще страницы можно создать.

Примечание:
В случае группировки с исключением расчет размера группы для кластеризации также считается без поданных на вход запросов. Например, вы подали на вход 10 000 запросов, ваш лимит на группировку — 50 000. В результате поиска на последней итерации нашлось 45 000 запросов. Все они будут сгруппированы, т. к. 45 000 < 50 000. Но если бы вы не ставили эту галочку, то произошел бы откат системы на один шаг, т. к. общее число запросов больше лимита 55 000 > 50 000.

Галочка альтернативного формата нумерации групп (опционально).

(Если вам лениво разбираться — не ставьте эту галочку. Она не влияет на алгоритм группировки)
Изменяет принцип нумерации групп (только правила присвоения номеров, группы остаются только такими же). Что это и зачем надо смотри в документации на кластеризатор.

Список запросов

Обычный файл формата *.xlsx
В файле должен быть один столбец, в котором содержатся запросы. В запросах должны быть только печатные символы (русские/английские/белорусские/украинские буквы, цифры, пробел, дефис, «/»).

Или, вместо файлика запросы можно ввести в форме. Правило аналогичны, каждый запрос - с новой строки. Если добавлен файл, содержимое формы игнорируется.

Что будет в результате?

Столбец key — это сам запрос.
В столбце key содержатся сами запросы. Столбцы grp1-4 — 4 столбца кластеризации с определенными порогами. Grp1 — кластеризация по 3 урлам, grp2 — по 4м урлам, и.т.д. Последний столбец «spec-grp» - «тематическая» группировка. Подробнее о столбцах.

grp1 — это наиболее широкая группа (сформировання по 3м урлам). Это означает, что все запросы, имеющие одинаковый номер группы в столбце grp1, относятся к одной группе. Группа формируется по принципу «существует как минимум 3 урла, которые присутствуют в топ-10 по каждому из запросов группы». Группы grp2-4 созданы по аналогичному принципу, но минимум урлов для объединения у них, соответственно, 4-6.

Группы grp1 нумеруются от наибольшей к наименьшей. Самая большая (по количеству запросов в ней) получает номер 1. Группа поменьше — 2, и так далее.

Наверх