Поисковые подсказки: скрытые параметры, неочевидные возможности и немного непотребств

Подсказочник Яндекса - очень удобный инструмент для получения семантики. Он имеет большую полноту (существенно больше вордстата), слабо зависит от сезонности (сейчас, в мае, можно собрать семант по елочным игрушкам) и достаточно легко парсится.

Но, помимо очевидных бонусов, подсказочник имеет множество скрытых возможностей и не самых очевидных применений. Сегодня я расскажу о трех таких моментах - скрытых параметрах, валидации запросов и непристойных саджестах.

Скрытые параметры.

То что вы видите в виде выпадающих подсказок - это еще не всё. В нем есть дополнительные параметры для каждого запроса. Они передаются в Json в параметрах sgtype, type и cont. Парсер может их выловить. Что же в них содержится интересного?

Параметр sgtype

Этот параметр содержит набор значений, по одному для каждой подсказки.

Список часто встречающихся в sgtype:

B

T

W

In

Pb

Эти параметры зачастую являются значимыми для определения что это за подсказка.

B и T обозначают "обычные" подсказки.

W - это перестановка слов

In - Автодополнение

Pb - Порно-подсказка

Есть другие параметры, которые попадаются реже:

Nav

Tail_word

Fast

Fast_w

Art

Rich

Fresh_console

Nav - навигационный запрос.

Tail_word - как правило, означает что подсказка дополняется не с конца, а с начала.

Rich - расширенная подсказка-сниппет. Появляется для википедии.

Art, Fast, Fast_w, Fresh_console - встречаются редко, пока не удается понять что они обозначают.

Штатно мы используем параметр sgtype чтобы отфильтровывать "автокомплиты". Вот так выглядит обычная подсказка:

А вот - автокомплит:

Внешне они не отличаются. Но, если мы заглянем в параметр sgtype, там будут разные значения:

Автокомплит у нас автоматически отфильтровывается в "обычных" режимах. Если же вы хотите покопаться в sgtype самостоятельно, у нас есть замечательный расширенный режим, который включается радиобаттоном:

Параметры Type и Cont.

В параметре Type может содержаться "fact". В этом случае в "cont" будет текстовая информация, которая выводится в подсказочнике:

Практическая ценность этих параметров не очень высока, но по крайней мере вы будете понимать по каким запросам пользователь получает ответ еще в саджестах и с меньшей вероятностью перейдет на SERP.

 

Подсказочник как фильтр запросов.

Допустим, вы получили большой массив запросов из сильно зашумленного источника. Это может быть вебмастер, метрика или базы запросов миллиардного размера. И вам необходимо быстро и с минимальными затратами понять - какие запросы можно рассматривать, а какие следует отбросить. Вот пример реальных запросов, которые показываются в вебмастере:

Подсказочник обладает большой полнотой и в нем сохраняются запросы не в сезон. Поэтому он выступает хорошим фильтром для семантики. Есть такая подсказка - запрос "хороший". Нет - скорее всего запрос был одноразовым и не имеет постоянного спроса. Но просто подать запрос и поискать ответ недостаточно, может возникнуть несколько сложных ситуаций:

1) Подсказка нашлась одна и мы не знаем автокомплит она или нет.

2) Мы проверяем "взрослую" тематику, для которой подсказок нет.

3) Подсказочник отдал 10 результатов и среди них подсказки нет.

Первая проверка - на автокомплит, легко проходится через параметр sgtype. Как проверять "взрослую" тематику расскажу чуть позже. А вот наличие 10 результатов, среди которых нет исходного запроса, представляет серьезную проблему. Особенно сложно с разбором коротких однословных запросов. Многие удивятся, но практически любая комбинация из 2-3 букв является валидным запросом: яя - это посёлок, гыб - мужское имя, сыс - фамилия, а ару - не орфографическая ошибка, а автоматическая регулировка усиления. Выделения подобных фраз из подсказочника - очень нетривиальная задача. Мы научились решать её через серию специальных запросов:

"Валидация запросов" - один из режимов работы нашего парсера подсказок. При этом он самостоятельно составляет базовые запросы, убирает автокомплиты, подает дополнительные запросы и анализирует ответы. На выходе - готовый результат. Ядро в 100 000 запросов можно отфильтровать таким образом за несколько минут.

 

Непотребства

Продвигаете секс-шоп? Сайт с непристойными видео? Думаете, что подсказочник использовать не получится? Очень зря.

Например, вы ищете большой ч... (айник?):

И закономерно не видите никаких подсказок. Однако, есть простой лайфхак, который позволяет получать подсказки с непристойностями. Нужно сперва подать постыдный запрос в Яндекс, а затем с полученного серпа искать интересующие вас подсказки:

Важно, что при этом вы получаете микс подсказок - как непристойные, так и вполне обычные. Поэтому, все равно потом потребуется их как-то разделять. Это можно решить на этапе кластеризации по топу, или чуть раньше, если использовать расширенный режим и выделять подсказки с sgtype "Pb".

У нас эта опция сбора порно-подсказок включается специальной галочкой:

И комбинируется со всеми режимами работы.

Еще одно применение - разделение семантики на "адалт" и "обычные" запросы. Адалт-запросы, как уже упомяналось ранее, имеют уникальный тип Pb. Ставите галочку сбора порно-подсказок и выбираете "отладочный режим". Все подсказки будут разделены:

 

Средний оптимизатор Петя не пользуется ничем вышеперечисленным. Он вспоминает про подсказочник раз в пол-года чтобы спарсить семантику с минимальным перебором. Возможности своего мозга подсказочника он использует на 10%. Не будь как Петя, экономь свое время, пользуясь фичами подсказочника.

P.P.S. А еще, мы завели свой телеграм-канал: https://telegram.me/justmagicorg

А ну быстро все подписались Теперь все самые свежие новости и апдейты публикуются там.


  Поделиться:
  3 047 views
;

Наверх