Подсказочник Яндекса - очень удобный инструмент для получения семантики. Он имеет большую полноту (существенно больше вордстата), слабо зависит от сезонности (сейчас, в мае, можно собрать семант по елочным игрушкам) и достаточно легко парсится.
Но, помимо очевидных бонусов, подсказочник имеет множество скрытых возможностей и не самых очевидных применений. Сегодня я расскажу о трех таких моментах - скрытых параметрах, валидации запросов и непристойных саджестах.
Скрытые параметры.
То что вы видите в виде выпадающих подсказок - это еще не всё. В нем есть дополнительные параметры для каждого запроса. Они передаются в Json в параметрах sgtype, type и cont. Парсер может их выловить. Что же в них содержится интересного?
Параметр sgtype
Этот параметр содержит набор значений, по одному для каждой подсказки.
Список часто встречающихся в sgtype:
B
T
W
In
Pb
Эти параметры зачастую являются значимыми для определения что это за подсказка.
B и T обозначают "обычные" подсказки.
W - это перестановка слов
In - Автодополнение
Pb - Порно-подсказка
Есть другие параметры, которые попадаются реже:
Nav
Tail_word
Fast
Fast_w
Art
Rich
Fresh_console
Nav - навигационный запрос.
Tail_word - как правило, означает что подсказка дополняется не с конца, а с начала.
Rich - расширенная подсказка-сниппет. Появляется для википедии.
Art, Fast, Fast_w, Fresh_console - встречаются редко, пока не удается понять что они обозначают.
Штатно мы используем параметр sgtype чтобы отфильтровывать "автокомплиты". Вот так выглядит обычная подсказка:
А вот - автокомплит:
Внешне они не отличаются. Но, если мы заглянем в параметр sgtype, там будут разные значения:
Автокомплит у нас автоматически отфильтровывается в "обычных" режимах. Если же вы хотите покопаться в sgtype самостоятельно, у нас есть замечательный расширенный режим, который включается радиобаттоном:
Параметры Type и Cont.
В параметре Type может содержаться "fact". В этом случае в "cont" будет текстовая информация, которая выводится в подсказочнике:
Практическая ценность этих параметров не очень высока, но по крайней мере вы будете понимать по каким запросам пользователь получает ответ еще в саджестах и с меньшей вероятностью перейдет на SERP.
Подсказочник как фильтр запросов.
Допустим, вы получили большой массив запросов из сильно зашумленного источника. Это может быть вебмастер, метрика или базы запросов миллиардного размера. И вам необходимо быстро и с минимальными затратами понять - какие запросы можно рассматривать, а какие следует отбросить. Вот пример реальных запросов, которые показываются в вебмастере:
Подсказочник обладает большой полнотой и в нем сохраняются запросы не в сезон. Поэтому он выступает хорошим фильтром для семантики. Есть такая подсказка - запрос "хороший". Нет - скорее всего запрос был одноразовым и не имеет постоянного спроса. Но просто подать запрос и поискать ответ недостаточно, может возникнуть несколько сложных ситуаций:
1) Подсказка нашлась одна и мы не знаем автокомплит она или нет.
2) Мы проверяем "взрослую" тематику, для которой подсказок нет.
3) Подсказочник отдал 10 результатов и среди них подсказки нет.
Первая проверка - на автокомплит, легко проходится через параметр sgtype. Как проверять "взрослую" тематику расскажу чуть позже. А вот наличие 10 результатов, среди которых нет исходного запроса, представляет серьезную проблему. Особенно сложно с разбором коротких однословных запросов. Многие удивятся, но практически любая комбинация из 2-3 букв является валидным запросом: яя - это посёлок, гыб - мужское имя, сыс - фамилия, а ару - не орфографическая ошибка, а автоматическая регулировка усиления. Выделения подобных фраз из подсказочника - очень нетривиальная задача. Мы научились решать её через серию специальных запросов:
"Валидация запросов" - один из режимов работы нашего парсера подсказок. При этом он самостоятельно составляет базовые запросы, убирает автокомплиты, подает дополнительные запросы и анализирует ответы. На выходе - готовый результат. Ядро в 100 000 запросов можно отфильтровать таким образом за несколько минут.
Непотребства
Продвигаете секс-шоп? Сайт с непристойными видео? Думаете, что подсказочник использовать не получится? Очень зря.
Например, вы ищете большой ч... (айник?):
И закономерно не видите никаких подсказок. Однако, есть простой лайфхак, который позволяет получать подсказки с непристойностями. Нужно сперва подать постыдный запрос в Яндекс, а затем с полученного серпа искать интересующие вас подсказки:
Важно, что при этом вы получаете микс подсказок - как непристойные, так и вполне обычные. Поэтому, все равно потом потребуется их как-то разделять. Это можно решить на этапе кластеризации по топу, или чуть раньше, если использовать расширенный режим и выделять подсказки с sgtype "Pb".
У нас эта опция сбора порно-подсказок включается специальной галочкой:
И комбинируется со всеми режимами работы.
Еще одно применение - разделение семантики на "адалт" и "обычные" запросы. Адалт-запросы, как уже упомяналось ранее, имеют уникальный тип Pb. Ставите галочку сбора порно-подсказок и выбираете "отладочный режим". Все подсказки будут разделены:
Средний оптимизатор Петя не пользуется ничем вышеперечисленным. Он вспоминает про подсказочник раз в пол-года чтобы спарсить семантику с минимальным перебором. Возможности своего мозга подсказочника он использует на 10%. Не будь как Петя, экономь свое время, пользуясь фичами подсказочника.
P.P.S. А еще, мы завели свой телеграм-канал: https://telegram.me/justmagicorg
А ну быстро все подписались Теперь все самые свежие новости и апдейты публикуются там.