Акварель. Документация.

Акварель – это модуль анализа текстов на соответствие запросу. Позволяет выявлять «воду» и нерелевантные слова. Своей целью имеет уберечь сайт от пессимизаций в поисковиках за некачественный контент. Да и в целом на релевантности текстов сказывается положительно.

Внимание! «Акварель» определяет не просто «воду», а слова, которые должны/не должны встречаться в тексте по определенному запросу. Одно и то же слово может оказаться как релевантным, так и нет. Зависит от запроса.

Что подается на вход?

Запрос

Двух, или трех словный запрос, которому должен соответствовать текст. Вы можете ввести и одно- и четырех-словный, но в этих случаях система не всегда сможет отработать корректно. Однословные запросы, как правило, являются слишком широким понятием. (Вот «такси» - это что? Заказ такси? Или фильм? Или сервис Яндекс-Такси? Или радиостанция такси-ФМ?). Четырехсловные, напротив, слишком сужают предметную область.

Отдельно стоит сказать про регион – его выбрать невозможно. Однако, если вам важна региональная специфика, вы можете добавить геоуказание в запрос. Например «эвакуатор владивосток» или «такси санкт-петербург».

Также, старайтесь избегать уточняющих слов, если они не являются смысловыми. Не стоит использовать запросы вроде «пластиковые окна недорого в москве» вместо «пластиковые окна».

Текст

Собственно, сам анализируемый текст. Вставляйте как есть, вместе со знаками препинания. Но НЕ вставляйте верстку.

Биллинг акварели.

Акварель расходует аква-лимиты. По 1 лимиту за проверенное слово. Стоимость одного аква-лимита для подписчиков (чатланин и выше) сверх включенных лимтов – 0,02 чатла. Проверка текста из ~1000 символов обойдется вам примерно в 3 чатла (1000 символов, в среднем по 7 символов в слове. 1000/7=~142. 142*0,02 = 2,84).

Результат акварели.

В результате работы модуля все слова вашего текста будут раскрашены различными цветами.

  • Серым – будут выделены служебные части речи (предлоги, частицы, наречия).
  • Красным – нерелевантные слова.
  • Зеленым – релевантные слова.
Красные и зеленые цвета не абсолютны. Это градиент от 0 до 1 со множеством оттенков. Если навести мышку на слово, во всплывающей подсказке будут показаны часть речи слова (существительное, прилагательное, и.т.п.) и численное значение «релевантности» (от 0 до 1).

FAQ по «Акварели»

Q: Зачем оно вообще надо?

A: Тексты, слова в которых соответствуют запросу практически никогда не залетают под санкции. Береги сайт смолоду.

Q: Как оно работает?

A: В общих чертах: на основании вашего запроса определяет релевантную ей коллекцию документов, восстанавливает из нее униграммную языковую модель и использует ее для оценки слов. То есть, это вероятность того, что слово встретится в документе, если он релевантен вашему запросу. Для оценки используется вся коллекция Яндекса целиком (А не только первые 10/100/1000 результатов).

Q: А что если это общее слово, которое есть во всех документах в сети?

A: Мы это предусмотрели. Для каждого слова оценивается также его общая встречаемость в коллекции.

Q: Слово ***** отображается как нерелевантное запросу, хотя оно же по смыслу подходит?

A: Причин может быть множество.
  • Слово является омонимом (например «ели»).
  • Оно на самом деле редко употребляется в таком контексте (Например, про отели говорят «качество сервиса», а не «качество обслуживания»).
  • Это косяк лемматизации (приведения к исходной форме).
  • Это косяк Яндекса, отдал неверные данные (да-да, бывает).
  • Еще что-нибудь.
Пишите нам о таких проблемах (как и об обратных – нерелевантное слово помечено релевантным), мы постоянно улучшаем алгоритм.

Q: И чего мне с результатом делать?

A: Визуально оценить, каких слов больше. Если красного слишком много – тыкнуть носом копирайтера в эти участки, пусть выливает воду и переписывает. Если не знает какие слова релевантные – пусть воспользуется акварель-генератором.

Наверх