Посткластеризация. Идея тегирования

При оптимизации страниц необходимо регулярно переносить ключевые слова из сгруппированных выборок запросов в контекст страниц сайта. Обычно сопоставление с поисковыми зонами страниц производится визуально или с помощью регулярных выражений, при этом в некоторых случаях основные ключевые слова групп запросов используются в качестве заголовков (H1) почти без изменений (например, для страниц-фильтров интернет-магазинов), а в других случаях ключевые слова внедряются в шаблоны микротекстов. Ниже в статье анализируется возможность приведения контекстов ключевых слов и страниц в общее словарное пространство для автоматизации рутинного процесса сопоставления (объясняются подходы, практика будет раскрыта в других материалах).

Суть идеи — для групп ключевых слов и страниц сайта (далее именуемые также «урлы») создать классифицирующие словарные метки, по сопоставлению которых ключевые слова связать с урлами. Под «ключевыми словами» подразумеваются основные запросы прокластеризованной семантики, другими словами, речь об автоматизации работы с группами ключевых слов и страниц оптимизируемых сайтов.

Разберем случайный запрос «линолеум под светлое дерево», где «линолеум» название категории товаров, «под дерево» — рисунок напольного покрытия, «светлый» — цвет (рисунок и цвет разные фильтры при подборе линолеума). Страница фильтров и-магазина будет иметь близкий к следующему динамический URL:
site.ru/category?figure=pod-derevo&color=svetlyy

Далее в процессе базовой оптимизации будет создана близкая к следующей статическая страница:
URL: site.ru/linoleum/pod-derevo-svetlyy
H1: «Линолеум под светлое дерево»

Для автоматизации этого процесса исходное ключевое слово «линолеум под светлое дерево» необходимо сначала преобразовать в набор атрибутов [category=линолеум, figure=под-дерево, color=светлый] и потом по правилам определенного сайта привести к требуемому формату урлов. Операцию создания наборов атрибутов из ключевых слов далее будем называть тегированием урлов (от английского «tag») или «созданием меток».

Для тегирования возможны подходы (и их комбинации):

  • Четкое сопоставление — по определенным правилам из ключевых слов создаются последовательности слов с последующим мэтчингом со значениями фильтров.
  • Нечеткое сопоставление — аналогично предыдущему, но с нечетким мэтчингом (Fuzzy String Matching в Python).
  • Векторизация и оценка схожести.

Для работы со структурой больших сайтов (например, имеющих раздел «Напольные покрытия») в метках необходимо выделить атрибуты, соответствующие иерархии страниц, например — [razdel=напольные, category=линолеум; (!) figure=под-дерево, color=светлый]

Для разбора выборок поисковых запросов на иерархические группы удобны метки без атрибутов (например,[напольные, линолеум; под-дерево, светлый]), также такие метки будут полезны для актуализации и расширения семантики (сопоставление новых ключевых слов с ранее использованными).

Подытожим, ключевые слова и страницы для автоматизации базовой оптимизации необходимо привести в общее словарное пространство. При этом непосредственно в сопоставлении ключевых слов и урлов нет нового (в том или ином виде этим регулярно занимаются seo-специалисты), новизна в использовании характеризующих страницы тегов, видах тегирования и терминологии.

0

Автор публикации

не в сети 2 года

promaker

0
Комментарии: 0Публикации: 5Регистрация: 05-08-2019
Оцените автора
Добавить комментарий

Авторизация
*
*
Регистрация
*
*
*

пять × пять =

Генерация пароля