суббота, 16 марта 2013 г.

Рассчитываем оптимальную плотность ключевых слов


В этой статье я постараюсь ответить на очень популярный вопрос среди оптимизаторов. А именно, привести алгоритм расчета "оптимальной" плотности ключевого слова.

Вообще я не фанат подобного подхода и всегда стараюсь создавать контент направленный прежде всего на людей. Но в некоторых сверх конкурентных тематиках приходиться использовать максимум инструментов. В том числе оптимизированные тексты.

Начнем с постановки задачи.
Мы хотим определить идеальную плотность упоминания определенного слова или словосочетания в электронном документе, для получения максимальной релевантности с точки зрения поисковой системы.

Что нам известно о оценке плотности ключевых слов поисковыми системами (ПС)?
  1. Алгоритмы ПС учитывают расположение слова в документе и придают наибольшую важность словам которые упоминаются в контетной части документа.
  2. ПС понимают, что многие владельцы web сайтов могут попытаться завысить показатели релевантности в документе увеличив плотность определенных слов. По этому поисковые системы пытаются обнаружить такие накрутки и не учитывать их. 

Зоны web страницы

Начнем с определения зон документа. Известно, что поисковые системы обращают особое внимание на заголовки. Также мы знаем что поисковик определяет  область контента на основе соотношения html кода и текстового содержания.

В нашем расчете давайте сосредоточимся на таких элементах: заголовки h1-h3, контент и остальная область страницы.

Расчет

Для примера возьмем коммерческое ключевое слово с высокой конкуренцией, например "квартиры посуточно".

Теперь нам потребуются страницы которые поисковая система считает достаточно релевантными. Возьмем ТОП5 из выдачи Google и рассчитаем среднее значение плотности этого ключевого слова в этой выборке. Эти страницы ПС считает лучшими в достаточно конкурентной теме, а значить мы можем считать их примерами для определения плотности упоминания слова в документе.

Расчет будем вести по следующей формуле:

Плотность ключевого слова (%) = количество упоминаний / ((количество слов в документе / длина поисково запроса [в словах]) / 100)

В тот момент когда я писал эту статью плотность в ТОП5 Google по запросу: "квартиры посуточно" была следующей.

1 место: 2,89%
2 место: 10%
3 место: 1,36%
4 место: 1,73%
5 место: 1,41%

Среднее значение: 3,48%

Средняя плотность в заголовке: 67%
Средняя плотность (контент): 2,6%
Плотность в не контента (навигация, боковые блоки, футер): 0,5%


Определение максимально допустимой безопасной плотности

Одним из стандартных способов определения манипуляций является использование среднеквадратичного отклонения и расчет диапазона наиболее вероятных значений для переменной. Рассчитаем среднеквадратическое отклонение для нашей выборки - СРкв.

СРкв = 3,3%
А это значит, что более чем в 60% случаев плотность данного ключевого слова будет находиться в диапазоне от 0,18% до ~6,8% - такой диапазон плотности мы можем назвать оптимальным и естественным. 

Также на основе правила трех сигм мы можем вычислить критический порог плотности ключевого слова в 13,38%

Вывод расчета:

На основе наших расчетов можно сказать, что максимально допустимое и при этом безопасное с точки зрения обнаружения манипуляций значение плотности ключевого слова на страннице в нашем примере 6,8%.
При превышении этого значения мы приближаемся к переспаму текста. 
На уровне плотности слова 13,38% в большинстве случаев текст можно считать неестественным.

Итоговые данные:

Плотность на странице
Оптимальная: до 6,8%
Критическая: 13,38%

Плотность в заголовке
Оптимальная: до 136,11% (Полтора повторения ключевой фразы)
Критическая: 274,33% (Более двух с половиной повторений ключевой фразы)

Важно!

  • Помните, что данный просчет касается только определенного ключевого слова. И эти значения не стоит применять для других  слов и словосочетаний.
  • Просчет основан на небольшой выборке, по этому полученные данные могут иметь большую погрешность. Цель статьи показать принцип просчета. Поисковые системы используют сложные системы анализа и приведенный в статье принцип лишь верхушка айсберга.
P.S. Очень рекомендую создавать контент прежде всего для людей. При написании качественных статей вы естественным образом получите необходимую плотность ключевых слов. 

И напоследок видео в тему от Мета Катса 


4 комментария:

  1. А что скажите про этот инструмент Megaindex com Анализ текста?

    ОтветитьУдалить
  2. Инструмент хороший, в отличии от многих похожих сервисов дает данные которые действительно полезны при текстовой оптимизации.

    ОтветитьУдалить
  3. Артем, добрый день. А можете объяснить как считать плотность если у меня есть запрос "Картины по номерам" и "купить картины по номерам" как их учитывать между собой или для каждого запроса считать своб плотность ???

    ОтветитьУдалить
  4. Расчет плотности в данный момент не очень полезное занятие, хотя ПС и учитывает плотность как фактор, сейчас куда более важным является то как вы подаете материал в контексте содержания. Но, возвращаясь к вашему вопросу. Я бы рекомендовал вам рассчитать плотность отдельно по каждому слову этих запросов, а потом по биграммам и триграммам входящим в запросы без учета стоп слов. то есть отдельно по: картины, номерам, купить, картины номерам, купить картины, купить картины номерам. Так же, при анализе желательно учитывать слова в разных словоформах.

    ОтветитьУдалить