суббота, 23 июля 2011 г.

Поисковые системы – основные принципы (Раздел 2)



Структура и принцип работы поисковых систем.

Поисковая система (поисковик, ПС) – программно-аппаратный комплекс с веб интерфейсом. Осуществляющий функции поиска по сети Интернет.


Части поисковой системы:

WEB Spider (паук) – программа работающая как интернет обозреватель. Служит для получения информации со страниц интернет ресурсов.

Crawler (краулер) – программа обрабатывает ссылки которые связывают страницы и указывает путь пауку.

Indexer (индексер) – программа занимается анализом информации на страницы, текстового и графического наполнения.

Database (база данных) – база данных , в которой храниться индекс поисковой системы и сохраненная информация с проиндексированных веб страниц.

Search results engine (поисковая машина) – программная часть которая осуществляет оценку и сортировку сохраненной информации

Web server (веб сервер)– сервер, который взаимодействует между пользователем и поисковой системой



Поисковой индекс – это рубрикатор по своей сути схожий с оглавлением книги. Технология индекса используется в поисковых машинах для более быстрого доступа и оценки сохраненной информации. При создании поискового индекса  используются элементы математики, лингвистики, конгнетивной психологии и информатики.

В индексе хранится информация о содержании, тематике страницы, соответствии ключевым словам, информация о ссылках страницы и многое другое.

Ранжирование сайтов – сортировка результатов поисковой системы. Компания google учитывает более 200 характеристик для оценки соответствия страницы сайта поисковому запросу.

Из учета всех характеристик ПС формирует релевантность страницы.

Релевантность – это показатель соответствия страницы как информационного ответа относительно запроса поисковой системы. В релевантности учитывается не только лингвистическое соответствие но и применимость «адекватность» данного результата.

Траст сайта (доверие ПС) – одной из характеристик сайта является некое значение «доверия» поисковой системы относительно этого сайта.

Косвенными показателями траста сайта являются численные показатели качества сайта или страницы.

Для ПС google таким показателям является PR

PageRank (пейдж ранк) – назван в честь его изобретателя Лари Пейджа. Изменяется от 0 до 10 также может иметь значение «не определен». По сути, является алгоритмом ссылочного ранжирования, то есть показывает, на сколько определенная страница важнее относительно других страниц учитывая ссылочный вес этих страниц. Также пейдж ранк можно рассматривать как показатель вероятности пребывания пользователя на конкретной странице учитывая только ссылочные связи. Пейдж ранк имеет экспоненциальную природу, это означает, что значение PR 10 в десятки тысяч раз больше чем значение PR 1.

Поисковая система Yandex использует показатель ТИЦ

Тематический индекс цитирования (тИЦ) — технология поисковой машины Яндекс заключающаяся в определении авторитетности интернет-ресурсов с учётом качественной характеристики — ссылок на них с других сайтов. тИЦ рассчитывается по специально разработанному алгоритму, в котором особое значение придаётся тематической близости ресурса и ссылающихся на него сайтов.
ТИЦ определяется суммарным весом ссылающихся сайтов. Не могут влиять на тИЦ сайты, где любой человек может поставить свою ссылку без ведома администратора ресурса.

Продвижение сайтов с точки зрения поисковых систем это:

  • Анализ содержания или структуры вашего сайта
  • Технические рекомендации по разработке веб-сайта, например: хостинг, переадресация, страницы с сообщениями об ошибках, использование JavaScript
  • Разработка содержания
  • Управление кампаниями по развитию бизнеса в Интернете
  • Анализ ключевых слов
  • Обучение в области поисковой оптимизации
  • Опыт работы на определенных рынках и географических территориях


Более подробно с определением SEO можно ознакомиться в справочном центре google
http://www.google.com/support/webmasters/bin/answer.py?hl=ru&answer=35291

Запрещенные методы продвижения подробно описаны в руководстве для веб мастеров компании google
http://www.google.com/support/webmasters/bin/answer.py?answer=35769

Материал подготовлен для обучающего курса Курс Раскрутка сайта и интернет маркетинг с нуля (Курсы SEO) 

1 комментарий: