Содержание
Часто даже специалисты Google не в состоянии полностью объяснить, почему тот или иной сайт занимает определённое место в результатах поиска. В посте описано представление процесса исходя из утечки документации по поисковому алгоритму.
ИНДЕКСАЦИЯ
- Новый контент обнаруживается при помощи карт сайта или внешних ссылок.
- Часто посещаемые страницы, такие как домашняя/главная страница, быстрее передают информацию о новой ссылке в Google.
- Система Trawler анализирует контент и планирует последующие визиты для обновлений.
- Контент проверяется на наличие спама и качество.
- Исходящие ссылки из документа извлекаются и сортируются на внутренние и внешние, что помогает другим системам анализировать ссылки и рассчитывать PageRank.
- Ссылки на изображения передаются в ImageBot, который обрабатывает их с задержкой, помещая в контейнер изображений, а траулер регулирует частоту сканирования в зависимости от трафика сайта.
- Уникальным документам назначается DocID в системе Alexandria.
ОБРАБОТКА ЗАПРОСОВ
- Система QBST анализирует введённый пользователем запрос.
- Ascorer подбирает топ-1000 DocID из инвертированного индекса.
- Superroot перераспределяет результаты, формируя итоговый список из 10 позиций.
ОСНОВНЫЕ СИСТЕМЫ РАНЖИРОВАНИЯ
- Twiddlers: Множество фильтров, которые корректируют ранжирование по различным критериям.
- NavBoost: Анализирует данные о кликах пользователей для улучшения результатов поиска.
- RankLab: Google эксперты проводят исследования и создают новые алгоритмы.
ОСНОВНЫЕ ВЫВОДЫ
- Работайте над узнаваемостью бренда и домена.
- Оптимизируйте заголовки и описания для повышения CTR.
- Удаляйте страницы, которые не приносят пользы.
- Улучшайте структуру страницы.
- Обновляйте и улучшайте текущий контент вместо постоянного создания нового.
- Создавайте качественные обратные ссылки.
- Уделяйте внимание контексту вокруг ссылок (избегайте использования обобщенных выражений, например, «кликни сюда» или «нажмите здесь»).
Информация взята из статьи на Search Engine Land.