Содержание
Страницами-сиротами (Orphan Pages) называют такие страницы сайта, которые отдают 200 код ответа, но на которые нельзя попасть посредством изучения сайта.
Страницы существуют сами по себе и больше не участвуют во внутренней перелинковке сайта, потому что на сайте больше не существует ссылок, которые ведут на них.
Такие страницы появляются, когда неправильно работают со структурой сайта, неправильно удаляют страницы, что-то меняют, но при этом не настраивают необходимые редиректы, забывают учесть старую страницу в новой структуре и т.д.
Почему наличие таких страниц негативно влияет на сайт?
- Такие страницы продолжают индексироваться поисковыми системами.
- Страницы не получают внутренний вес сайта и начинают терять трафик и позиции (если они были).
- Так как это зачастую именно “забытые” страницы, то они могут отличаться от новых страниц сайта, так как существуют на старом шаблоне. Или у них может просто быть некорректная верстка после обновлений. Пользователи по-прежнему могут попасть на такие страницы из поиска и будут получать плохой пользовательский опыт.
- Такие страницы могут быть дублями новых и таким образом мешать продвижению других страниц.
Как найти страницы-сироты (Orphan Pages)?
Для поиска таких страниц потребуется программа парсер Screaming Frog Seo Spider.
Далее на примере использования данной программы мы расскажем, как найти такие страницы.
На примере сайта: https://www.skyline-geo.ru/
Задача: — Поиск страниц, на которые не ведет ссылок на сайте, но о которых знает ПС Google.
Для решения задачи необходимо иметь доступ к своему сайту через Google Search Console (кабинет вебмастера Google).
Как это работает: Screaming Frog Seo Spider спарсит ваш сайт и сравнит найденные страницы с данными в GSC. В отчете вы получите список страниц, ссылок на которые нет на сайте, но информация о них есть в Google Search Console.
Давайте разбираться, как такое сделать
- Запустите программу и подключите данные из Search Console в программу парсинга Screaming Frog Seo Spider. Далее Configuration -> API Access -> GSC.
Нажмите кнопку Connect to New Account, откроется браузер, где вы подключитесь к своему аккаунту, далее нажмите кнопку “Разрешить”. В итоге вы увидите вот такую картину.
- В окошках, указанных выше нужно выбрать сайт, на котором вы хотите найти страницы-сироты.
- Предварительно проведите некоторые настройки в Crawl Analysis.
Перейдите в Crawl Analysis -> Configure.
Достаточно там поставить 2 галочки.
- Теперь можно приступить к парсингу сайта.
- Когда сбор информации завершится, то можно приступать к выгрузке нужного отчета.
- Зайдите в Reports -> Orphan Pages.
- Откройте получившийся отчет. Вы получите список страниц, которые известны Гуглу, но парсер не обнаружил ссылок на них на самом сайте.
- Из полученного списка нас интересуют страницы, которые отдают 200 код ответа, то есть реально существующие страницы без внутренней привязки к сайту.
- Таким образом вы получаете реальный список страниц-сирот с которыми нужно работать.
- Проведите анализ списка и поставьте задачи на исправление.
Что делать со страницами-сиротами?
После анализа таких страниц есть несколько путей решения, как с ними поступить:
- Если страница важная и про нее просто забыли, то необходимо проставить на нее ссылку в структуре сайта, чтобы пользователи могли попадать на нее через сайт.
- Если страница является дублем существующей страницы, то необходимо настроить 301 редирект на существующую на сайте страницу.
- Если страница не нужна (например, услуга больше не оказывается компанией), то для такой страницы необходимо настроить 404 код ответа, если нет альтернатив. Стоит отметить, что если на ненужную страницу все еще поступает трафик, то рекомендуется временно настроить 301 редирект на максимально близкую по смыслу страницу, чтобы оставшийся трафик перетек на сайт, иначе вы его просто потеряете.
Практическая польза работы с такими страницами
- Можно найти дубли страниц, которые индексируются поисковыми системами, мешают продвижению основной страницы.
- Восстановить забытые страницы в структуре сайта и дать им новую жизнь, начать получать трафик и клиентов.
- Выявить не корректную работу с ненужными страницами (потерявшими актуальность). Например, при удалении страниц просто удаляют ссылки на них, не настраивая при этом 301 редиректа или 404 кода ответа в случае полного удаления с сайта.