Малоценные или маловостребованные страницы: как найти и исправить за 1 день

возвращаем в выдачу удаленные алгоритмом страницы

Владельцы сайтов и веб-мастера с мая 2020 года начали сталкиваться с исключением страниц из поиска Яндекса с пометкой «Недостаточно качественные страницы». Совсем недавно они были переименованы и приобрели новый статус «Малоценные или маловостребованные страницы». И в них есть действительно различие. Но главная их опасность состоит в том, что малоценный контент — утопит ваш проект.

обновленный статус в Вебмастере малоценного контента
Новый статус «Недостаточно качественные страницы»

На каких-то ресурсах это носило массовых характер – порой процент таких страниц с плохим контентом доходил до 98 от общей массы сайта, а на других был не так ярко выражен.

Получив токсичную дозу от такого рода документов, веб-проекты просто потеряли много трафика. Даже если на вашем сайте не появились «Малоценные или маловостребованные» — это не гарантирует, что их нет.

Для начала помогу вам разобраться, чем они отличаются друг от друга – малоценные и маловостребованные страницы. Это облегчит вам поиск, идентификацию и профилактику таких страниц с быстрым решением.

Малоценная

Вот как дает определение сам Яндекс:

Страница может быть признана малоценной, если она является дублем или не содержит видимый роботу контент.

То есть переводя на обычный язык, текст страницы просто не уникален относительно других страниц в рамках сайта или еще проще – содержит малоценный и маловостребованный контент. Для этого нужно понять, что может вызывать неуникальность контента.

Любой ресурс состоит из повторяющихся элементов и уникальной части контента. Сквозными блоками являются хеадер, боковое меню, фильтратор для интернет-магазинов, вход в личный кабинет, подвал сайта, а также другие элементы ресурса.

Они дублируются на всем сайте постоянно и тем самым забирают процент уникальности в содержимом страницы. По достижению токсичной дозы алгоритм исключает такую страницу из индексации как абсолютно ничего не значащую.

Почему страница считается малоценной

Самыми частыми причинами являются просто забывчивость разработчиков, некомпетентность оптимизаторов, глупые гипотезы и жажда «мегатонн трафика». Вот список, повторяющийся в 98% всех случаев, которые я выявил с мая 2020 года, проведя более 200 аудитов сайтов:

  • Не закрыта от индексации пагинация страниц.
  • Попадание в индекс Яндекса срезов от фильтратора товаров в интернет-магазинах.
  • Попытка строить отдельные страницы на основе срезов фильтра.
  • Неправильно настроенный умный seo фильтр на CMS Битрикс.
  • Недостаточно полный листинг товаров в разделах.
  • Не рандомизированы похожие товары.
  • Карточки товаров наполнены сквозными блоками и не закрыты от индексации роботом.
  • Отсутствие в карточках полного описания товара, которое и придает странице уникальность.

Конечно, есть и другие ценные детали, не менее важные, но исправление именно этих основных технических ошибок возвращает документы с контентом вашего сайта в индекс.

Маловостребованная

Этот тип связан больше с показателем, насколько релевантен документ основному запросу. Вновь обратимся к Яндексу:

Робот Яндекса проверяет, насколько востребован контент страницы пользователями. Алгоритм оценивает каждую страницу, будет ли она показана по запросам на тех позициях, где пользователь сможет ее найти. Если страница без ошибок в HTML-коде, содержит контент, но в поиске нет пользователей и запросов, на которые она могла бы ответить, страница может быть исключена из поиска как маловостребованная.

Почему страница считается маловостребованной

Тут приведу два простых примера. Один связан чисто с релеватностью, а второй с уникальностью страниц.

Допустим, на странице в метатеге title прописано «Люстры Odeon Light (Одеон Лайт) | Купить с доставкой в Москве и регионах», в H1 «Люстры Odeon Light». А все остальное содержимое указывает на все что угодно, но только не Люстра, а например, высокая плотность по ключам, совсем не связанным с данным разделом. И даже не содержит смысловые факторы, которые описывают товар через LSI. В общем некачественный контент

Облако не релевантное запросу пользователя
Высокая плотность по нерелевантным ключам, которая не отвечает запросу пользователей

Другими словами, робот, заходя на страницу, идет сверху вниз, слева направо, читая метатеги, понимает, что страница о люстрах. Далее, идя по контенту, понимает, что речь идет о всем что угодно, но только не о заявленном ключе. Метит как некачественную и далее выбрасывает из индекса, так как страница не отвечает запросу пользователя. Кстати, для этого есть очень удобный сервис с облаками релевантности.

Второй пример самый банальный. В метатегах нормально, название товара в карточках правильное, но количество в разделе две-три штуки. В итоге окружения шапки, фильтратора и прочих сквозных блоков больше, чем контента, который определяет релевантность страницы. И как следствие мы получаем гибрид малоценного и маловостребованного документа.

Теперь становится ясным, почему такие страницы приобрели новый статус.

Какое влияние оказывают на поисковое продвижение сайта

Безусловно большое.

Одно дело, когда процент малоценных или маловостребованных страниц невысок, ну так скажем 10%, а другое дело, когда они переваливают за 40% – токсичная доза. И вот тут начинаются танцы. Кривая показателя роста сайта меняет свой тренд, начинает неуклонно падать, а в вебмастере малоценных и маловостребованных растет. Сайт теряет трафик со всеми вытекающими.

Наглядная статистика показывает как исключенный контент влияет на показы в поиске
Как зависят эффективные показы

Второй вариант встречается гораздо чаще. Особенно ярко выражен у интернет-магазинов.

Представьте: есть интернет-магазин. На нем представлены в разделе 1000 товаров. У всех карточек товаров есть фотографии, описание, какие-то сквозные элементы, например, по доставке. Вроде контент в норме. Все шло хорошо и на те – вылетает 900 страниц по этому статусу.

Естественно, такие страницы являются сильным понижающим фактором. И таких пострадавших очень и очень много.

Как увидеть «Малоценные или маловостребованные страницы» у себя на сайте

Выявить такие страницы можно только вспомогательными средствами. Яндекс.Вебмастер не всегда показывает все, а только те, которые уже удалил из индекса. Но все по порядку.

Яндекс.Вебмастер

  1. Открыть Вебмастер.
  2. Вкладка «Индексирование» —> «Страницы в поиске», затем во вкладке «Исключённые страницы» устанавливаем статус «Малоценная или маловостребованная».
  3. Проходимся по графику и отмечаем, какой у нас процент токсичности: если процентов 10% – выдохнули, за 20% напряглись, свыше 40% бьем тревогу.
  4. Можно сделать выгрузку и провести сравнительный анализ и выявить точки неуникальности.
Инструкция поиска проблемы в вебмастере
Мануал в Вебмастере

Сторонние сервисы

Визуально

Если вы читаете эту статью, значит, у вас есть уже этот «нежданчик» и проблема для вас актуальна. Тогда смело открывайте сервис по этой ссылке. Достаточно будет бесплатного функционала. Как провести визуальный аудит сайта, можете прочитать в статье.

Обращу внимание только на даты. Если ресурс начал проседать по эффективным показам в период с 04.2020 по 12.2020 – пришли в гости малоценные и маловостребованные. В этот отрезок времени Яндекс вводил в строй новый алгоритм Yati.

сможете увидеть движения ранжирования
Наглядно в Megaindex

Определите процент токсичности и смело переходите к пунктам, описанным ниже.

Далее пойдет речь о платных инструментах, но они дают больше возможностей. Так как за небольшие деньги можно получить не только анализ контента на схожесть и дублирование, но и полный технический аудит сайта.

Wizard.Sape

Проходите по этой ссылке и регистрируетесь. Пополните баланс. Далее:

  1. Открыть вкладку «Технический анализ» —> Ввести адрес сайта —> Нажать ввод.
  2. Выбрать систему Тех. анализ под Яндекс —> Нажать «Провести анализ».
  3. Пойти заниматься своими делами. Анализ выполняется от двух до восьми часов.
  4. Возвращаетесь к пункту 1.
  5. Откроется страница с техническим анализом сайта.
  6. Вам нужен пункт Контент —> Нажать «Показать».
  7. Появятся данные.
мануал по техническому seo
Инструкция в Wizard.Sape

Вот это и будут те самые «Малоценные или маловостребованные страницы»

Все удобно сгруппировано. Показаны ссылки, а также их дубли с контентом. Удобным моментом является то, что можно сделать выгрузку и провести детальный аудит в тех же Google Таблицах. Проведите системный аудит, в чем схожесть контента на страницах, из-за чего робот поиска расценивает их как малоценные.

Как исправить

Решение довольно простое:

  • Завернуть часть сквозного контента в тэг <!—noindex—>Текст, запрещённый к индексированию<!—/noindex—>, более надежней с помощью ajax.
  • На страницах пагинации указать каноничную страницу с помощью атрибута relcanonical«, надежней метатегом ”noindex,nofollow”.
  • Результаты работы фильтра, т.е. срезы можно закрыть от индексации в robots.txt.
  • Cам листинг товаров/услуг рандомизировать с помощью специального скрипта.
  • Внедрить скрипт автонаполнения категорий до необходимого числа единиц товара/услуги.
  • Прописать правильное название товаров в карточках.

Конечно, это не полный список решений, это больше необходимый минимум, который на 60% закроет проблему сайта с малоценными и маловостребованными документами.

Пример: как мы исправили подобные страницы в интернет-магазине и получили рост в поиске Яндекса

На экспресс-аудит поступил интернет-магазин. В сервисе Megaindex тут же была определена проблема – как раз наш «нежданчик». При этом сайт накрывало два раза.

удаление большего количества страниц из индекса поиска яндекса
«Нежданчик» посещал 2 раза

На момент проведения тестов объем малоценных и маловостребованных страниц составлял около 18%. Вроде бы и не так много, но опасность состоит в том, что робот снова обойдет и сделает индексирование, а затем выбросит, как ненужный контент.

Тем самым дав еще больше просадку по эффективным показам. Другими словами, веб ресурс утопится на дно поисковой выдачи в собственных малоценных документах.

Доступными средствами Chrome DevTools было выявлено следующее:

  1. Попадание в индекс страниц пагинаций.
  2. Использование фильтра товаров в качестве генератора новых страниц.
  3. Большой объем дублирующего сквозного контента.

Исправления были сделаны по схеме, описанной выше. Результат не заставил себя долго ждать. Неприятность начала снижаться и сейчас составляет всего 0,68%.

результат технических решений
Результат решений

Итог: рост трафика и позиций в два раза.

результат по трафику на основе Яндекс.Метрика
Результат

Эпилог

Исходя из описанного выше, напрашивается простой вывод. Следите за техническим состоянием сайта – это крайне важно. Появление «малоценных или маловостребованных страниц» c легкостью может утопить ваш проект. Крайне аккуратно используйте модуль для Битрикс «Умный SEO-фильтр». Он требует особого подхода, и как предупреждают сами разработчики:

ВАЖНО: Если превышено допустимое количество свойств или значений в одном из свойств – страница запрещается для индексации роботом с помощью meta-тега “robots=noindex”. Кроме того, в чек-боксе данного свойства не генерируется ЧПУ ссылка для поискового робота.

Проблема решается быстро, буквально за один день. Однако для этого требуются технические специалисты. После внедрения требуется время, примерно 3 недели, и вы сами заметите, как ранее упавший трафик будет восстановлен.

Если статья помогла решить проблему, напишите в комментариях или поделитесь опытом, как вы ее решали.

РЕКОМЕНДУЕМ ПОСМОТРЕТЬ:

Блог об интернет-маркетинге
Есть вопросы? Напишите комментарий

Мы используем cookie-файлы для наилучшего представления нашего сайта. Продолжая использовать этот сайт, вы соглашаетесь с использованием cookie-файлов.
Принять