Пост навеян аудитом, который я получил для ознакомления, когда приступил к работе над новым сайтом. Аудит был сделан два года назад одной крупной компанией на рынке SEO. Настолько крупной, что даже присутствует в ТОП-10 по запросу «продвижение сайтов» 🙂 Даю выдержку с одной из страниц:

Все повторяющиеся блоки (то есть неуникальные для каждой странице) необходимо закрыть от индексации в поисковых системах. При этом повысить ценность содержания каждой страницы в глазах поисковой системы.

<!—googleoff: all—>
<!—noindex—>
БЛОК
<!—/noindex—>
<!—googleon: all—>

<!—noindex—><!—/noindex—> используется для Яндексе. Спору нет.

А вот теги <!—googleoff: all—> и <!—googleon: all—> вызывают интерес. Якобы с их помощью можно закрыть часть контента на странице от индексации поисковым роботом Google.

В инете вообще много лишнего шума. В сфере SEO тоже. Много непроверенной информации, каждый пишет свое мнение, куча недоблоггеров с копипастом и рерайтом. Проверяйте информацию, господа, ищите первоисточник и думайте головой. Я встречал немало блогов, где автор на полном серьезе пишет то, во что ВЕРИТ, не предъявляя к своей информации требований достоверности.

Разберемся по порядку — что это за теги googleoff/googleon?

Порывшись в интернете (буржуйском) попадаем на страничку http://www4.uwm.edu/search/info/onofftag.cfm, где русским английским языком написано следующее:

The googleoff/googleon tags disable the indexing of a part of a web page. The result is that those pages do not appear in search results when users search for the tagged word or phrase.

Перевод: теги googleoff/googleon запрещают индексировать часть страницы. Результатом будет то, что данный кусок страницы не будет появляться в результатах поиска, если искать по слову или фразе из этого куска текста. «О, как замечательно!» — подумает вебмастер или сеошник, — «это же практически <noindex> для Google!». Но если пробежаться глазами дальше, то мы увидим, что не все так просто:

You can use googleon/off to tell the Google Search Appliance to ignore portions of a page. Insert <!—googleoff: index—> at the point you want the Google Search Appliance to stop indexing, then insert <!—googleon: index—> where you want it to resume indexing the page.

Перевод: если коротко, в этом абзаце объясняется, что интересные нам теги используются в неком Google Search Appliance. Опа! Что же это за GSA? Обратимся к первоисточнику:

Google Search Appliance – это универсальное бизнес-решение, в котором эффективные технологии Google Поиска дополнены функциями, специально разработанными для нужд современных компаний. Подробнее: http://www.google.com/work/search/products/gsa.html

Т.е. это некое корпоративное решение для бизнесов, которые хотят устроить поиск по своим базами данных (как-то так это я понял). Никакого отношения данные теги к основному поиска Google не имеют!

Google Search ApplianceА вот и он во всей красе. Вот такой вот желтенький, а сколько проблем с информационным шумом))

«А вдруг все-таки что-то тут не так», — подумаете вы. Нужны еще доказательства!

Вот вам с официального форума Google для помощи вебмастерам универсальный ответ. И мой частичный вольный перевод:

  1. Google робот попадает всюду. Вот так он работает. Если есть страница, у нее есть адрес, значит Googlebot туда попадет
  2. Google проиндексирует все, что он найдет. Если Google нашел страницу, то он ее проиндексирует полностью.
  3. Google ранжирует все, что проиндексирует. Если Google включил страничку в индекс, значит, он будет ее ранжировать
  4. Как запретить Google индексировать часть страницы? Никак**. Если это часть страницы, то она будет проиндексирована в любом случае. Никаким мета-тегом, html-тегом нельзя заставить робота Google игнорировать часть страницы.

** Опустим здесь возможности javascript, ajax или фреймов.

Если же и ответ на форуме для вас — пустой звук, то посмотрите видео руководителя отдела Google по борьбе с веб-спамом Мэта Каттса (еще лысенького) от 2010 года.

Он так прямо и заявляет, что, мол, идея-то хорошая: исключать часть страницы, чтобы ее не индексировать, но, говорит, такого у нас нет, мы считаем это не важным. Google робот сам поймет, что индексировать, а что нет.

P.S. Проведем маленький эксперимент. Заключим весь этот текст в наши теги, проверим, как будут обстоят дела с индексацией. По логике текст не должен быть проиндексирован.

UPD. Прошло две недели. Проверка эксперимента: ищем в Google по куску из текста в кавычках… и находим.

Раз

Пост навеян аудитом

Два

Перевод: теги Google on/off

Три

Использование тегов

Вывод: все вышеописанное правда на октябрь-ноябрь 2014 года.

UPD: и на 2017 год тоже https://goo.gl/NoHZg7

plugins

Рубрика:

4 мысли о “Использование тегов googleoff, googleon

  1. Спасибо за пост-)

  2. Спасибо! Полезно!!!

  3. Valik:

    статья хорошо написано но счас 2017 год Может что изменилось=)))))

    1. JSB:

      ничего не изменилось. https://goo.gl/NoHZg7

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *