?

Log in

No account? Create an account

Previous Entry | Next Entry

Порой веб-мастеру необходимо удалить из поисковой системы уже проиндексированную страницу. К данной операции зачастую прибегают после ошибочного занесения в список карты сайта адреса страницы. С этой ошибкой в свое время столкнулись специалисты компании Мегафон (в итоге sms-сообщения стали доступны пользователям поисковой системы «Яндекс»).


Так, один из наиболее простых способов удаления веб-страницы из архивов поисковиков заключается в физическом удалении, ложном удалении (надо задать атрибут удаленной страницы) и в смене адреса расположения. Поисковый робот после преобразования этой страницы вместо содержимого увидит такую строчку: HTTP/1.1 404 Not Found. Помните, что поисковые роботы могут посещать сайт каждые три часа, а могут всего раз в два дня, может даже в три. Так что требуется выждать некоторое время, чтобы увидеть результат.


Второй способ заключается в редактировании robots.txt, этот файл который определяет путь поисковика, как только он посетил ваш сайт. Данный текстовый документ имеет одно расположение, находится он в корне сайта. Обычно в первом абзаце указывают параметры индексации для Яндекса (его робот существенно отличается от прочих роботов), во втором абзаце уже для всех остальных поисковых систем, вроде google, mail, рамблер, апорт, yahoo.


В начале абзаца требуется указать адреса страниц, которые хотите скрыть — "Disallow: /wp-content/foto/fotojaba.html", а также заголовок агента "User-Agent: *". Также указывайте адреса разделов или страниц, которые вы желаете закрыть от индексации. Учтите, что данный способ не позволит получить быстрых результатов. Когда на сайте новости не транслируются в какие-либо социальные сети, а активность низкая, то обработка новых данных достигает срока в пару дней. Кроме того, потребуется удалить из архива поисковой службы версии данных страниц.


Альтернативный вариант метода прописывания ссылки в файле robots.txt – это использование мета-тега robots. Синтаксис данного тега будет следующим: размещайте его между парными тегами [head] - [/head]. Размещайте значение robots в теге meta name. В итоге это будет выглядеть примерно так: <meta name="robots" content="noindex,nofollow"/>.


Информация предоставлена посредством интернет блога про компьютеры и интернет. Еще компьютерные статьи различных рубрик можете посмотреть у нас по адресу: http://blogitt.ru - свежие, ежедневно добавляемые материалы.

Recent Posts from This Journal

Календурь

December 2018
S M T W T F S
      1
2345678
9101112131415
16171819202122
23242526272829
3031     

В помщь читателям и PR-агентам

Мои данные:

Skype: mobilekid.ru


Этот блог состоит в каталоге
DMOZ

Этот блог порой попадает в
ТОП30 - Рейтинг блогосферы

Это мои посты в разных топах
.

Еще сомневаетесь? Загляните сюда!
Лучший движок для магазина

Рейтинг ведущих компаний по продвижению сайтов Брянска

kwork

А ЕЩЕ Я НА ДОСУГЕ ПОЛУЧАЮ РАЗЛИЧНЫЕ СЕРТИФИКАТЫ
...и это - не все...





Информация
Метрика.ya-watchИндекс цитирования
Счетчик
Поиск по блогу
ЖЖ-мультисёрч


Яндекс-поиск
Яндекс

Google-Поиск

Выгляди умнее!

Толковый Wiki-словарь

 

Wiki-цитатник

 

Google-переводчик

...спасибо за то, что Вы здесь!..
.



mc-yandex


Flag Counter



Метки

Powered by LiveJournal.com