П О Р Т А Л                            
С Е Т Е В Ы Х                          
П Р О Е К Т О В                        
  
                                                 
Главная

О проекте

Web-мастеру
     HTML & JavaScript
     SSI
     Perl
     PHP
     XML & XSLT
     Unix Shell

MySQL

Безопасность

Хостинг

Другое







Самое читаемое:

Учебник PHP - "Для Чайника".
Просмотров 91337 раз(а).

Иллюстрированный самоучитель по созданию сайтов.
Просмотров 28088 раз(а).

Учебник HTML.
Просмотров 54548 раз(а).

Руководство по PHP5.
Просмотров 25010 раз(а).

Хостинг через призму DNS.
Просмотров 29295 раз(а).

Подборка текстов стандартных документов.
Просмотров 28060 раз(а).

Учебник PHP - Самоучитель
Просмотров 32324 раз(а).

Документация на MySQL (учебник & справочное руководство)
Просмотров 34058 раз(а).

Внешние атаки...
Просмотров 26053 раз(а).

Учебник PHP.
Просмотров 21960 раз(а).

SSI в примерах.
Просмотров 17278 раз(а).



 
 



Руководство по URL преобразованиям
Ограничение доступа

Блокирование роботов

Описание:

Как мы можем заблокировать действительно надоедливых роботов на получение страниц из специфических областей сайта? Файла /robots.txt содержащего записи «Robot Exclusion Protocol» обычно недостаточно для избавления от такого робота.

Решение:

Мы используем набор правил запрещающие доступ для роботов к URL из веб-пространства /~quux/foo/arc/ (возможно это пространство имеет очень глубокую иерархию каталогов, обход которой роботом, привел бы к очень большой нагрузке на сервер). Мы должны убедиться что запрещается доступ только для конкретного робота, т.е. просто запрет для хоста с которого работает робот недостаточен. Это, также блокировало бы доступ пользователей с этого хоста. Этого эффекта мы добьемся проверяя также информацию из HTTP заголовока User-Agent.

RewriteCond %{HTTP_USER_AGENT}   ^NameOfBadRobot.*
RewriteCond %{REMOTE_ADDR}       ^123\.45\.67\.[8-9]$
RewriteRule ^/~quux/foo/arc/.+   -   [F]



[ Назад ] [ Содержание ] [ Вперед ]



 





Copyright © 2005-2011 Project.Net.Ru