刚刚将其添加到函数中。php:
// Returns TRUE if it\'s a crawler
function check_is_crawler() {
if (isset($_SERVER[\'HTTP_USER_AGENT\']) && preg_match(\'/bot|wget|crawl|google|slurp|spider/i\', $_SERVER[\'HTTP_USER_AGENT\'])) {
return true;
} else {
return false;
}
}
我正在关键功能上使用它,以降低资源使用率。
还创造了一个机器人。包含以下内容的txt:
User-agent: *
Crawl-delay: 10
它会阻止爬虫,这样它们就不会“垃圾邮件”你的网站并消耗你所有的资源
请注意!然而,谷歌根本不喜欢这一点。当访问你的页面时,如果谷歌注意到爬虫和访问者在你的网站上的不同行为,它可能会认为你的网站是垃圾邮件。
谢谢杰克·约翰逊的提示,我将只在内部函数上使用它。这是一个广告网站,有很多东西隐藏起来,无法向用户输出。