阻止搜索引擎索引页面2、3和更多页面?

时间:2010-10-22 作者:RichZenMaster

您知道如何防止在WP中对超过主页的页面进行索引吗?我是说我不想mysite.com/page/2, mysite.com/page/3 要编制索引。

这是因为我使用home.php 为了我的主题page/2, page/3都是一样的。

请给我一个提示或代码片段,我不想再添加一个插件(robots meta)。

3 个回复
SO网友:Rarst

你到底是如何设置你的主页的?我认为问题首先在于它有不需要的分页,而不是索引分页。

一般来说robots.txt 文件是防止批量索引的好方法。我认为在您的情况下,它将遵循指令(请测试它,这样它就不会在其他地方影响分页):

User-agent: *
Disallow: /page/

SO网友:Axel Metayer

如果是因为搜索引擎优化和谷歌搜索控制台中的警告,这些都可以忽略。wp/Page2等仍应编入索引。这个答案和谷歌的文章:

有一段时间,SEOs认为将noindex robots元标记添加到第2页并进一步添加分页归档可能是一个好主意。这将阻止人们在搜索结果中查找第2页和其他内容。其想法是,搜索引擎仍将跟踪所有这些链接,因此所有链接的页面仍将被正确索引。

问题是,去年年底,谷歌说了一句引起我们注意的话:页面上的长期noindex会导致他们不关注该页面上的链接。这使得将noindex添加到第2页并进一步分页归档文件是一个坏主意,因为这可能会导致您的文章不再获得所需的内部链接。

因为Google在Yoast SEO v6中对长期noindex的评论。3我们删除了将noindex添加到档案子页面的选项。归档文件的第2页及其后一页是否应该有到第1页的规范链接,还是应该有到其自身的规范链接?其想法是,您最希望访问者最终出现在归档文件的第1页。该页面通常与大多数用户最相关。

Google现在非常清楚:分页系列中的每个页面都应该对自己进行规范化,因此/page/2/有一个指向/page/2/的规范。这就是为什么您会看到分页的存档被索引的原因。

要了解更多信息,请参阅本文-https://yoast.com/pagination-seo-best-practices/

SO网友:Roswell Balentien

如果您试图防止重复内容,则应找出问题的根源。您声明您的主页正在使用主页。php模板,这是否包括一些使用主模板传递给所有其他页面的静态文本?如果是这种情况,要么删除它,要么创建一个唯一的主模板,实际上应该是主模板。php。

如果出于任何原因,您希望保留显示与主页相同内容但使用不同URL的页面,您可以始终求助于规范。

如果替换标题的内容。使用下面的php,您可以指定不同的头,其中包括一个规范的头和一个不包含的头。

<?php
if (is_page(\'1\')){
    <?php include(TEMPLATEPATH.\'/header1.php\'); ?>
}
elseif (is_page(\'2\')){
    <?php include(TEMPLATEPATH.\'/header2.php\'); ?>
}
else {
    <?php include(TEMPLATEPATH.\'/headerdefault.php\'); ?>
}
?>
然后你只需确保你包含了引用你主页的规范

<link rel="canonical" href="http://www.yourdomain.com/" />
这将告诉谷歌它正在查看的内容的适当URL是什么,而无需使用插件。

不管怎样,这一切似乎有点奇怪,我担心我只是误解了你的要求,因为它似乎没有意义。您知道重复内容是如何工作的吗?还是我该回去睡觉。

我看不出愿意创建包含相同内容的新页面,而不是寻找防止重复内容的解决方案的目的。

结束

相关推荐

用于WordPress多站点安装的robots.txt存储在哪里?

谷歌网站管理员工具可以看到它,但我找不到它。你知道它是如何生成的,或者它的文件结构在哪里吗?我在我的根目录中看不到该文件。我的网站位于http://mikewills.me 还有机器人。txt文件URL为http://mikewills.me/robots.txt.最后,谷歌没有为我的网站编制索引,我正试图找出如何编辑机器人。txt,以便允许索引。我已经更改了隐私选项以允许索引,但这并没有更新机器人。txt。