我的WordPress这样SEO (3)-robots.txt

在继续说明如何采用实际方法进行WordPress的SEO优化前,我插入了这一篇:robots.txt。

什么是robots.txt?其实它只是一个放在网站根目录内,并且记了些文字的文本文件罢了。但它是如何在网站的SEO优化中起到作用的呢?简单的说就是,搜索引擎会根据robots.txt的内容“按规操作”。哪些内容应该搜索,哪些内容不应该搜索,全部都由robots.txt来指挥。

那我们应该如何设置robots.txt的内容呢?以下是我自己的设定,适合WordPress使用的:

User-agent: *
# disallow all files in these directories
Disallow: /cgi-bin/
Disallow: /z/j/
Disallow: /z/c/
Disallow: /stats/
Disallow: /dh_
Disallow: /about/
Disallow: /contact/
Disallow: /tag/
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /contact
Disallow: /manual
Disallow: /manual/*
Disallow: /phpmanual/
Disallow: /category/
Disallow: /wp-
Disallow: /feed/
Disallow: /trackback/
Disallow: */feed*
Disallow: */trackback

User-agent: Googlebot
# disallow all files ending with these extensions
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.css$
Disallow: /*.gz$
Disallow: /*.wmv$
Disallow: /*.cgi$
Disallow: /*.xhtml$

# disallow all files with ? in url
Disallow: /*?*

# disable duggmirror
User-agent: duggmirror
Disallow: /
# allow google image bot to search all images
User-agent: Googlebot-Image
Disallow:
Allow: /*

# allow adsense bot on entire site
User-agent: Mediapartners-Google*
Disallow:
Allow: /*

你可以把它复制,然后另存为robots.txt并放在你的WordPress根目录下就行了。

请注意下面的一句:

# disallow all files with ? in url
Disallow: /*?*

上面的那句是让搜索引擎不去搜索所有带“?”的网址。如果你的WordPress的链接形式是默认的那一种:yourweb.com/?pxx的形式的话,请把它删掉。

这样,搜索引擎在搜索我们的网站时才会显得更有效率,避免了浪费时间什么的去搜索一些无意义的目录,如是wp-admin/这一类目录。我们也能通过robots.txt更好的让自己的网站被收录。所以,如果你的WordPress还没有robots.txt,赶快设置一个吧!

你正在浏览《我的WordPress这样SEO》的最新篇。如果你想查看已经发表的该专题所有文章,请点击这里。你也可以通过订阅本站文章(RSS),方便留意本专题的最新动向。

Technorati tags: robot.txt, SEO, WordPress, Google

 

 

分类:WordPress;标签:;收藏本文的永久链接

50 Responses to “我的WordPress这样SEO (3)-robots.txt”

  1. rse43 回复此留言 2007/04/04 10:52 #comment-1391

    为什么只禁止GoogleBot对诸如php文件的查找呢

    不是应该禁止所有的UserAgent么

  2. wady 回复此留言 2007/04/05 15:42 #comment-1392

    Google 有代码搜索……

  3. dupola 回复此留言 2007/04/11 01:48 #comment-1393

    好贴。哈哈。

  4. 我心红蓝 回复此留言 2007/05/04 15:21 #comment-1395

    有个问题:我的地址是./blog,是不是Disallow: /cgi-bin/这个都要改成Disallow: /blog/cgi-bin/?

  5. Jinwen 回复此留言 2007/05/04 15:51 #comment-1396

    只要把robots.txt文件放在/blog目录下就不用了。

  6. 我心红蓝 回复此留言 2007/05/05 09:39 #comment-1397

    [quote comment="1204"]只要把robots.txt文件放在/blog目录下就不用了。[/quote]
    谢谢了

  7. xiangge 回复此留言 2007/05/25 15:41 #comment-1398

    受益良多,感谢!

  8. jack pei 回复此留言 2007/07/09 09:25 #comment-1403

    怎么用啊.我现在用的是YO2的,我能把这些上传上去吗?我该好如何来操作.请指点.谢谢!

  9. 飞龙 回复此留言 2007/09/05 08:56 #comment-1406

    好文章哦。谢谢。

  10. 飞龙在天 回复此留言 2007/10/05 09:23 #comment-1409

    我重新写了一个。不知道对不? :roll:

  11. jxmoonblog 回复此留言 2007/11/02 11:46 #comment-1410

    为什么goolge只收了分类

  12. 果子 回复此留言 2007/12/18 14:38 #comment-1412

    有用,这就试试啦

  13. Gr.Zhang 回复此留言 2008/03/16 16:58 #comment-1417

    喜欢,借鉴,学习

    Gr.Zhang's last blog post..搜狐和赵薇的”博客营销”走了不寻常路!

  14. 之后 回复此留言 2008/03/17 11:45 #comment-1416

    我的tag使这种形式的:/index.php/tag/
    是不是要写成这样Disallow: */tag*

    之后's last blog post..关于使用IE浏览器浏览本站页面自动弹出迅雷下载的问题

  15. Jinwen 回复此留言 2008/03/17 15:12 #comment-1415

    这样写是可以的了。

  16. stephen 回复此留言 2008/03/29 02:08 #comment-1418

    好文章,谢谢分享。。。

    stephen's last blog post..Hi~~~百度

  17. FightingMan 回复此留言 2008/05/23 17:02 #comment-1421

    试试

  18. 北街 回复此留言 2008/07/03 11:41 #comment-1422

    很赞,学习!

  19. 午夜客 回复此留言 2008/10/08 03:00 #comment-1425

    很好。省下了我去麻烦写。

    直接COPY了

    http://blog.wyk.net.ru/robots.txt

  20. Shawn 回复此留言 2008/10/25 20:27 #comment-1427

    这个不是一般的夸张,没必要如此,真的。Google 不会主动去收录特定类型的文件,除非他们是页面。Google 更不会去收录 css 和 js,因为对搜索引擎来说,这些外部文件都不是考虑的因素。。。。

  21. Shawn 回复此留言 2008/10/25 20:31 #comment-1428

    对了,robots.txt 切忌不要拿来"通用",除非用的站点和你的链接结构完全一样。
    还有,一些东西即使用在你自己这里也错了。以 trackback 为例,正确的书写方法是 /*/*/trackback(基于你的永久链接形式),你写作 /trackback,只会禁止 Google 抓取 http://www.saywp.com/trackback 这个路径的内容。。。

  22. 林晨 回复此留言 2008/11/04 12:49 #comment-1424

    是不是所有WordPress版本都通用?链接结构为“年/月/文章名.html”通用吗?

  23. 我不知手机小说 回复此留言 2008/12/05 13:20 #comment-3460

    顶~~~~我叫我不知手机小说,希望能交个朋友哈!

  24. tomchen1989 回复此留言 2009/02/12 19:23 #comment-4429

    为啥wen姐现在的robots.txt这么简单?
    还有wen姐把文章和评论里的原地址“smartr.cn”都用php过滤替换成了“www.saywp.com”么?

    • Jinwen 回复此留言 2009/02/12 19:32 #comment-4432

      我是男的!我没用过滤啊,只是在换域名时候直接把数据库替换了。

  25. tomchen1989 回复此留言 2009/02/12 19:27 #comment-4431

    。。。。。。楼上的xhtml的尖括号又写成bbcode了= =。。连发3贴真不好意思= =||

  26. tomchen1989 回复此留言 2009/02/12 19:39 #comment-4433

    原来是男的啊,继续囧= =||

  27. 小问 回复此留言 2009/02/16 09:04 #comment-4465

    谢谢提供,参考了一下。

  28. jack 回复此留言 2011/03/20 18:27 #comment-18254

    通用性不强,简单的问题搞复杂了 :?:


The trackbacks and pingpacks: