1. 什么是Sitemap
首先科普下什么是Sitemap(按我自己的理解写的,如果不对,烦请纠正):
Sitemap,顾名思义就是“网站地图”。它是一个xml文件,作用却不仅是地图那么简单,还提供了每个页面的较详细的信息:标题、生成时间、更新频率等。Sitemap中收录的URL是整个网站的精髓。不同的搜索引擎能够识别的Sitemap格式一般不一致(SEOWhy上说格式一致-_-)。
2. Baidu(百度) Sitemap和Google Sitemap
很久之前就把博客做了Google 的Sitemap,用的插件是Google XML Sitemaps,它在网
站根目录自动生成一个sitemap.xml文件,就是我们说的Sitemap:http://blog.kangzj.net/sitemap.xml。可以看到xml的基本单元是url,下面是单独一个单元的结构:
<loc>http://blog.kangzj.net/</loc>
<lastmod>2009-10-01T14:54:05+00:00</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
包括地址、最近修改时间、更新频率和权重几个属性。
最近看到jiucool同学做了百度的sitemap,我也跟着做了一下。用的插件是:Baidu Sitemap Generator(作者:Lc.),这个插件自动在网站根目录生成一个sitemap_baidu.xml,这是我的百度Sitemap:http://blog.kangzj.net/sitemap_baidu.xml。其实百度并没有说明自己通用的Sitemap的格式,只是百度的《互联网论坛收录开放协议》中说到的论坛的Sitemap的格式,wordpress 其实也可以看成是一个论坛【1】,在这个思想的指导下Lc.制作了这个Baidu Sitemap Generator插件。可以看到百度Sitemap与Google的Sitemap不尽相同,它的每个单元是<item>
<link>http://blog.kangzj.net/wordpress-link-info-required-to-proceed-your-request/</link>
<title>WordPress“执行请求操作,连接信息必需提供”解决方法</title>
<pubDate>2009-10-01 22:18:42</pubDate>
<bbs:pick>1</bbs:pick>
每一个item包括地址、标题、发布时间等,可以有更加详细的数据,插件作者貌似只实现了这几个。
3. 怎样让搜索引擎发现Sitemap
我们已经有了Sitemap,但是这个Sitemap是给搜索引擎看的,如果搜索引擎找不到它,那我们就白忙活了,怎样使搜索引擎发现你的Sitemap呢?
- Google:
- (1) 注册管理员工具,直接在后台提交Sitemap地址
- (2) robots中指定:Sitemap: http://blog.kangzj.net/sitemap.xml
- (1) 在robots中指定:Sitemap: http://blog.kangzj.net/sitemap_baidu.xml
- (2) 在首页加上Sitemap文件的链接,等待蜘蛛爬
- (3) UPDATE: jiucool同学提示,可在这里提交百度Sitemap,但需要先人工审核(MS不太容易,没有试):http://news.baidu.com/newsop.html
个人觉得对于Google,直接提交最靠谱;对于百度,两项都要做一下比较保险。
我的robots文件是这样写的(http://blog.kangzj.net/robots.txt):
User-agent: *
Disallow:
Sitemap: http://blog.kangzj.net/sitemap.xml
Sitemap: http://blog.kangzj.net/sitemap_baidu.xml
最后:
推荐一个robots检测工具:http://tool.motoricerca.info/robots-checker.phtml
推荐一个robots生成工具:http://www.mcanerin.com/EN/search-engine/robots-txt.asp
推荐一个在线Sitemap生成器:http://www.sitemapspal.com/
4. 参考资料
- 百度Sitema Generator Plugin:http://www.liucheng.name/?p=884
- 百度Sitemap的详细介绍:http://www.okajax.com/a/200807/0H2O352008.html
- Google Sitemap详解:http://www.seotest.cn/blog/google-sitemap-xiangjie.html
PS: Yahoo, Ask也支持标准的Sitemap协议的,可以在robots.txt中指定。
看了就要回复一下
帮帮我吧,我的博客就是实现不了 Baidu(百度) Sitemap
感觉还有好多没做,大大受益了。。
百度是不是对国外空间的中文网站不感冒?
这个插件有没有ASP的呢?
南方技师学院www.nfgov.com
Baidu Sitemap Generator插件功能确实不错
百度的sitemap和谷歌的sitemap还有区别啊,
有空的做一个百度的sitemap
谢谢你的文章! :)
不错,我也弄了个百度sitemap。哈哈
谷歌的sitemap在哪里制作
受用了,下来试试 🙂
@深夜的蚊子, Baidu很让人让火,做了也不知道有没有用 😡
@kangzj, 确实很让人火大,都好久不收录我的内容了,哎,估计被百度拉黑了吧 😡
哎,我就用了baidu的那个,为了看方便吧
@阿修, 嗯,会生成一个静态的存档页面 😉
再留个印,呵呵,BaiDu对机器人协议不是很遵守啊
@SErHo, 嗯,百度很Bug
这两个插件我也按装了!!
@Lxhome, 唯一的问题就是不知道百度摆不摆sitemap
学习了,确是有很大帮助。 8)
@太阳博客, 其实百度理不理会还真是个问题
我之前的留言没了。。。再留个印
@万戈, 谢谢万戈同学 😥
我的站google都不收,做一个不知会不会好点
@不死鸟, 可以做一个然后到网站管理员工具那里提交下