sitemap.xml的写法

来源:互联网 发布:邹市明被吹黑哨知乎 编辑:程序博客网 时间:2024/04/27 12:29
sitemap也就是一种用xml写的网站地图,是google创造出来的,但是这个地图和我们所说的网站的地图不一样,sitemap要严格按google的标准来写。
提交sitemap的好处?
提交sitemap有利于搜索引擎的收录,比如动态网页。google登陆一个网站,首先看是否有sitemap这个东西,如果有就先读,没有的话就逐个按站点页面抓取。sitemap就是你网站上页面的信息列表,googlebot就按照这个去一个个的抓取页面。
        <urlset xmlns=http://www.google.com/schemas/sitemap/0.9>
        <url>
        <loc>http://www.sfcai.cn</loc>
        <lastmod>2009-11-08T04:20-08:00</lastmod>
        <changefreq>always</changefreq>
        <priority>1.0</priority>
        </url>
        <url>
        <loc>http://www.sfcai.cn/post/*.html</loc>
        <lastmod>2009-11-08T20:20:36Z</lastmod>
        <changefreq>daily</changefreq>
        <priority>0.8</priority>
        </url>
        </urlset>
        语法很简单。其中priority是指相对于其他页面的优先权,changefreq则是指内容更新的频率。有了这些设置,就等于告诉搜索引擎机器人,你的网站的更新情况如何,以及希望搜索引擎优先收录哪些内容。
<loc></loc>
这两个标签中间的地址必填。格式为:http://www.sfcai.cn/Sitemap_1.xml,此网址应以协议开始(例如:http)并以斜线结尾。此值应少于 2048 个字符。
<lastmod>
可选标签  标签含义:该文件上次修改的日期。此日期应采用 W3C Datetime 格式。如果需要的话,此格式允许省略时间部分,而仅使用 YYYY-MM-DD。 列子:2009-03-06。
        robots.txt文件里还可以直接包括在sitemap文件的链接。就像这样:
        Sitemap: http://www.sfcai.cn/Sitemap_1.xml
<changefreq>
可选标签 标签含义:页面可能发生更改的频率。此值为搜索引擎提供一般性信息,可能与搜索引擎抓取页面的频率不完全相关。有效值为:
always 
hourly 
daily 
weekly 
monthly 
yearly 
never 
值“always”应当用于描述每次访问时都会改变的文档。而值“never”应当用于描述已存档网址。
<priority>
可选标签 此网址的优先级与您网站上其他网址的优先级相关。有效值范围从 0.0 到 1.0。此值不会影响您的网页与其他网站上网页的比较结果,只是告诉搜索引擎您认为您的那个网页最重要,从而它们对您页面的抓取可以按照您最喜欢的方式进行排序。一个网页的默认优先级为 0.5。
xml文件必须是utf-8的编码格式,可以用记事本打开xml然后另存为时选择编码(或转换器)为UTF-8。了解这些标签的作用我们就可以根据自己网站的情况做出适合自己站点sitemap.xml
原创粉丝点击