• home > webfront > SGML > xml >

    详解Sitemap

    Author:[email protected] Date:

    提交sitemap有利于搜索引擎的收录,比如动态网页。google登陆一个网站,首先看是否有sitemap这个东西,如果有就先读,没有的话就逐个按站点页面抓取。sitemap就是你网站上页面的信息列表,google
    sitemap.xml是一种站点地图协议,此协议文件基于早期的robots.txt文件协议,并有所升级。向搜索引擎中提交了sitemap.xml的网站将更有利于搜索引擎网页爬行机器人的爬行索引,这样将提高索引网站内容的效率和准确度。一共有六个标签,changefreq:页面内容更新频率;lastmod:页面最后修改时间;loc:页面永久链接地址;priority:相对于其他页面的优先权(这个标签可以不使用);url:相对于前4个标签的父标签;urlset:相对于前5个标签的父标签。

    建议将 Sitemap 放在 HTML 服务器的根目录中,即 http://www.example.com/sitemap.xml。
    某些情况下,例如您公司网站允许对应不同的目录划分写入权限,这时您或许希望在网站上针对不同的路径创建不同的 Sitemap。
    如果您有上传到 “http://www.example.com/路径/sitemap.xml” 的权限,那么您可以针对 “http://www.example.com/路径/” 创建不同的sitemap 。
    Sitemap 包含的所有网址必须和 Sitemap 位于同一个主机上。
    例如:
    如果Sitemap位于http://www.example.com/sitemap.xml,就不能包含 http://xxx.example.com 中的网址。
    如果Sitemap位于http://www.example.com/路径/sitemap.xml,就不能包含 http://www.example.com 中的网址。 

    网站地图是用xml写的,并且严格按google的标准来写。
    提交sitemap的好处?
    提交sitemap有利于搜索引擎的收录,比如动态网页。google登陆一个网站,首先看是否有sitemap这个东西,如果有就先读,没有的话就逐个按站点页面抓取。sitemap就是你网站上页面的信息列表,googlebot就按照这个去一个个的抓取页面。
           
           
            http://www.fx-why.com
            2009-11-08T04:20-08:00
            always
            1.0
           
           
            http://www.fx-why.com/post/*.html
            2009-11-08T20:20:36Z
            daily
            0.8
           
           
            语法很简单。其中priority是指相对于其他页面的优先权,changefreq则是指内容更新的频率。有了这些设置,就等于告诉搜索引擎机器人,你的网站的更新情况如何,以及希望搜索引擎优先收录哪些内容。
    这两个标签中间的地址必填。格式为:http://www.fx-why.com/about_us.html,此网址应以协议开始(例如:http)并以斜线结尾。此值应少于 2048 个字符。
    可选标签  标签含义:该文件上次修改的日期。此日期应采用 W3C Datetime 格式。如果需要的话,此格式允许省略时间部分,而仅使用 YYYY-MM-DD。 列子:2009-03-06。
            robots.txt文件里还可以直接包括在sitemap文件的链接。就像这样:
            Sitemap: http://www.fx-why.com/sitemap.xml
    可选标签 标签含义:页面可能发生更改的频率。此值为搜索引擎提供一般性信息,可能与搜索引擎抓取页面的频率不完全相关。有效值为:
    always 
    hourly 
    daily 
    weekly 
    monthly 
    yearly 
    never 
    值“always”应当用于描述每次访问时都会改变的文档。而值“never”应当用于描述已存档网址。
    可选标签 此网址的优先级与您网站上其他网址的优先级相关。有效值范围从 0.0 到 1.0。此值不会影响您的网页与其他网站上网页的比较结果,只是告诉搜索引擎您认为您的那个网页最重要,从而它们对您页面的抓取可以按照您最喜欢的方式进行排序。一个网页的默认优先级为 0.5。
    xml文件必须是utf-8的编码格式,可以用记事本打开xml然后另存为时选择编码(或转换器)为UTF-8。了解这些标签的作用我们就可以根据自己网站的情况做出适合自己站点sitemap.xml。

    你可以向搜索引擎提供多个Sitemap文件,但提供的每个Sitemap文件包括的网址不得超过50,000 个,并且未压缩时不能大于10MB 。
     
    向Google提交网站地图Sitemap: 通过网址http://www.google.com/webmasters管理提交;
     
    向Yahoo!提交网站地图Sitemap: 通过网址http://siteexplorer.search.yahoo.com管理提交;
     
    向MSN提交网站地图Sitemap: 用URL直接提交:http://api.moreover.com/ping?u=http%3A//your.domainname/sitemap.xml。这是向MSN直接提交网站地图的后门URL。注意”:”被%3A替换掉。
     
    向ASK提交网站地图Sitemap: 直接提交。http://submissions.ask.com/ping?sitemap=http%3A//your.domainname/sitemap.xml。注意”:”被%3A替换掉。


    转载本站文章《详解Sitemap》,
    请注明出处:https://www.zhoulujun.cn/html/webfront/SGML/xml/2015_0729_194.html