Webservice、RSS和Sitemap.xml的思考
Webservice、RSS和Sitemap.xml这三者一般情况下不会把这三者放到一起来思考它们之间的关联,最多将RSS和Sitemap.xml关联到一起来,这里的联想是因为这三者都是XML结构的数据原理,所以就牵强的放到一起来介绍。
Webservice是一个网络交互通信协议 ,通过Http,XML,Soap格式的数据将数据跨平台传输交互,不需要程序对数据库进行直接连接读取,通过连接Webservice提供的API就可以对数据的各种操作获取。在Web应用程序或桌面应用程序中实现异步数据交互,可以脱离主程序的本身执行获取数据库操作。更多详细参考可以连接维基百科Web服务介绍http://zh.wikipedia.org/zh/Web%E6%9C%8D%E5%8A%A1。
RSS一般在大型新闻资讯网站上普遍应用的技术,通过RSS提供一个新闻资讯索引以XML方式呈现,目前RSS2.0已经是所有浏览器网络推广都能解析识别的标准,所以对所有网络客户端还是搜索引擎都能很好的兼容。如果将Webservice联系到一起来对比的话,RSS是一种只读型XML数据, RSS不是Web应用程序,Webservice是一应用程序提供的服务最后结果广泛以XML传送给客户端,能够接受客户端的事件触发从而实现对服务器数据控制。RSS的XML的节点格式是固定的不可以变动,必须遵行它标准格式,而Webservice作为一种应用接口它的xml节点是由程序内部自定义的。RSS的XML结构以<rss version="2.0">嵌套<channel>节点,<channel>再嵌套<description>、<title>、<link>、<copyright>、<item>主要节点,<description>用来描述主节点的介绍说明,<title>主用来描述标题,<link>则是用来连接的URL地址,<copyright>用来描述版权信息,<item>则是子集数据集合也就是新闻索引数据结合,里面有<title>、<category>、<description>、<pubDate>、<link>、<author>主要节点组成,这里的<category>为分类属性如新闻分类,<pubDate>为新闻发布日期,<author>为作者信息,下面是RSS的原文件在各浏览器的显示效果。
Sitemap.xml站点地图是提交给搜索引擎用的站点结构地图,将网站的所有页面结构目录存放在Sitemap.xml文件中,便于网络蜘蛛检索抓取网站页面目录,在大型新闻网站比较常见的,相对于RSS来说Sitemap.xml更加简单仅仅用来存放网站所有页面的URL连接地址。
Sitemap.xml的结构为<urlset>嵌套<url>,在<url>中嵌入<loc>、<lastmod>、<changefreq>、<priority>,<loc>为页面的URL的地址,<lastmod>页面最后修改时间(格式<lastmod>2012-11-12T23:54:53+00:00</lastmod>),<changefreq>页面内容更新频率(提供固定参数Always、Hourly、Daily、Weekly、Monthly、Yearly、Never),<priority>页面的优先权(取值0.0 - 1.0之间 ) 。除此以外也有用<sitemapindex>格式的,在<sitemapindex>中嵌入<sitemap>、<loc>、<lastmod>、<changefreq>、<priority>这种采用的是http://www.sitemaps.org标准。
RSS与Sitemap
Sitemap.xml目前Google、bing、baidu等搜索引擎基本都支持它的解析,和RSS不同的是Sitemap.xml仅仅提供给搜索引擎抓取收录优化用,用户访问是不会看到任何Sitemap.xml的可见数据,RSS作为网站信息索引可以直接收录到浏览器中提供用户浏览索引,这样用户不需要直接访问网站就知道更新了什么新闻博客等信息,RSS同时也可以提交搜索引擎当作站点地图解析网站,这样大大提高了网站收录优化效率。
Webservice与RSS
Webservice作为Web应用服务端的一个应用接口,拥有强大的数据交互功能。而RSS只是相对较小的只读型的数据,RSS只能读取服务端生成的数据,它没有交互操作功能,由于它可以将数据索引XML序列化提供访问,因此也可以用以在某些客户端程序提供小型数据目录读取阅读。RSS其它的功能则是可以为网站优化收录提交给搜索引擎解析。