来自当知百科
跳转到: 导航搜索

目录

XML网页示例

  XML标签说明: 其中带星号标记的为必选项,未带星号标记为可选项。

  *<document>——标记整个XML文件内容的开始和结束。

  *<webSite>——站点地址。

  *<webMaster>——负责人员的Email。当有必要时,我们通过这个地址与您联系。

  *<updatePeri>——更新周期,单位为分钟。搜索引擎将遵照此周期访问该页面,使页面上的新闻更及时地出现在百度新闻中。

  *<item>——标记每篇新闻信息的开始和结束。标记内为单篇新闻信息,不包括新闻专题。

  *<title>——新闻标题。

  *<link>——新闻url地址,与单篇新闻一一对应;若分页的新闻存在多个url,相当于多篇新闻。

  <description>——新闻内容简介。

  *<text>——完整的新闻正文(仅包含正文文字,不包含html标记、图片链接等其它字符)。此项的目的是使该篇新闻更多、更准地出现在搜索结果中。

  *<image>——新闻正文内相关图片;采用绝对地址;若该篇新闻无相关图片,可以为空;若含有多张图片,重复使用该标签。此项的目的是使该篇新闻的相关图片展现在搜索结果中。

  <headlineImg>——为有可能成为头条的新闻制作的头条图,采用绝对地址。

  <keywords>——反映新闻主题内容的一个或多个关键词,关键词之间以空格隔开。此项仅作为参考,检索结果不会完全依赖于此标签中的内容。

  <category>——新闻分类, 可以遵循网站自身的分类体系,最好采用一级分类。

  <author>——新闻作者,可以为机构或个人 。

  <source>——新闻来源,即原创媒体或其它机构 。

  *<pubDate>——新闻发布时间,请精确到分钟;若您网站的发布时间未记录小时分钟,提供年月日即可。

开放协议使用

  开始之前,您需要了解以下几点:

  无论您的网站已经成为百度新闻源,还是尚未被百度新闻搜索收录,您都可以使用此开放协议。

  您使用开放协议提供的内容应全部为符合下面《新闻源收录标准》的新闻信息。

  互联网新闻开放协议只是原始新闻源收录方式的一种协助和有益补充,而不是完全取代。

新闻源收录标准

  百度希望新闻源多样化,鼓励原创新闻内容,如果是具有大量有价值的新闻内容并能及时更新的正规、合法媒体网站,且网站服务器稳定、高速,就符合了百度收录新闻源的基本原则。

  百度新闻搜索收录的内容包括时政、娱乐体育财经、科教文化、社会生活等各类新闻报道媒体评论数码产品房产汽车等行情资讯及评测,各行业的动态及行情,组织机构的工作动态等;是由专业人士撰写或编辑的中文信息;不包括发布的个人信息、论坛、博客、广告、幽默笑话、情感故事、情色、写真、食谱、下载多媒体等其它类型、其它语言互联网信息。

按照网站类型

  可收录的网站类型:综合门户网站、专业新闻网站和地方信息港、报刊杂志及广播电视媒体、专业及行业网站、政府及组织网站;

  不可收录的网站类型:论坛、博客、公司网站、个人网站、港澳台及海外媒体。 按照频道类型

  国内、国际、社会、财经、互联网、体育、娱乐:内容包括新闻报道、媒体评论、以及视频新闻报道;不包括敏感类政治新闻报道,反动新闻;

  房产:内容包括业界新闻动态,家居;不包括房屋租赁信息;

  汽车:内容包括新车导购、试驾;不包括车源信息;

  游戏:内容包括业界新闻动态、游戏攻略、官方新闻;不包括游戏下载;

  健康:内容包括保健养生、健康新闻、疾病预防;不包括食谱、两性话题;

  科技:内容包括手机、数码、电脑产品行情资讯及评测,科普知识,业界新闻;不包括下载、产品报价类信息;

  其他不可收录的分类还包括:个人信息、博客、论坛、广告、招标、报价、下载、试题、教程、招聘信息、幽默笑话、情感故事、情色、写真、剧照、明星档案、食谱;

  百度新闻搜索希望收录高质量的中文新闻,不收录英文等其它非中文新闻;

  您应对提供的全部内容承担一切法律责任,保证您提供内容的真实性、合法性,并不得侵犯任何第三方的权益。

新闻创建步骤

第一步:创建XML文件

  请按遵照上面公布的开放协议内容制作XML文件。

  其它说明: 支持的编码格式有GB2312UTF-8BIG5

  您可以将你网站某一时间段发布的全部新闻放在一个XML文件中,也可以分频道或栏目放在多个XML文件中。

  请保持每个XML文件处于按更新周期持续自动更新状态。

  每个XML文件至多存放最新发布的100条新闻,无需保存之前的新闻。

  请将发布的新闻按照时间排序,即最新发布的新闻在最上端,否则可能有新闻被遗漏。

  XML标签内容中的一些特殊字符必须转换为XML定义的转义字符,否则将发生错误导致搜索引擎不能获取页面上的新闻,具体参见下表。字符转义后的字符

  HTML字符 字符编码

  和(and) & &amp; &

  单引号 ' &apos; '

  双引号 " &quot; "

  大于号 > &gt; >

  小于号 < &lt; <

  转义字符中的"&"无需再转。

第二步:验证XML文件

  下面的位置提供了帮助您验证XML文件结构的多种工具:(参见资料)

  通过验证的XML文件能够使您提供的信息更加标准化,确保您发布的新闻信息不被搜索引擎遗漏。

第三步:提交XML网址

  提交前请将XML文件上传到您的网站服务器,将XML文件的URL地址及其它信息输入下面对应的方框内。搜索引擎将定向访问该URL地址,当URL地址发生变化时需要重新提交。

  百度新闻搜索将对你提交的数据进行测试和观察一周,若您按照互联网新闻开放协议的标准进行制作但存在问题,我们会根据XML页面上提供的邮件地址与您联系。

  注意: 百度新闻搜索不保证一定能收录您提交的全部内容。

  *站点名、地址为必填项。

  站点名 地址

  如:百度 http://news.baidu.com/news.xml

个人工具

变换
查看
操作
导航
工具箱