ShopEx485.78660版本推出已有一段时日,其中解决了比较多的让人关...
由于近期官方版本更新频繁,各版本对二次开发插件有些许影响...
会员注册失败、订单创建失败!困扰无数ShopEx用户已久的问题终...
分销王2代是基于分销王1代产品基础上,融合了ShopEx十年电商解...
百度开放平台商品搜索合作API说明文档V1.3
目录
商品接入技术说明 2
1类目数据接口 2
1.1类目数据文件格式说明 2
1.2类目数据接口代码示例 2
2商品数据接口 3
2.1 商品数据文件格式说明 3
2.2 商品数据接口代码示例 4
常见问题 6
更新时间:2012-6-30
商品接入技术说明:
1) 简介:新API接口分为3个XML:类目数据XML、全量商品XML、增量商品XML;
类目数据XML(demo:Category.xml,请提供网站的完整类目(建议可与本网站分类同步设置),方便我们做映射,请保持类目数据的同步性);
全量商品XML(demo:data.xml,每天抓取一次,请在每天凌晨3点前全量生成一次);
增量商品XML(demo:update.xml,每30分钟抓取一次,请确保及时更新,更新时无需清空上次数据,每天凌晨3点清空一次即可);
2) 提交新API入口:请贵网站预留出技术排期开发XML文档,上传地址为:http://open.baidu.com/
登录OPEN平台里-PC端资源添加-商品商业-商品购买(mini)-新商品数据 中添加3个XML商品数据资源即可;
1.类目数据XML文件格式说明:(强调类目数据与商家类目同步)
标签名称 标签说明 示例值 标签类型 可选/必选
cid 商家网站的类目ID; 100 数字 必选
name 商家类目名称 服装 字符串 必选
pid 商家父类目ID,若无父类目,则默认为0;若为10,则表示当前类目的父类目ID为10 0 字符串 必选
number 此类目下的商品数量 1000 数字 必选
1.1类目数据XML代码示例:
<?xml version="1.0" encoding="UTF-8"?>
<cats>
<cat>
<cid>100</cid>
<!--商家类目 ID-->
<name>服装</name>
<!--类目名称-->
<pid>0</pid>
<!-- 商家父类目ID,如无父类目则默认为0 -->
<number>1000</number>
<!-- 此类目下的商品数量 -->
</cat>
<cat>
<cid>101</cid>
<!--商家类目 ID-->
<name>男装</name>
<!--类目名称-->
<pid>100</pid>
<!-- 商家父类目ID,如无父类目则默认为0 -->
<number>500</number>
<!-- 此类目下的商品数量 -->
</cat>
<cat>
<cid>102</cid>
<!--商家类目 ID-->
<name>上衣</name>
<!--类目名称-->
<pid>101</pid>
<!-- 商家父类目ID,如无夫类目则默认为0 -->
<number>100</number>
<!-- 此类目下的商品数量 -->
</cat>
</cats>
2. 全量、增量商品数据XML文件格式说明:(注意全量、增量XML样式相同)
标签名称 标签说明 示例值 标签类型 可选/必选
urlset urlset用来标记整个文档的开头;注意:以下各字段,必须按给定的顺序组织 / 必选
url url标记每条商品信息的开始和结束 / 必选
loc 必填;描述商品详细信息页面URL地址,首尾勿带空格、不可见的换行符号 http://www.baidu.com/1232.html
url 必选
lastmod 必填;用来指定该链接的最后更新时间,日期格式为:yyyy-mm-dd 2010-01-05 日期 可选
changefreq 可以不提交该标签;用这个标签告诉此链接可能会出现的更新频率,有效值为:always, hourly,daily,weekly,mothly,yearly,never always 字符串 可选
priority 可以不提交该标签;用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间 1 小数 可选
data 商品数据内容 / 必选
data_id 必填;商品唯一id,能标识商品唯一id; 如商品是淘宝的,就填写加了前缀的淘宝id,如:tb_淘宝id,其他商品填写商家自有id; 商家自有id:12539493846
商品来自淘宝,如:tb_12345 字符串 必选
display display字段为固定格式,必有 / 必选
title 必填;商品名称 ,最大150个字符 ThinkPad SL410(2842-EWC)14.0英寸笔记本电脑 字符串 必选
realtitle 可选填;商品型号或货号:去除修饰词后,能唯一标识此商品的名称,一般是品牌+产品型号的组合,最大50个字符 ThinkPad SL410、千鸟格hm262627 字符串 可选
image 必填;商品图片链接:<br>图片请尽量提供宽度在400px以上的; http://img10.360buyimg.com/S0/4086/0564.jpg
字符串 必选
moreimage 可选填;更多商品图片链接:<br>图片请尽量提供宽度在400px以上的,多个用","区分。 http://img10.360buyimg.com/S0/4086/0564.jpg,http://img10.360buyimg.com/S0/4086/0564.jpg 字符串 可选
originprice 可选填;商品原始价格:<br>保留小数点后两位 5200.00 字符串 可选
price 必填;商品实际价格:最多保留两位小数 4999.00 字符串 必选
brand 选填;商品品牌:当该品牌有中英文两种表示方法时,只要提交其中一个即可。请勿将中英文的品牌混杂在一起提交。否则无法识别准确。无法检索到。 最大50个字符 thinkpad 字符串 可选
cid 必填;商品分类id:多个id用","区分。 101,102 字符串 必填
keywords 必填;商品关键字,可完整描述该商品的名称;keywords词有助于搜索,不得堆砌,需确保所填词能准确描述该商品。
描述词在1至15之间, 不超过5个词组,词组间以"\"分隔,不可空格;最大150个字符 ThinkPad\笔记本电脑 字符串 必选
props 属性项、属性值。不同属性项间以分号分隔,不同属性值间以逗号分隔。最大150个字符 颜色:红色,白色;尺码:35,36,37;风格:日韩;款式:开衫。 文本 可选
services 必填;购买此商品时获得的服务保障:例1~3个6字以内的词,词间以"\"分隔。最大100个字符 正规发票\全国联保\7天退换货 字符串 必选
topay 可选填;是否支持货到付款:0不支持,1支持 字符串 可选
replacement 可选填;支付支持退换货:数字表示可支持退换货的天数,0为不支持。如“7”表示支持7天之内支持退换货 7 字符串 可选
store 必填;商家名,最大10个字符; 京东商城 字符串 必选
stock 必填;商品状态标记:0表示正常;1表示缺货;2表示下架。 字符串 必选
post_fee 必填;是否包邮:0表示不支持;1表示支持 字符串 必填
description 可选填;商品描述:以100字内为佳,不得包含html代码。 SL410概述。The SL410 与上一代SL400系列相比,有了很大的变化:更轻的系统更薄的尺寸(新型的SL系列产品比过去的型号薄4mm,轻12%。 字符串 可选
city 可选填;商品所在地:多个地址间以"\"隔开 北京\上海\广州 字符串 可选
comments 可选填;商品评论条数 150 字符串 可选
commentsurl 可选填;商品评论的链接 http://club.360buy.com/review/199485-1-1.html
url 可选
commentsnote 可选填;商品评论的内容,多个评论请重复此字段 问号|2010-12-12 12:12:12|商品很不错。 文本 可选
expirationdate 可选填;商品下架日期,日期格式为:yyyy-mm-dd 2010-02-09 字符串 可选
score 可选填,b2c商家需填写该商品真正评分,例如 5分\5分;Pintrest商家填写该商品用户喜欢数量,例如 1000 4\5 字符串 可选
barcode 可选填;商品条形码 12312123132123 字符串 可选
mloc 可选填;移动端描述商品详细信息页面URL地址,首尾勿带空格、不可见的换行符号 http://m.baidu.com
url 可选
jumploc Pintreste商家必填,为商品购买跳转的url,例如http://www.zhimei.com/outer/1396352,B2C网站无需填写,首尾勿带空格、不可见的换行符号; http://www.zhimei.com/outer/1396352 url 可选
(注:标红为新加或需要谨慎填写字段)
2.1全量、增量商品数据XML代码示例: (注意全量、增量XML样式相同)
<?xml version="1.0" encoding="UTF-8" ?>
- <urlset>
- <!-- urlset用来标记整个文档的开头;注意:以下各字段,必须按给定的顺序组织
-->
- <url>
- <!-- url标记每条商品信息的开始和结束
-->
<loc>http://baidu.com/1232.html</loc>
- <!-- 必填;描述商品详细信息页面URL地址,首尾勿带空格、不可见的换行符号
-->
<lastmod>2010-01-01</lastmod>
- <!-- 必填;用来指定该链接的最后更新时间,日期格式为:yyyy-mm-dd
-->
<changefreq>always</changefreq>
- <!-- 可以不提交该标签;用这个标签告诉此链接可能会出现的更新频率,有效值为:always, hourly,daily,weekly,mothly,yearly,never
-->
<priority>1.0</priority>
- <!-- 可以不提交该标签;用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间
-->
- <data>
-<!-- 商品数据内容
-->
- <display>
<data_id>1233433</data_id>
- <!-- 必填;商品唯一id,最大150个字符,eg:淘宝:id=12539493846 -->
<title>ThinkPad SL410(2842-EWC)14.0英寸笔记本电脑</title>
- <!-- 必填;商品名称 最大150个字符
-->
<realtitle>ThinkPad SL410</realtitle>
- <!-- 可选填;商品货号 最大50个字符
-->
<image>http://img10.360buyimg.com/S0/4086/0564dcd5-a1a6-4d97-9479-cec90186e065.jpg</image>
- <!-- 必填;商品图片链接:<br>图片请尽量提供宽度在400px以上的。
-->
<moreimage>http://img10.360buyimg.com/S0/4086/0564dcd5-a1a6-4d97-9479-cec90186e065.jpg,http://img10.360buyimg.com/S0/4086/0564dcd5-a1a6-4d97-9479-cec90186e065.jpg,http://img10.360buyimg.com/S0/4086/0564dcd5-a1a6-4d97-9479-cec90186e065.jpg</moreimage>
- <!-- 可选填;更多商品图片链接:<br>图片请尽量提供宽度在400px以上的,多个用","区分。
-->
<originprice>5200.00</originprice>
- <!-- 可选填;商品原价:<br>保留小数点后两位
-->
<price>4999.00</price>
- <!-- 必填;商品实际价格:<br>保留小数点后两位
-->
<brand>ThinkPad</brand>
- <!-- 可选填;商品品牌:<br>当该品牌有中英文两种表示方法时,只要提交其中一个即可。请勿将中英文的品牌混杂在一起提交。否则无法识别准确。无法检索到。
-->
<cid>101,102</cid>
- <!-- 必填;商品分类id:<br>多个id用","区分。
-->
<keywords>ThinkPad\笔记本电脑</keywords>
- <!-- 必填:商品关键字有助于搜索<br>另:keywords词不得堆砌,需确保所填词能准确描述该商品。<br>不能超过5个,词间以"\"分隔。 最大150个字符
-->
<props>颜色:红色,白色;cpu:至强;屏幕:14寸;</props>
- <!-- 可选填;属性项、属性值。不同属性项间以分号分隔,不同属性值间以逗号分隔。如:颜色:红色,白色;尺码:35,36,37;风格:日韩;款式:开衫。 最大150个字符
-->
<services>正规发票\全国联保\7天退换货</services>
- <!-- 必填;购买此商品时获得的服务保障:<br>例1~3个6字以内的词,词间以"\"分隔。 最大100个字符
-->
<topay>0</topay>
- <!-- 可选填;是否支持货到付款:<br>0不支持,1支持
-->
<replacement>7</replacement>
- <!-- 可选填;支付支持退换货:<br>数字表示可支持退换货的天数,0为不支持
-->
<store>京东商城</store>
- <!-- 必填;商家名 最大10个字符
-->
<stock>0</stock>
- <!-- 必填;商品状态标记:<br>0表示正常;1表示缺货;2表示下架。
-->
<post_fee>0</post_fee>
- <!-- 必填;是否包邮:<br>0表示不支持;1表示支持
-->
<description>SL410概述。The SL410 与上一代SL400系列相比,有了很大的变化:更轻的系统更薄的尺寸(新型的SL系列产品比过去的型号薄4mm,轻12%,意味着其具有更好的便携性),采用镜面屏,最佳尺寸的显示面板,强大的多媒体, 多点触摸技术, 更快的系统内存带来更好的用户体验。</description>
- <!-- 可选填;商品描述:<br>以100字内为佳,不得包含html代码。
-->
<city>北京\上海\广州</city>
- <!-- 可选填;商品所在地:<br>多个地址间以"\"隔开 最大50个字符
-->
<comments>150</comments>
- <!-- 可选填;商品评论条数
-->
<commentsurl>http://club.360buy.com/review/199485-1-1.html</commentsurl>
- <!-- 可选填;商品评论的链接
-->
<commentsnote>问号|2010-12-12 12:12:12|商品很不错。</commentsnote>
- <!-- 可选填;商品评论的内容,多个评论请重复此字段 最大500个字符
-->
<expirationdate>2010-11-25</expirationdate>
- <!-- 可选填;商品下架日期,日期格式为:yyyy-mm-dd
-->
<score>4\5</score>
- <!-- b2c商家需填写该商品真正评分,例如 5分\5分;pintrest商家填写该商品用户喜欢数量,例如 1000
-->
<barcode>12312123132123</barcode>
- <!-- 可选填;商品条形码
-->
<mloc>http://m.baidu.com/3443.html</mloc>
- <!-- 可选填;移动端描述商品详细信息页面URL地址,首尾勿带空格、不可见的换行符号
-->
<jumploc>http://www.baidu.com/143321/</jumploc>
- <!-- pintreste商家必填,为商品购买跳转的url,例如 http://www.zhimei.com/outer/1396352,B2C网站无需填写,首尾勿带空格、不可见的换行符号
-->
</display>
- <!-- display字段为固定格式,必有
-->
</data>
</url>
常见问题
1、为什么做此次API格式升级?
首先,新格式减少了商家成本,只需商家按其自有类目及商品数据提交即可,分类和商品匹配由商品搜索技术完成。其次,新格式完善商品搜索类目体系,增加商家商品展现量。
对于商户优化分类和属性起到了很大作用,后台抓取也会比之前明显和精准,商品抓取精准,对用户搜索和流量的提升是一定的;
2、我的商品页的数据量很大(多于10MB),提交时需要注意什么?
每个文件最多可包含5000个url,并且文件在压缩前不得超过 10MB(10,485,760 字节)。如果超过10MB,必须将其分割成多个文本文件,并提供索引文件,索引文件格式如下:
<?xml version="1.0" encoding="utf-8" ?>
<sitemapindex>
<sitemap>
<loc>http://www.shangpin.com/url1.xml</loc>
<lastmod>2010-04-26</lastmod>
</sitemap>
<sitemap>
<loc>http://www.shangpin.com/ url2.xml</loc>
<lastmod>2010-04-26</lastmod>
</sitemap>
</sitemapindex>
3、我是老用户,请问新格式与老格式有什么区别?
为了商品资源有更多的展现维度,从而使商家资源有更多的展现机会,故对原API格式进行升级(具体字段见上表标红处),主要变化有:
(1)老API中:Tags字段为层级分类+关键字。新API中:取消Tags字段。商品分类信息通过填写cid字段完善。keywords为商品关键字,若有多个关键字描述该商品,则用“\”符号隔开。
(2)添加了更加丰富的商品维度,如“是否货到付款”等等
4、XML在格式方面是否有通用规范?
支持的编码格式为UTF-8和gbk,推荐使用utf-8编码。注意:XML文件头部的encoding
值必须与XML文件的实际编码类型一致。
另外,建议最好使用 gzip 压缩文件,否则不要压缩。
5、某些必选字段看起来必未展现,为何需要填写?
虽未展现,但是我们计算相关性和排序的重要依据。部分字段虽未在页面前端展现,但是我们用以协助进行资源筛选和检索结果排序的重要依据。
6、< score >商品评分 填写要求:
可选填,b2c商家需填写该商品真正评分,例如 5分\5分;
pintrest商家填写该商品用户喜欢数量,例如 1000;
建议填写,会影响优质资源的排序;
7、<jumploc>商品购买地址 填写要求:
Pintreste商家必填,为商品购买跳转的url,例如 http://www.zhimei.com/outer/1396352;
B2C网站无需填写,首尾勿带空格、不可见的换行符号
8. < mloc >移动端属性 填写要求:
可选填;移动端描述商品详细信息页面URL地址,首尾勿带空格、不可见的换行符号;
建议商家有移动端必填写,会对无线商品搜索切入;
9、<data_id >填写要求:
必填项;如为淘宝客类网站,商品唯一id,如商品是淘宝的,就填写加了前缀的淘宝id,如:tb_12345;
其他商品填写商家自有id即可;
10、<expirationdate>商品下架日期 填写要求:
可选填;商品下架日期,日期格式为:yyyy-mm-dd
建议填写,会影响优质资源的展示和排序;如无此数据,建议删除此字段,不要为空;
11、请保证您提交的xml文件地址和文件包含URL的域名保持一致。
12、新API接口不可在旧接口上修改,需要重新开发新接口,请周知;
13、新API接口特别对于3C类目中:comments (评论数)、score (评分)、mloc(移动网页URL); 必须要填,这几个字段无线商品搜索都需要。
标签:商品说明搜索百度文档API开放平台 | |
上一篇:重要提醒:请最近升级了ShopEx安全补丁的朋友联系本站客服进行插件的同步更新升级! | 下一篇:升级通知:shopex一淘(etao)整合商品收录feed接口更新V1.8,请联系客服! |