淘宝网作为国内最大的综合性电商平台,以其庞大的用户群体赢得了众多淘宝卖家的加入,从而也引发了这些淘宝商家之间的剧烈竞争,这样的局面使得淘宝站内搜索(淘宝SEO)尤为重要,今天协策网络公司给大家分享淘宝站内搜索排名算法的一些知识。(特别提示:本人并不是完全懂得淘宝搜索的算法体系,由于影响淘宝搜索排序结果的因素有很多,而且这些因素很不稳定,所以至今没有一个人完全通晓淘宝搜索算法体系,请大家不要听信网络上一些所谓完全掌握淘宝搜索算法的不靠谱的言论。)
在此我只是通过我多年对淘宝搜索的观察和研究,同时结合淘宝网官方给出的宝贝优化建议和大量淘宝店铺指标数据分析总结,对淘宝站内搜索算法进行一些揣摩和猜测,从而达到搜索结果排名靠前的目的。在此声明:本人不承接任何淘宝搜索排名算法破解和店铺优化托管的业务,请不要加我来询问此类事宜。
淘宝站内搜索的工作原理其实和大部分搜索引擎的原理是大体相同的,下面我给出两张示意图来给大家讲解,方便大家理解,请不要太过纠结以下技术实现原理,我们只要通晓大概实现流程即可。
数据存储分词示意图
淘宝商家首先在后台上传宝贝,然后淘宝的信息(产品)存储服务器对这些宝贝进行存储、预处理、分词,最后建立文档数据库与倒排索引数据库,倒排索引数据库官方解释:http://baike.baidu.com/link?url=EQLQJgUyN_Q2zVz1hBXaUE4y8ZgHy5y_NkWCuvFxqXuQj3_4b4iiy0Gdua4M3ER8XA-bHNkaeiY9SgGUkaD-la,最后将处理结果通知给索引服务器,以等待前台用户搜索时使用。
用户请求数据示意图
等待数据录入分析处理后,前台用户进行搜索请求时,程序会将搜索请求发送给索引服务器,然后索引服务器将相关“关键词”提交到倒排索引数据库进行相关数据查询匹配,然后结合文档服务器,将查询结果提交给算法体系(我们今天研究的淘宝站内搜索算法),进行排序处理,最后用户就看到了相关搜索结果页面。
下面我们正式讲解淘宝站内搜索算法的知识,我将算法体系大致分为三大类:
一:相关性
不管在任何搜索引擎,关键词的相关性都是获取数据库数据的唯一有效途径,但是由于电子商务类型网站的特殊性,不得不引入产品类目概念,淘宝网也不例外。
1.关键词匹配度:这点是比较好理解的,就是客户搜索什么关键词,你的宝贝标题一定要包含该关键词,或者是与关键词为同义词。但是在撰写宝贝标题时,一定要注意关键词的组合和搜索引擎的分词。
2.类目匹配:在淘宝搜索引擎词典数据库内,关键词和类目是一一对应的关系,所以当前台客户搜索某个关键词的时候,程序是优先去找与该关键词所对于的类目去取数据的。
但是由于淘宝搜索引擎加入了程序自学习的功能,在一个相同关键词代表两种不同产品的时候,程序会自动优先展示历史客户最喜爱的类目的产品。
3.产品属性:搜索引擎会根据每个类目的产品属性不相同,然后针对不同类目对商家录入产品的属性进行分析后提取相应的唯一特征;或者是对单一产品属性值进行匹配索引来调整排序(例如:男装下的夹克类目,商家在录入产品后可以选择面料,例如商家选择了聚酯纤维),当前台客户搜索“聚酯纤维 夹克 男”即使你的宝贝标题没有聚酯纤维该关键词,只要你别的指标都达到了排名指标,你的宝贝一样能有比较理想的排名。
二:置信度
由于淘宝网对商家需要进行管控和约束,官方希望所有商家都能在一个诚信的环境下公平竞争交易,所以就推出了置信度的概念。
1.作弊处罚:对于一些作弊行为(包括大家比较关注的X单作弊),淘宝网的稽查系统是会对全网(或者特定类目)进行扫描,然后将可疑的产品进行提取,最后有人工进行筛选确定,从而做出相应的违规处罚。对于一些扣分商家将予以排名靠后处理。对于如何防止逃避淘宝的稽查系统,我会在后续文章中讲解,请大家期待。
2.保障服务:淘宝网为了更好的服务客户,推出了一系列的保障服务,常见的有:消费者保障服务、金牌卖家、7天无理由退货、运费险等等。这些保障服务对搜索排名靠前是有加分的,这些没有任何技巧可循,如果您有能力或者机会的话,建议能开通的全部开通。
三:微调指标
为了调动淘宝卖家的积极性,也为了淘宝用户能体验到较好的用户体验,所以官方提出了一系列评判该店铺是否优质的指标,从而来达到干扰排序结果的目的。
1.店铺原始权重:这里就有比较常见的DSR动态评分、退款速度、平均旺旺在线时长、旺旺相应速度、全店全店转换率、全店投诉举报率、全店支付宝使用率、全店回头客所占比例、店铺人气指数等等。
2.单款宝贝权重:单品历史销售量、历史单品成交金额、单品特定时间区域转化率、单品人气指数、收藏数量、特定时间区域单品退款率、特定时间区域单品投诉举报情况、单品浏览次数、单品特定时间区域好评率、是否为用户最喜爱价格区间、标题组词是否合理等等。
对于以上众多指标,张方文的建议是尽量的去迎合淘宝官方给出的优化建议,店铺或者单品的相关指标尽量高于行业平均水平,至于这些指标中那些指标在算法体系中所占比例最大,这我们并不知道,我也建议大家不要妄加揣测和研究,我相信这其中的算法的复杂程度是惊人的,而且很不稳定,假设你已经研究出来,说不定一个月后算法又做了调整。
四:重要依据
这点是淘宝自创的一些排名算法,也是比较重要的排名排序依据和流量资源平均分配的最有效方法。作为一个平台一定要站在中庸的立场来进行运营,也就是说淘宝官方希望所有加入淘宝网这个平台的商家都要绝对平均的享受平台流量资源。所以官方推出了宝贝下架时间和橱窗推荐,作为重要的排名排序依据。
1.下架时间:当商家上传一款宝贝时,从上传成功的那一个时间点算起,7天一个轮回,该宝贝离下架时间越近,你排名靠前的可能性就越大,换句话讲就是宝贝权重就越高。这概念可能很官方很难理解,请看下面的实例:
某淘宝卖家上传了一款产品,上架时间为2012年11月13日 22:01分12秒6666毫秒
由于下架时间为7天一个轮回,那下次重新下架然后又上架的时间为:
2012年11月20日 22:01分12秒6667毫秒
那距离2012年11月20日 22:01分12秒6666毫秒这个时间越近,你的宝贝参与排名的权重就越大。
其中这个上、下架的操作是程序自动去上、下架的,请不要惊恐误认为程序会自动给你产品下架然后需要你自己去后台手动上架该款产品,同时上、下架操作几乎无任何征兆,只是一旦超过下架时间权重就重新归零。
2.橱窗推荐:对于不同等级的店铺,淘宝网会给出不同个数档位的橱窗推荐位,一般情况下只有橱窗推荐的宝贝才能获得比较理想的排名,对于没有橱窗推荐的产品可以说没有任何排名的机会(除非一些没有竞争的宝贝),所以我们可以将橱窗推荐产品看做为我们店铺的引流宝贝。
最后对于店铺直通车使用情况、直通车使用频率、直通车所花费广告费用、直通车转化率是否影响着搜索排名的问题,有的机构认为对排名是有影响的,有的门派又认为没有影响,上海网站建设协策网络公司认为:只能仁者见仁智者见智了,这其中东西只能大家去领悟了,我在这里就不做过多的说明。