乐天营销-安徽合肥SEO外包服务,合肥SEO公司知名品牌!

合肥SEO优化_关键词排名服务外包-乐天SEO公司

需求用户满足综述

时间:2018-03-13来源:SEO算法教程 作者:admin 点击:

 

偶然间发现百度搜索研发部官方博客里面的文章全部都删掉了,而且也不更新了,可惜了。作为百度搜索研发的官网博客,之前还是有很多具有参考性的文章的,既全面有深度也权威,而现在完全是一个空架子了,免不了有所感触。

 

 

百度搜索研发部需求满足综述


 

  一、什么是需求满足

 

  1.1 什么是需求满足

 

  用户来搜索“章鱼 保罗”,就文本相关性而言,搜索引擎只要返回和“章鱼保罗”内容相关的结果就可以了,这样用户是否满意呢?

 

  用户甲:听说章鱼帝挂了,来看看最新结果,怎么全是8月份的,往后翻页中…

 

  用户乙:今天同事们在讨论章鱼哥挂了,章鱼哥是啥?我又out了,来搜索一下章鱼帝生平事迹是啥,怎么全是最新的结果,没有章鱼哥的介绍啊,变换个query看看....

 

  用户丙:我是铁杆球迷,看完章鱼哥,再看看足球相关的吧,鲁尼/杰拉德是否又进球了,怎么连个相关推荐都没有,还得我亲自输入。

 

  用户丁:找个章鱼哥的头像用一下吧,一定很拉风,怎么结果没有方图呢,这么扁的图怎么用啊.

 

  用户戊:换个章鱼哥的壁纸,也许下次买彩票能发大财,咦,怎么全是小尺寸的图…

 

  笼统的说,用户向搜索引擎表达他的需求,搜索引擎理解用户需求,提供各不同的需求下的资源,这整个过程可统称为需求满足。而简单说,就是除了基础文字相关性之外的rank工作,都属于需求满足的范畴,也就是说,提供给用户的检索结果,不仅仅要求在字面上是和用户输入的文字相关的,还要满足用户的各种不同需求。

 

  需求满足在rank体系中所处的位置:

  

百度搜索研发部需求满足综述
 

  1.2 为什么需要需求满足

 

  用户通过query表达了自己的需求,而对于大部分query,尤其是具有隐含需求的query,仅仅字面匹配的查询结果未必能够满足其需求。也就是说仅仅基于文本相关性这个维度的相关结果未必能够满足用户需求。

 

  1.3 需求满足包含哪些工作

 

  从上面的例子中,可以看出,需求满足需要解决时效性需求问题,多需求问题,相关推荐,图片大小类需求,素材类需求,浏览引导等问题。除了基础文本相关性以外的rank策略以及为了这些所做的query分析工作可认为属于需求满足的工作,另外还包括前端结果展现、结果组织与推荐以及用户引导浏览的工作。

 

  二、需求满足如何做

 

  需求满足要解决的核心问题:

 

  需求识别

  资源建设

  需求调权

 

  2.1 需求的识别

 

  2.1.1 需求的类型

 

  识别query有哪些需求,以及需求的强弱,是最基础的工作。首先要有需求的体系,能完备的描述各种需求,其次是如何识别这些需求,把每个query的需求对应到这个体系中去。

 

  通过query分类识别需求:

 

  现在线上query分类体系,是按照话题属性为依据来建立的。包括风景类,地名类,人物类,汽车类等等,对于每个类别,在一些维度上的需求是不一样的,比如风景类需要尺寸比较大,比较清晰,不包含人的图片,而聊天类则需要尺寸较小,最好是动态的gif图。

 

  基于统计的需求识别

 

  通过对大量的数据统计分析,可以识别出query有哪些方面的共性。可供分析的数据很多,比如用户行为数据,点击反馈,检索结果等。

 

  比如:对query的检索结果,按照某一feature进行聚类,如果某个类别所包含的图片数很多,超过设定阈值时,则认为这个类别内的图片,在这个feature上,代表了这个query的需求。统计用户反馈来获取需求是最能反映用户需求的方式,用户的反馈包括用户点击,query变换等。

 

  专名&需求词

 

  判断query中包含专名或者需求词等关键词,是最直接的方式。比如“红色宝马”,显示的表达了颜色方面的需求。

 

百度搜索研发部需求满足综述
 

  时效性需求

 

  时效性需求包括三部分,突发时效性、周期时效性和泛时效性需求,目前线上做的是突发时效性需求。需求的识别,主要是通过检索量的突发,资源数突发和实效性事件来判断的。

 

  检索量的突发,是指累积每个小时的用户检索频率,用连续15天的用户检索频率,计算突发的斜率,根据斜率的大小,来判断时效性需求的强弱。这个只适合热门query,对于长尾query,检索频率很低,无法通过这种方式识别出来。

 

  通过事件判断:这种方式,主要是想看关键term命中时效性事件的比例。当然这些事件是通过主动挖掘的时效性query,通过聚类后,对每个类别训练出来关键词。

 

  2.1.2 需求的强弱

 

  要做好需求满足,不仅要识别query有哪一类型的需求,而且要识别该类型需求的强弱,他直接指导了后续需求调权的力度。

 

  每个维度的需求,必须要有需求的强度,在各维度调权合并时,需求的强度决定了该维度的权值。比如时效性需求,需求的强度很高,要求满足时效性的资源,一定要排在前面。又比如清晰度、饱和度调权,对大部分query而言,需求不是很强烈,调权时的力度就不能太大。

 

  显式的需求为强需求

 

  用户通过在query中包含需求词的方式,表达自己的需求,这样的为强需求。比如,最新刘德华图片,红色宝马

 

  基于统计的方式挖掘需求时,判定值超出阈值的比例大小,决定需求的强弱

 

  在用统计挖掘用户需求的方法时,一般会选取某个维度的属性,量化后计算它的统计特性,可以根据统计后该数值的分布情况,判断需求的强弱。比如,时效性需求,某段时间内,该query检索量突发特别大,是昨天检索量的100倍,如果我们设定的阈值是2倍的话,那么这个query就可认为时效性需求特别强。

 

  又比如通过用户点击数据挖掘图片size需求,对于头像类的query,大部分用户点击的是100*100的方图,但是所占总点击中的比例不是很高,比如只到60%,那么对这个query而言,size需求是一般强度的需求。

 

  2.2 需求的满足

 

  识别出query有哪些需求,下一步的工作就是提供相应的资源。

 

  2.2.1 资源的挖掘

 

  如何获得满足需求的资源,是需求满足的另一个核心问题。在资源上,通过某一个或者几个特征组合,能够把满足要求的资源和不满足要求的资源区分开,找到用户需求的资源,去掉不满足要求的资源,是主要的工作。

 

  内容属性特征

 

  对内容属性维度来说,可以分为底层的物理特征,中层的物体识别和高层的语义特征。

 

  话题属性维度

 

  类似的query分类的体系,也可以对资源进行相似的话题属性分类,我们目前只做了站点级别的分类,效果不是很理想,主要原因一是站点粒度太粗了,二是站点分类的召回存在很大的问题。如果有了话题属性的分类,和query需求的分类相配合,可以达到事半功倍的效果。

 

  时效性资源的收录

 

  主要是挖掘时效性库,和news的资源,和非时效性资源的区分是比较容易的。

 

  2.2.2 需求调权

 

  明确了query的需求,挖掘了满足需求的资源,那么如何把满足需求的资源rank到前端呢?

 

  对于各种不同的需求维度,都有自己的调权的策略。比如格式调权,假设query有gif图需求,对于gif的动态图,权值乘了1.2,对于静态图要降权,权值乘了0.1。又比如时效性需求,直接在前三页插入的时效性库的结果,这是因为时效性需求是一个强需求维度,简单的加权。

 

  2.3 需求满足的效果

 

  前面已经完成了query需求识别,资源识别已经需求调权的工作,那么用户是否满足了呢?搜索引擎最终是给用户服务的,用户觉得爽,才是最重要的目标。那么如何知道用户是否满意呢?

 

  用户接收到搜索引擎的提供的信息后,会对这些信息做出反馈。这些反馈包括了用户对搜索结果的点击、对query的主动变换,以及这些行为之后的相关行为。通过对这些数据的分析,可以知道用户的满意度。

 

  当然,这种方式是否合理还有待调研,毕竟用户不点击一张图的原因有很多可能,有可能是需求识别的问题,有可能是该维度强弱识别的问题,也有可能是rank的问题。目前用户反馈应用只有点击调权,是否用户的反馈可以在单独的维度上有效,还需要详细的调研分析。

 

  三、结语

 

  Image需求满足方向才刚刚起步,未来要向智能化,自动化,多样化方向持续的发展。我们最终的目标是把需求满足这个方向做没了,需求挖掘,资源满足全部自动化,做到“手中无剑心中有剑”。

★相关说明:

◎本文(需求用户满足综述)责任编辑:SEO算法教程
◎如果(需求用户满足综述)侵犯您的版权,请联系电子邮件:ilottecn@qq.com!
------分隔线----------------------------
相关分类
 
QQ在线咨询
咨询热线
18956238445
服务时间
8:00-22:00