本词主要概述搜索引擎的关键技术,后面将围绕这些关键技术展开。
1.1 基本概念
1.2 搜索满意度
通用搜索引擎迭代优化的方向是提升用户满意度。用户对搜索结果更满意,就会更喜欢这款搜索引擎,用户数量、活跃程度会增长,带动营收的增长。通用搜索引擎的营收主要是靠关键词广告费,即广告主向某些查询词投放广告,按照广告的曝光次数或点击次数收费。
影响用户满意度指标:相关性、内容质量、时效性、地域性、个性化。
1.3 搜索引擎链路
用户输入搜索词到搜索引擎返回结果给用户的过程,查询词处理(query process, QP)、召回(retrieval)、排序(ranking)。
查询词处理QP: 查询词处理,包括:查询词分词、词权重、改写及意图识别。主要目的是对查询词分词、词权重、改写,作为召回所需的输入;通过对查询词意图识别的结果,可决定下游链路的调用。
召回:从数亿的文档库中快速取回数万篇文档,并用简单模型进行打分和排序。
如果有可 靠的指标量化用户满意度,那么我们就可以用这样的指标作为牵引,向着提升指标的方 向做策略的优化。 升用户满意度,引起用户规模 和 用户留存增长,从而导致广告营收增加。
搜索引擎的好坏主要通过如下3个指标进行评价。
2.1 用户规模与留存指标
用户规模:日活用户数(daily active user,DAU),周活用户数(weekly active user,WAU),月活用户数(monthly active user,MAU)等;
留存指标:次n留,第n留。
2.2 中间过程指标
(1)点击率和有点比,首点位置和浏览深度
(2)交互指标:包括点赞、收藏、转发、关注、评论、浏览时长等。
2.3 人工体验评估