近日,2020年度"钱伟长中文信息处理科学技术奖"获奖名单公布,搜狗搜索联合清华大学共同完成的'认知计算模型驱动的互联网搜索技术及其应用'项目,荣获一等奖。
"钱伟长中文信息处理科学技术奖"是经科技部批准设立的中文信息处理领域最高科学技术奖,由中国中文信息学会钱伟长中文信息处理科学技术奖评奖办公室评定,授予在该领域技术上有重大创新和突破,及能创造出较大经济效益或社会效益的项目及个人。该奖项对参评项目的总体技术水平和主要技术经济指标要求严格,获奖项目的科研能力需要达到国内领先及国际先进水平。
通过与清华大学开展紧密校企合作,此次获奖的"认知计算模型驱动的互联网搜索技术及其应用"项目,肯定了搜狗在科技领域的自主创新实力,其以认知计算模型为核心的技术创新思路,成果优势相当突出。
首先,项目组提出了基于用户交互模型的查询需求理解办法,利用用户群体智能以改进需求理解效果。这一方法有效将搜狗查询推荐系统的点击通过率提升18%。其次,项目组于业内率先提出了基于异常浏览模式监测的识别方法,为加强识别的通用性与及时性做出突出贡献。该技术创新极大缩短了搜狗搜索识别垃圾网页的时间周期,使得其性能远超谷歌公司PageRank等算法,显著提升了搜索的识别效率。最后,项目组首次提出的多媒体结果的聚合排序方法,利用深度表示学习技术整合结果的多模态特征,高效提升搜狗系统的排序效果。经第三方测评,搜狗的排序性能在当前用户量最大的主流中文搜索引擎中,远远优于同业其他产品。
上述种种创新成果组成了搜狗搜索的核心技术模块,该项目也获得了31项专利与软著、发表高水平论文近百篇,为搜索领域的学科发展做出贡献。
此外,相关项目成果已成功应用于百度学院技术培训服务,腾讯微信、知乎和搜狐等平台以深化用户体验,提升搜索效率与质量;还与政府取得相关合作,将其融入网络空间治理体系,截止目前,已甄别垃圾网页超过150亿个。
近年来,搜狗搜索的技术实力屡次获得行业权威荣誉。仅今年以来,就在微软MIND新闻推荐竞赛上力压多支国内外顶尖参赛团队,勇夺冠军。凭借在技术领域持续不断的深耕探索和积累沉淀,立足科技创新,以"用领先科技,让表达和获取知识更简单"为使命,搜狗搜索已经成为国内领先的搜索引擎,市场占有率稳步增长。相信本次"钱伟长中文信息处理科学技术奖"的授予和成果转化,将促进搜狗搜索未来继续为广大互联网用户提供性能突出、自主可控、高可信度的搜索服务。