2021年以来,在元宇宙概念的刺激下,数字人技术应用呈现蓬勃发展。然而行业水平良莠不齐、评判方法缺失等诸多问题,也让品牌与企业选择数字人时无从下手,亟需权威的行业标准统一认知。
近日,中国信通院公布“数字人系统评测结果”,涵盖数字人48项基础能力评测、12项系统性能分级评测。该评测标准依托国际电信联盟(ITU)、中国通信标准化协会(CCSA)等国内外标准组织,联合国内外专家制定,有着高行业认可度与国际影响力。包括腾讯、火山引擎、百度、科大讯飞、阿里云、华为等在内的18家企业参与评测。评测结果显示,百度智能云曦灵平台在2022年6月通过基础能力评测后,再次在第二轮分级评测中,以高分获得行业唯一的“杰出级”证书,代表了当前中国数字人的最高水平。
(信通院云大所所长何宝宏公布评测结果)
数字人行业唯一杰出级厂商,AI数字人将成为未来主流
中国信通院表示,人工智能将持续推动数字人制作门槛降低。数字人的人像逼真度、驱动方式、内容生成、智能交互,均涉及到全链路的AI技术。据悉,本次数字人性能分级评测包括四大维度,共计12大项评测,重点围绕数字人音视频合成能力、用户主观体验的舒适性开展,60分为基础级,总评分达100-110之间,才可获得最高级别“杰出级”的认证。
(数字人性能分级测评指标)
在人像构建方面,逼真度盲测是判定数字人外观是否足够拟人的重要标准。区别于传统的手工建模方式,百度智能云曦灵可实现上传一张照片,分钟级生成2D、3D数字人,并实现全自动智能绑定。另外可通过1200个控制维度,实现精细表情的实时控制,以“毛孔级”的操作,为数字人打造出极度拟人的高颜值。
在驱动方式与内容生成方面,语音及视觉评测指标,强调数字人传情达意的准确性与流畅度。在传统“中之人”动捕、面捕驱动之外,百度智能云主打AI驱动,支持AI语音、AI视频驱动,以及7种情绪模式的切换控制,为数字人逼真还原出开心、生气、伤心等表情。同时,百度曦灵搭载SMLTA语音大模型,使得语音识别准确率达到98%,数字人口型合成准确率达98.5%,让数字人与真人无限趋近。
在交互方面,端到端耗时、用户主观体验评分是判定数字人是否智能的关键标准。前者强调数字人每次反馈用户的等待时长,后者则证明数字人交互越接近真人。基于UNIT7.0跨模态对话引擎、自然语言处理技术,以及百亿参数对话模型 PLATO,曦灵打造的数字人可拥有自己的经验和认知,能在极短时间内听懂并反馈,在实际应用中不仅能提升业务办理效率,低延时的回应更可提升用户的“真实感”,与用户进行有趣、有用、有料的对话。
经过此次十二大项目评测,可以说曦灵打造的数字人,是真正具备了接近真人外观、行为、思想特征的AI数字人。百度方面表示,小小一个数字人,背后其实是强大的云和AI技术在支撑。去年12月,百度智能云推出国内首个全栈自研的AI基础设施“百度AI大底座”,可通过AI底层技术的通用化、模块化,实现AI服务的规模化,面向企业AI开发和应用提供端到端自主可控、自我进化的解决方案,让企业可以快捷、低成本地实现“AI能力的随用随取”。
百度几十位数字人已应用在金融、直播、综艺领域
百度智能云曦灵主打用AI生成和驱动数字人,截至目前,已经打造了几十位数字人,应用在金融、运营商、政务、文旅、广电、互娱、航天等领域。
(百度智能云曦灵打造的数字人)
在金融行业,自2019年至今,浦发银行联手百度智能云持续壮大数字员工队伍,双方打造的首个银行“数字员工”小浦化身“理财专员”,每月为几十万人提供更有温度的金融服务,有效解决了金融业人力成本高、行业知识能力难迁移的痛点。
在广电传媒行业,百度智能云曦灵与央视新闻打造AI手语主播,冬奥期间为2700万听障用户提供手语服务;与《中国日报》打造首位数字员工元曦,打破时空传播中国文化,获中国外交部华春莹、赵立坚Twitter转发。
在文博领域,为中国文物交流中心打造首个文博虚拟宣推官“文夭夭”,与国家大剧院携手共创首个虚拟员工“Art鹅”,未来他们可掌握超越人类的行业知识,服务于各大博物馆、剧院,提供讲解、导览等服务,助力文博机构运营提效。
在影视综艺等领域,百度智能云曦灵为热播综艺《元音大冒险》提供全套数字人技术支持,让制作效率提升一倍的同时,内容生产成本降低50%。而此次数字人实时驱动,虚实结合的舞台秀等看点,也助力该综艺成为虚实结合的综艺爆款。
(《元音大冒险》数字人技术由百度智能云曦灵支持)
中国信通院表示,我国数字人市场规模有望在近几年迎来爆发式增长,人工智能技术与数字人的深度结合与不断迭代,为数字人的大规模商业化落地提供了必要条件。IDC《中国 AI 数字人市场现状与机会分析,2022》报告显示,百度智能云已成为中国数字人行业第一梯队领军者;互联网周刊《2021 虚拟数字人企业排名 TOP50》榜单显示,百度排名中国数字人产业综合实力第一位。