关于搜狗

第一财经:搜狗唇语识别表现优于谷歌

发布日期:2017年12月19日

近日,第一财经国际版发表报道称,搜狗推出了一项唇语识别新技术,其准确率在某些场景,如车载、智能家居等环境下高达90%。同时,在非特定人开放口语测试中,搜狗中文唇语识别技术准确率在60%以上,表现优于谷歌开发的英文唇语识别技术。搜狗在AI方面取得的这项新进展,也让外界对搜狗未来的股价表示看好。

据了解,唇语识别是搜狗近日推出的一项人机交互新技术,也是业内首个公开演示的唇语识别系统。机器不用收音、进行语音识别,仅靠识别说话人唇部动作,就能解读说话者所说的内容。而该技术也在近期举办的第四届乌镇世界互联网大会上首次对外公开展示,并引发外界诸多关注。 图片 从全球范围来看这项技术,另一家研发AI唇语识别的是谷歌DeepMind团队。在观看了累计时长超过5000小时的电视节目视频后,谷歌AI读唇系统的准确率达到46.8%。同时,谷歌的技术仅限于英文唇语识别,涉及到复杂的中文,唇语识别的难度可能更大,鲜有公司涉及这一领域。而搜狗基于数千小时的数据学习,首创复杂端到端深度神经网络技术进行中文唇语序列建模,在自然语言处理技术的指导下,最终取得了业界领先的唇语识别效果。

今年人工智能行业热度提升,很大程度上是因为技术真正进入到应用领域。而唇语识别之所以受到大家的青睐,也是因为其在安防、军事、车载、医疗健康等领域应用潜力巨大,并在某些特定场景可以快速落地。而搜狗也给它的中文唇语识别技术找到了日常生活、安防、公益三大应用场景。

比如车载环境中,周围过大的噪音很容易使得用户的一些语音指令无法被准确捕获、识别,从而影响人车交互。唇语识别可以帮助规避这一影响,确保输入的准确率,保证交互的稳定性。在安防领域中,由于目前很多监控场景,如电梯、马路中只有摄像头没有麦克风,通过唇语识别技术,则可以获取重要的用户讲话信息,为公共安全提供有效支持。同时,搜狗唇语识别还能服务于听障、失语人士,帮助他们更好地理解和表达自己。

对于搜狗为什么会想到研发唇语识别技术,搜狗CEO王小川也解释了做这件事的初衷:“是因为搜狗搜索和输入法其实都是在和语言打交道。一方面是帮助人们用语音表达,另一方面是通过语言获取互联网上的信息,但在一些嘈杂,甚至无声的环境里,语音所能发挥的作用是有限的,于是在这种情况下,我们就需要发展基于视觉的识别能力”。

当前,搜狗在以语言为核心的人工智能战略下,不断落地新技术、新产品,让用户能够切实感受到人工智能技术给生活带来的便利。而随着搜狗对于人工智能技术的不断研发,相信未来搜狗还将落地业内领先的AI成果,让技术更好地为人类服务。这也是投资人看好搜狗未来发展的一大重要原因。