技术:
GPU/CPU 传感器 基础元器件 网络通信 显示 交互技术 电源管理 材料 操作系统 APP 云技术 大数据 人工智能 制造 其它
应用:
可穿戴设备 智能家居 VR/AR 机器人 无人机 手机数码 汽车 平衡车/自行车 医疗健康 运动设备 美颜塑身 早教/玩具 安防监控 智能照明 其它
当前位置:

OFweek智能硬件网

传感器

正文

从「语音」到「语言」的工作重心转变,搜狗如何实现 AI 的跨越式发展丨WARE 2017

导读: 智能语音要做到越来越「智能」,则需要大量的训练数据,国内外不少做智能语音技术的搜索公司就有这点优势。

OFweek智能硬件网讯 智能语音要做到越来越「智能」,则需要大量的训练数据,国内外不少做智能语音技术的搜索公司就有这点优势。国内的搜狗则是一家比较低调的公司,事实上,搜狗从 2013 年就开始做智能语音技术,先后推出实时转写、实时翻译等功能。目前,搜狗已与车载、家电厂商合作推出搭载其智能语音技术的智能车机、智能电视等产品。

在去年的新硬件生态大会上,搜狗王小川做客深圳湾,畅谈了人工智能为我们带来的机遇。在今年的「WARE 2017 语音智能平台与应用峰会」中, 搜狗公司语音交互技术中心总经理和搜狗输入法研究负责人王砚峰发表了『从语音到语言』的演讲,讲述了搜狗在语音技术更新迭代过程中所做的主要工作。

AI 工作重心的转移:从「语音」到「语言」

王砚峰指出,以往的语音助手之所以不够「智能」,是因为机器经常没「听」懂人话,或者不能「理解」所听到的内容。事实上,「语音」只是机器收集信息的一个入口,「语言」才是机器理解的所在,也就是说,机器要有知识并懂得如何思考。

blob.png

在这几年的时间里,搜狗一直在更新自己的语音技术,因为意识到这一点,逐渐将人工智能(AI)工作的重心从「语音」向「语言」技术进行转移,解决大部分语音助手「听」不懂人话、难以实现多伦对话的窘境。其中最核心的是解决「语言」这重要一环。

在产品演化的过程中,如何解决「语言」这一核心问题?

那么,搜狗是通过哪些路径解决这些困难的呢?王砚峰提出了以下几点:

第一,优化语音识别的准确率,用深度学习和数据驱动语音识别的进步。 随着搜狗输入法所收集数据量的不断提升,技术也随之更新并且使得深度学习技术不断得到加强,语音识别的精确度因此也得到大幅度提高。另外,让语音技术在更多硬件设备中落地,进一步解决噪音、口音、远场等问题。目前,搜狗输入法每日的语音接收量达到 2.4 亿次,等同于 20 万个小时的训练语料。

blob.png

第二,即进入设计+工程化的阶段。例如要实现人与机器沟通过程中能够「随意打断」的目标,就需要利用工程化的方法,通过「唤醒」的方法让机器理解人机对话过程中的关键指令。

第三,场景化、功能化、知识化。传统的语音助手是一个开放和通用的应用,并不能有一个稳定的预期。而将自然语言理解放在一个垂直的场景和功能上,并通过知识的整理,能够为用户提供更好的人机交互体验。如场景化后的车载语音助手以及智能电视语音助手。

blob.png

如何让语音识别技术做到真正的「智能」?

接下来,则是要「死磕」语言,让语音识别技术实现真正的「智能」。王砚峰总结出了搜狗以下的几个关键做法:

一、追求掌握更先进的自然语言理解和深度学习技术,这是推动技术发展的根本。例如搜狗所推出的实时翻译技术,就采用了目前业界里最先进的架构,相比 Google 深度学习层数达到的 8 层,搜狗目前的层数虽然少一些, 但已与国内领先的百度达到持平的状态。

blob.png

1  2  下一页>  
责任编辑:Gary
免责声明: 本文仅代表作者个人观点,与 OFweek智能硬件网 无关。其原创性以及文中陈述文字和内容未经本站证实, 对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅 作参考,并请自行核实相关内容。

我来说两句

(共0条评论,0人参与)

请输入评论

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码: