当前位置: 首页 » 智能资讯 » 智能行业新闻 » 正文

2017新一代人工智能发展白皮书——技术层

放大字体  缩小字体 发布日期:2018-07-13  浏览次数:159
核心提示:本白皮书主要由中国电子学会研究咨询中心人工智能研究室编写完成,内容以原创为主,文责自负。

技术层主要包括语音识别、图像视频识别、文本识别等产业,其中语音识别已经延展到了语义识别层面,图像视频识别包括了人脸识别、手势识别、指纹识别等领域,文本识别主要是针对印刷、手写及图像拍摄等各种字符进行辨识。随着全球人工智能基础技术的持续发展与应用领域的不断丰富,人工智能技术层各产业未来将保持快速增长态势。预计到 2020 年,全球语音识别、图像视频识别、文本识别等人工智能技术层产业规模将达到 342 亿美元,我国人工智能技术层产业规模将突破 66 亿美元。图 8 2020 年全球及我国人工智能技术层各产业规模占比。

1 、语音识别:正在步入应用拉动的快速增长阶段语音识别(Speech Recognition,SR)技术是将人类语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用及产品。在大数据、移动互联网、云计算以及其他技术的推动下,全球的语音识别产业已经步入应用快速增长期,
未来将代入更多实际场景,预计到 2020 年全球语音识别产业规模将达到 236 亿美元,国内语音识别产业规模达到 44.2亿美元。

核心技术。语音识别的主要目的是让智能设备能够具有和人类一样的听识能力,同时将人类语言所表述的自然语义自动转换为计算机能理解和操作的结构化语义,完成实时的人机交互功能。近年来,语音唤醒技术、声学前端处理技术、声纹识别技术、语义理解技术、对话管理技术等语音识别领域核心技术的蓬勃发展,有助于构建智能语音交互界面系统,提高语音识别的准确率与响应速度,满足垂直领域对自然语义识别和声音指令的应用需求,为用户提供自然、友好和便捷的人机交互体验。

主要产品。伴随着移动互联网技术的发展与智能硬件设备的普及,人类已经不再满足于键盘输入和手写输入等传统人机交互方式,语音识别技术在电子信息、互联网、医疗、教育、办公等各个领域均得到了广泛应用,形成了智能语音输入系统、智能语音助手、智能音箱、车载语音系统、智能语音辅助医疗系统、智能口语评测系统、智能会议系统等产品,可以通过用户的语音指令和谈话内容实现陪伴聊天、文字录入、事务安排、信息查询、身份识别、设备控制、路径导航、会议记录等功能,优化了复杂的工作流程,提供了全新的用户应用体验。

典型企业。语音识别领域具有较高的行业技术壁垒,在全球范围内,只有少数的企业具有竞争实力。目前,Nuance、苹果、三星、微软、谷歌、科大讯飞、云知声、百度、阿里、凌声芯、思必驰等知名企业均重点攻克语音识别技术,推出大量相关产品。Nuance 曾经是全球最大的语音识别技术提供商,侧重于为服务提供商提供底层技术解决方案,随着企业战略目标以及商业环境的改变,目前转型为客户端解决方案

提供商;苹果公司以 Siri 语音助手为平台关联 iOS 系统相关应用与服务,倾向于改善用户的智能手机使用体验和创新商业模式;微软致力于提高语音识别技术的准确率,英语的语音识别转录词错率仅 5.9%,达到了专业速录员水平,并将相关技术应用于自身产品“小冰”和“小娜”之中;科大讯飞作为国内智能语音和人工智能产业的领导者,中文语音识别技术已处于世界领先地位,并逐渐建立中文智能语音产业生态;云知声重点构建集机器学习平台、语音认知计算和大数据交互接口三位一体的智能平台,垂直应用领域集中于智能家居和车载系统;阿里人工智能实验室借助“天猫精灵”智能音箱构建基于语音识别的智能人机交互系统,并通过有效接入
第三方应用实现生活娱乐功能的进一步拓展。

 
关键词: 智能家居 Nuance 苹果 三星 微软 谷歌 科大讯飞 云知声 阿里 百度 凌声芯 思必驰
 
[ 智能资讯搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]

 
0条 [查看全部]  相关评论

 
智能新闻
智能供应
智能采购
 
网站首页 | 订阅电子周刊 | 联系方式 | 关于我们 | 问题解析 | 版权隐私 | 使用协议 | 网站地图 | 网站留言 | 广告服务 | 积分换礼 | RSS订阅|
安全联盟站长平台 不良信息举报中心网络110报警服务
深公网安备案证字第 4403101901094 号 粤ICP备12078626号-1
增值电信业务经营许可证号 粤B2-20120463