当前位置:
首页 > 小哲日记 > [2016.11.01]小哲谈谈语音识别技术

[2016.11.01]小哲谈谈语音识别技术

小哲查询自己的博客时,发现在2008年的时候就已经在直接的PC电脑上尝试的安装了一款语音输入系统,记得当时还是盗版的软件,语音库是进过一段折腾才安装成功的,而且普通话不标准的我,识别率特别低,一些词组和句子都容易出错,内容必须更加书面用语才能成功识别,但是在当时来说,是一种很新奇的玩意儿。

而在更早之前,其实还有安装过一个朗读软件,可以说当时可能正好是一种反向的操作,当时的朗读软件已经很成熟了,一些词组和句子甚至是单独识别文字进行朗读,读出来的女声库已经很接近正常说话了,虽然语气语调有些问题,但是辅助阅读是很不错的了。记得当时我是用这个软件进行辅助阅读,提高阅读的速度。

在更早的时候,小哲在底下黑网吧玩过一种聊天室,具体时间记不清了,但是,我依稀记得当时是语音聊天,打开麦克风在房间里和网友聊,视乎YY还没出现,甚至是QQ群还没普及,在这个聊天室里说的话,会自动识别变成文字,成功了非常高,后来想想,其实和陌生人聊天的时候,其实常用语句词汇很常见,所以被正确识别也应该不是难事了。

语音识别技术已经发展很多年了,目前来说,不断的容错,不断的扩展声音识别大数据,能更好的帮助系统识别人的语言,不同的方言慢慢被支持,不断的完善常用语句的识别,识别技术从一个字一个字的识别,变成现在的整句话识别,不断的加入一些新产生的词汇,那么识别率自然就高了。

目前小哲发现,国内的科大讯飞在中文语音识别上已经是做到了最领先,在云计算、大数据以及智能语音技术应用上的积累,陆续突破响应速度、识别准确率、复杂网络环境、口音方言、环境噪音……

而国外的高手们,Siri、Cortana、Google Now也是很牛的,虽然我只用过Siri,其他两个大牛我还内有用过,但是他们的智能声控应该是不相上下的,只要开启功能,小哲录入自己的声音就可以直接在锁屏状态下呼唤Siri,然后用语音进行简单的操作。

随着智能家居的发展,小哲认为这种人机交互的完美补充能使得我们的生活更美好,在中国乃至全世界,其实在大庭广众之下进行语音人机交互有点不太舒服,所以,在私密性更好的自己家中,通过这种最简单的方式来操控各种智能家居设备,想想都很兴奋。当然,人车交互的方式也可以得到提升,《霹雳游侠》电影里的那辆智能汽车也可以离我们不远了。

小哲最后也想再大胆的异想天开一下,科技如果发展,语音输入还需要人去说话,如果“读心术”这种黑科技能被发明推广,那么人们以后就可以进行更输入的人机交互了,但是细思极恐,好像这样的操作会带来一些列不可追溯的问题发生。呵呵,虽然是我说是异想天开,科学家在这方面已经在努力了,虽然“读心术”这类东西听起来充满科幻和不靠谱色彩,不过科学家长久以来就着手研究如何从大脑产生的信号中破译语言信息。今年早些时候英国曼彻斯特大学的研究人员开发出一个电脑程序。能够根据单个单词相对应的大脑活动来推测整个“脑电波句子”的含义。正确率达到70%。这项技术被期待用以改善中风患者的沟通难题,不过距离实现大众可用的“意念输入”尚有一段距离。

好了,让我们敞开怀抱去获取语音识别技术发展带来的红利吧!

分享生活点滴,内容问题可与我联系。 斜杆青年:资深产品经理/网站工程师/科技爱好者/新媒体运营/自媒体写作人