kb体育(中国)官方网站-登录入口






咨(zī)询热线:021-80392549

kb体育(中国)官方网站-登录入口 QQ在线 kb体育(中国)官方网站-登录入口 企业微信
kb体育(中国)官方网站-登录入口
kb体育(中国)官方网站-登录入口 资讯 > 人工智能(néng) > 正文

嘘!AI正在悄悄听懂你(nǐ)说的话

2019/02/12机器(qì)人464

小(xiǎo)时候(hòu)看(kàn)特(tè)务电影时,特工们往往有一项必(bì)备的技能,就是隔着几百(bǎi)米远盯着正在说话的对象,从嘴(zuǐ)型(xíng)判(pàn)断出对方在说什么(me)。有(yǒu)了这种记忆,导致如今看什么语音(yīn)识(shí)别(bié)技(jì)术都觉得(dé)相当一般——我都说出声(shēng)儿了你才听懂,算什么AI好汉。

不过最近一(yī)项专利(lì)申请表(biǎo)明,微(wēi)软正在向(xiàng)特工学(xué)习,推出了(le)无声语音识别技术。当AI也能像(xiàng)特工一样,无声之中辩(biàn)人言,我们的世界究(jiū)竟(jìng)会有什么不同?

除去唇语识(shí)别,AI还有什么方式悄悄听懂(dǒng)你的话(huà)?

说起无(wú)声语(yǔ)音(yīn)识别,可能很多人第一反应(yīng)就是复制人类的方(fāng)式,利(lì)用图像识别(bié)进行(háng)辩读唇语。而利用(yòng)唇语进(jìn)行语(yǔ)音识别这种方式也由来已久,但是识别的准确率一直(zhí)不(bú)算高。DeepMind曾在2016年做过测试,经过1万小时的新闻视频训练,AI唇语准确率(lǜ)达到了46.8%。国内有一家企业曾经提供过相关(guān)数据:在对中(zhōng)文(wén)新(xīn)闻视频的识别中,准确率达(dá)到了70%。而搜狗所(suǒ)推出的驾驶场(chǎng)景(jǐng)下(xià)的唇(chún)语识别,因(yīn)为涉及到的词汇量很少,准确率能够达到90%。

可(kě)以(yǐ)发现,相比(bǐ)现在主流语(yǔ)音识别动辄95%、97%的准(zhǔn)确率,唇语识别准确程度(dù)实在是有些拿不上台面。对于中文这种一(yī)字一(yī)音节的语(yǔ)言(yán)来说还好,对于英文这种(zhǒng)连音(yīn)很(hěn)多的(de)语言来说,唇(chún)语(yǔ)识别要跨(kuà)越的门(mén)槛确实不小。

另(lìng)一(yī)方面来(lái)看,唇(chún)语识(shí)别所涉及(jí)到(dào)伦理问题(tí)实在过于严重。唇语识别的“射程”太远(yuǎn),如果这种技术真的(de)发展成熟(shú),意味着天网之下的我们在(zài)交谈时将再无(wú)隐私(sī)。在隐私焦虑越来(lái)越浓的今天,哪家(jiā)企业公(gōng)开研究这(zhè)项技术,只怕是觉得自己家的公关部门过得太清闲。

因(yīn)此包括微软在内的产业和学界,都在寻找一种更(gèng)精准也更隐私的无声语言识别。目(mù)前看来,无声语音(yīn)识别的技术方向可以被分为两个“派系”,一是(shì)“气宗”,另一个是“电(diàn)宗”。

微软所提交的专利,就是典型的“气宗”——在终(zhōng)端上添加传感器,通过感知用户说话时的气流来(lái)判断用户说话(huà)的内容。这(zhè)种终端如(rú)同一只(zhī)小型麦克风,置于用户嘴(zuǐ)边,用户在说话时形成的气流会在(zài)设(shè)备中形成反射,经(jīng)过训练,可以将(jiāng)这些气流反射的信号(hào)和(hé)文(wén)字一一对应。

而(ér)“电宗”则更(gèng)加神奇,我们知道人在说话时需(xū)要调动整个下半张(zhāng)脸的肌肉,不同的文字发音(yīn)所调动肌肉的(de)方式也并不相同。通过对面部(bù)EMG(肌(jī)电)信号的采集,来学(xué)习人类说话时面(miàn)部EMG信号特征(zhēng),并通过神(shén)经(jīng)网络的(de)训练将EMG信号和文(wén)字对(duì)应起来。

可以看出(chū)这两种无(wú)声语音(yīn)识别都有一个(gè)共同的特点,那(nà)就是自主性和(hé)私密性。不(bú)管是EMG信号采集(jí)还(hái)是气流采集,都需(xū)要(yào)在(zài)讲(jiǎng)话(huà)者身上佩戴好设(shè)备(bèi),而不是像图像技术一样,能够(gòu)在远程(chéng)且讲话者不知情的情况下进行采(cǎi)集分析。

无声(shēng)语音识(shí)别变成真·气功(gōng)?

不论是气宗还(hái)是电(diàn)宗(zōng),这些(xiē)无声语(yǔ)音识(shí)别技术都(dōu)面临着同样的问题(tí)——既(jì)然要用(yòng)户把话(huà)说出来才(cái)能进行(háng)识别,那为什么不直接应用语音(yīn)识别来(lái)进行(háng)文字转(zhuǎn)换和翻译,非要弄一些(xiē)和“气功”一样没有切实应用场景的花招?

其(qí)实无声语音识别的应用,可(kě)能不(bú)像大家想象的那样广泛,它既不(bú)能以最(zuì)高效的方式帮助听障人士,也不允许被应用于监听等等工作(zuò)。但在(zài)一些关(guān)键场合下,无声语音识别却可(kě)以发挥出奇用。

我们可以一起开动脑筋(jīn),想想在哪里人们需要说(shuō)话,但却听不到彼此的声音。答案很(hěn)简单,要(yào)么是在(zài)声音无法传(chuán)播的地方,要么是在一些特别嘈(cáo)杂的(de)地(dì)方。于是无声语音识别就有了如下(xià)的应(yīng)用场景:灾害现场、舱外探(tàn)索(suǒ)、水下作业(yè)……

在这(zhè)类(lèi)场所中,人们或(huò)许为了躲避被污染的(de)空气、或(huò)许为了呼吸氧(yǎng)气,都会(huì)穿(chuān)上类似生化服、宇航员服等等特殊服装。穿上之后既看不到对(duì)方的表(biǎo)情,也听(tīng)不(bú)到对方的(de)声音,更没办法用(yòng)语音交互去控制其他设(shè)备了(le)。同时环境情况(kuàng)(例如氧(yǎng)气不够充足)往往(wǎng)不允许人们以正常的声音(yīn)说话,加上防护服(fú)的(de)封闭状况会引起声(shēng)音的回(huí)响,以往的(de)有声语音识(shí)别在这种情况下很难发挥(huī)作用。

这时(shí)可以被安(ān)置在防护服内部的无(wú)声语音识别(bié)就(jiù)显得(dé)很有价值,讲话者只需要做(zuò)出口型就(jiù)能向外界传递信息。

除(chú)此之(zhī)外还(hái)有(yǒu)嘈杂的马路、工厂车间、机场(chǎng)……

在这些(xiē)场所中,想要让(ràng)对方听清自己的声音(yīn),往往需(xū)要扯(chě)着嗓子吼(hǒu)。想(xiǎng)让语(yǔ)音识别(bié)准确(què)拾音,更(gèng)是难上加难。这(zhè)时利用无声语音识别就会轻松很多(duō),不仅可以准(zhǔn)确表达(dá)信息,也能让一些处(chù)于这种场合的工作人员戴上隔(gé)音耳塞保(bǎo)护自(zì)己的(de)听力。

实际上目前在欧洲(zhōu)一(yī)些型号的战斗机中,就因为机舱内(nèi)噪音(yīn)巨大、飞行(háng)员(yuán)之间无法(fǎ)沟通,已经应(yīng)用上(shàng)了EMG信号无声语音识别技术。

当然,目前(qián)相(xiàng)比语音识别技术、甚至相比唇(chún)语语音识别,无声语音识别技术(shù)的发(fā)展阶段还很初级,应用效率也不高。

实际上无声语音识别是一项典型(xíng)的“美好而无用”的(de)AI技术,它(tā)既完美体现了一系列技术(shù)的排列组合,例如EMG信(xìn)号无(wú)声语音识别所(suǒ)体现出的(de)AI与神经(jīng)学的结合;又在应用上极(jí)大程度的受限,即使在一些声音(yīn)难以传播的场景下,也要考虑(lǜ)计(jì)算条件(jiàn)、识别语音后(hòu)信息再传递的媒介(jiè),更(gèng)不用提复杂的数据收集工作了。

但我(wǒ)们有理由相信,在未来AI技术(shù)越来越普(pǔ)及化、应用(yòng)成本越来越低时(shí),总会出现一(yī)些极端场景应用上(shàng)这些看似无用的技术——也许未来(lái)有一天,战斗机的控(kòng)制也要(yào)应用上语(yǔ)音交互呢?

关键(jiàn)词: 人工智能 机器人




AI人工智能网声(shēng)明:

凡资讯来源(yuán)注明为其他媒体(tǐ)来源的信息,均(jun1)为(wéi)转载自其(qí)他媒体,并(bìng)不代表本(běn)网站赞同其观(guān)点,也不代表本网站对其真实性负(fù)责。您若对该文章内容有任何(hé)疑问或质疑,请(qǐng)立即与网站(www.jiangx.bijie.shanxi.linyi.jiaxing.zz.pingliang.ww38.viennacitytours.com)联系,本网站将(jiāng)迅(xùn)速给(gěi)您回(huí)应并(bìng)做处理。


联系电话:021-31666777   新闻、技术文(wén)章投稿QQ:3267146135   投(tóu)稿邮箱:syy@gongboshi.com

精选资讯更多(duō)

相关资讯更(gèng)多

热门搜索

工博士人(rén)工智能(néng)网
kb体育(中国)官方网站-登录入口
扫描二维码关注微信
扫码(mǎ)反馈

扫一扫,反(fǎn)馈当前页面(miàn)

咨询反馈(kuì)
扫码关注

微信公(gōng)众号

返回顶部

kb体育(中国)官方网站-登录入口

kb体育(中国)官方网站-登录入口