AI协助渐冻症患者康复言语功用第一位获益人我的声响回来了

放大字体  缩小字体 2020-01-04 18:56:14  阅读:2458 作者:责任编辑NO。谢兰花0258

药明康德AI/报导

图片来自:Pixabay

冰桶应战盛行的那一年,前美国国家橄榄球联盟球员Tim Shaw被确诊患有肌萎缩侧索硬化(ALS)。他日子的方针也从球场上的奋力奔驰,变成了不再跌倒

Tim曾是美国国家橄榄球联盟的后卫,曾效力于卡罗莱纳黑豹队、杰克逊维尔美洲虎队、芝加哥熊队和田纳西泰坦队,不幸的是,2014年他被确诊出患有ALS。之后,轮椅变成了他日子的日常,在没有协助的情况下,Tim再也无法像正常人那样说话、吞咽或呼吸了。失声关于任何人来说,都是毁灭性的冲击。

但走运的是,Tim参加了DeepMind公司以及谷歌(Google)打开的一项针对言语障碍人士的技能项目——Euphonia,有幸成为AI语音辨认和文本转录技能的榜首个ALS获益患者。时隔5年多,Tim和他的家人也再次从头听到了他的原声。

时隔多年,Tim与母亲再次听到由AI组成的“原声”(图片来自:DeepMind官网)

Euphonia项目是针对言语障碍人士的语音到文本的转录服务,根据神经退行性疾病患者的音频数据,结合Parrotron模型(根据注意力机制的Seq2Seq模型),从而能大大的提高语音组成的功率并生成高质量的言语。针对Tim打开的“声响康复”项目继续6个月,研讨人员榜首步先对Tim患病前的声响进行提取,将其声响作为组成语音的样本数据。因而,研讨人员生成了一个名为WaveNet的生成式AI模型。

WaveNeat模型经过辨认韵律从而仿照组成人类言语。与曩昔的一些语音生成模型比较,它发生的语音片段更实在、更具说服力,WaveNet模型在仿照人类语音组成言语方面已达到与人类70%类似的水平,一同具有更高的言语生成功率。该AI模型在谷歌转为机器学习定制的张量处理器(TPU)上运转,1秒钟的语音样本均匀只需要花50毫秒便可创立

WaveNet模型特色在于,不同“口味”的英语也难不倒它。不管是带有印度口音的英语、韩国口音的英语仍是纯粹的英式发音等,它都能够直接进行仿照。现在WaveNet现已用于Google智能助理(Google Assistant)体系,能辨认9种不同口音的英语

图片来自:Pixabay

研讨人员在树立相关模型后,另一要害操作就是微调,这也是从最少的操练数据中获得高质量归纳作用的要害。首要他们在数以千计的扬声器上对WaveNet模型进行大规模的预先操练,然后AI从Tim过往说话的音频影响资料中提取小部分语音样本,不断仿照操练后,WaveNet所生成的语音自然而然会具有说话者自己的特征。

不过光有优异的语音仿照和生成才能还不行,关于AI模型来说,完美的模型体系结构是保证其体系全体运作功率的根底。所以研讨人员将WaveNet模型迁移至WaveRNN模型上,WaveRNN模型更紧凑,所生成的音频更保真。此外研讨人员还对能够将文本转化到语音的体系——Tacotron 2采用了微调技能,它能够根据频谱图或随时刻改变的音频信号频谱的视觉表明树立语音组成模型。也就是说,AI不只学会了“听声拟声”,它还会“看图拟声”!

6个月下来,针对Tim所打开的“语音康复”项目获得不小开展,现在其研讨成果现已向大众进行展现。在由小罗伯特·唐尼叙述的新式技能节目《AI人工智能年代》榜首会集,Tim和家人榜初次听到了自己组成的声响,节目中经过根据Tim从前语音文本进行操练的AI读出了34岁的Time写给22岁的自己的一封信。

Tim(右二)与家人以及Euphonia项目成员一同收看《AI人工智能年代》(图片来自:DeepMind官网)

尽管组成的声响不是很完美,短少一些人类在说话时独有的表达张力,但针对Tim的这项研讨所获得的实践作用来看具有实践使用的潜力及价值。DeepMind研讨副总裁Koray Kavukcuoglu先生表明:“最初始版别的文本-语音转化体系WaveNet于2016年初次推出,跟着时刻的推移,其实际国际的用处不也在断开展。这一技能的老练以及落地,关于像Tim Shaw这样的ALS患者来说是一种期望。”

当疾病降临,它炸毁人类的健康、打乱人类的日子步骤;可别忘了,科技也在开展,那些被疾病环绕时刻,渐渐会跟着先进的技能的指针滚动,直到疾病治好、重回健康。

参考资料(可上下滑动检查)

[1] DeepMind and Google recreate former NFL linebacker Tim Shaw’s voice using AI Retrieved Dec 23, 2019 from https://venturebeat.com/2019/12/18/deepmind-and-google-recreate-former-nfl-linebacker-tim-shaws-voice-using-ai/

[2] Google’s Parrotron is an AI tool for people with speech impediments Retrieved Dec 23, 2019 from https://venturebeat.com/2019/07/17/googles-parratron-is-an-ai-tool-for-people-with-speech-impediments/

[3] ALS is slowly robbing ex-linebacker Tim Shaw of his muscles. But he won't let that stop him from living.

Retrieved Dec 23, 2019 from https://ftw.usatoday.com/2017/02/tim-shaw-book-blitz-your-life-als-lou-gehrigs-disease-tennessee-titans-nfl

点“”,共享AI健康新动态

“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!