首页 » SEO优化 » 人机对话php技巧_Nature重磅华裔科学家成功解码脑电波人机对话成为可能

人机对话php技巧_Nature重磅华裔科学家成功解码脑电波人机对话成为可能

访客 2024-11-24 0

扫一扫用手机浏览

文章目录 [+]

【新智元导读】Nature揭橥华裔作者论文:通过解码大脑活动提升语音的清晰度,利用深度学习方法直接从大脑旗子暗记中产生口语句子,达到150个单词,靠近正凡人水平。

大脑活动能够解码针言音了。

人机对话php技巧_Nature重磅华裔科学家成功解码脑电波人机对话成为可能

说话彷佛是一项绝不费力的活动,但它实在是人类最繁芜的动作之一。
说话须要精确、动态地折衷声道发音器官构造中的肌肉——嘴唇、舌头、喉部和下颌。
当由于中风、肌萎缩侧索硬化症或其他神经系统疾病而导致言语中断时,损失说话能力可能是毁灭性的。

人机对话php技巧_Nature重磅华裔科学家成功解码脑电波人机对话成为可能
(图片来自网络侵删)

来自加州大学旧金山分校的科学家创造了更靠近能够规复说话功能的脑机接口(brain–computer interface, BCI)。

脑机接口旨在帮助瘫痪患者直接从大脑中“读取”他们的意图,并利用这些信息掌握外部设备或移动瘫痪的肢体,这项技能目前能够使瘫痪的人每分钟最多能打出8个单词,而加州大学旧金山分享的研究职员开拓了一种方法,利用深度学习方法直接从大脑旗子暗记中产生口语句子,达到150个单词,靠近正凡人水平!

这项研究揭橥在最新一期《自然》杂志上,作者为Anumanchipalli以及华裔科学家Edward Chang等人。

每分钟能够天生150单词,靠近正凡人类水平

加州大学旧金山分校的研究职员与5名志愿者互助,志愿者们接管了一项被称为“颅内监测”的实验,个中电极被用于监测大脑活动,作为癫痫治疗的一部分。

许多癫痫患者的药物治疗效果并不好,他们选择接管脑部手术。
在术前,年夜夫必须首先找到病人大脑中癫痫产生发火的“热点”,这一过程是通过放置在大脑内部或表面的电极来完成的,并监测明显的电旗子暗记高峰。

精确定位“热点”的位置可能须要数周韶光。
在此期间,患者通过植入大脑区域或其附近的电极来度日,这些区域涉及运动和听觉旗子暗记。
这些患者一样平常会赞许利用这些植入物进行额外的实验。

ECoG电极阵列由记录大脑活动的颅内电极组成

这次招募的五名志愿者赞许测试虚拟语音发生器。
每个患者都植入了一两个电极阵列:图章大小的、包含几百个微电极的小垫,放置在大脑表面。

实验哀求参与者背诵几百个句子,电极会记录运动皮层中神经元的放电模式。
研究职员将这些模式与患者在自然说话时嘴唇,舌头,喉部和下颌的眇小运动联系起来。
然后将这些动作翻译成口语化的句子。

参与的志愿者大脑中的电极阵列位置

实验哀求母语为英语的人听这些句子,以测试虚拟语音的流畅性。
研究创造,大约70%的虚拟系统天生的内容是可理解的。

终极,这套新系统每分钟能够天生150单词,靠近自然讲话的语速水平。
而以前基于植入物的通信系统每分钟可以天生大约8个单词。

技能细节:两阶段解码方法

在这项事情中,研究职员利用了一种叫做高密度皮层脑电图的技能来跟踪志愿者说话时大脑中掌握言语和发音器官运动的区域的活动,志愿者们被哀求说了几百句话。

为了重修话语,Anumanchipalli等人不是将大脑旗子暗记直接转换为音频旗子暗记,而是利用一种两级解码的方法。
他们首先将神经旗子暗记转换为声道发音器官运动的表示,然后将解码的运动转换为口语句子,如图1所示。
两次转换都利用了递归神经网络——一种人工神经网络,在处理和转换具有繁芜韶光构造的数据时特殊有效。

图1:语音合成的脑机接口

在上图A中,以前的语音合成研究采取的方法是利用脑电图(ECoG)设备监测大脑语音干系区域的神经旗子暗记,并考试测验将这些旗子暗记直接解码合针言音,利用一种称为递归神经网络(RNN)的人工神经网络;

上图B中,Anumanchipalli等人开拓了一种不同的方法,RNN被用于两阶段解码。
个中一个解码步骤是将神经旗子暗记转换成声道发声器官(赤色)的预估运动,涉及到语音天生的解剖构造(嘴唇、舌头、喉部和下颌)。
为了在第一个解码步骤中进行演习,作者须要每个人的声道运动与他们的神经活动关联起来的数据。

由于无法直接丈量每个人的声道运动,Anumanchipalli等人构建了一个RNN来预估这些运动,其演习数据是之前网络的大量声道运动数据和语音录音。
这个RNN产生的声道运动估计足以演习第一个解码器。
第二个解码步骤将这些估计的动作转换成合针言音。
Anumanchipalli和他的同事的两步解码方法产生的口语句子的失落真率明显低于直接解码方法得到的句子。

与直接解码声学特色比较,作者采取的两阶段解码方法能明显减小声音失落真。
如果可以得到跨多种语音条件的海量数据集,那么直接合成可能会靠近或优于两阶段解码的方法。

然而,考虑到现实中数据集的匮乏,解码的中间阶段会将声道发音器官正常运动功能的信息带入模型,并限定必须评估的神经网络模型的可能参数。
这种方法彷佛使神经网络能够实现更高的性能。
终极,反响正常运动功能的“仿生”方法可能在复制自然措辞范例的快速、高精度通信方面发挥关键浸染。

不能说话的个体也能实现语音合成

在脑机接口(BCI)研究中,包括新兴的语音脑机接口领域,开拓和采取许可跨研究进行故意义的比较的稳健度量是一项寻衅。
例如,重构原始语音的缺点等度量可能与脑机接口的功能性能(即听者是否能听懂合成的语音)险些没有对应关系。

为理解决这个问题,Anumanchipalli等人从语音工程领域出发,开拓了易于复制的人类听众语音可懂度丈量方法。
他们在众包市场Amazon Mechanical Turk上招募用户,让志愿者识别合针言音中的单词或句子。
与重构缺点或以前利用的自动可懂度丈量方法不同,这种方法直接丈量语音对人类听众的可懂度,而不须要与原始话语进行比较。

Anumanchipalli和他的同事的研究结果为语音合成脑机接口的观点供应了令人信服证据,无论是在音频重修的准确性方面,还是在听者对产生的单词和句子进行分类的能力方面。

然而,在通往临床可行的语音脑机接口的道路上仍有许多寻衅。

重构语音的可理解性仍远低于自然语音,脑机接口能否通过网络更大的数据集并连续开拓底层的打算方法来进一步改进还有待不雅观察。
利用记录局部脑活动的神经接口可能比利用皮层脑电图记录的更为有效。
例如,在脑机接口研究的其他领域,皮质内微电极阵列常日比皮质脑电图具有更高的性能。

目前所有语音解码方法的另一个限定是须要利用语音来演习解码器。
因此,基于这些方法的脑机接口不能直接应用于无法说话的人。
但是Anumanchipalli和他的同事们创造,当志愿者在不发声的情形下模拟语音时,语音合成仍旧是可行的,只管语音解码的准确率要低得多。
无法产生语音干系动作的个体是否能够利用语音合成脑机接口是未来研究的一个问题。

基于神经解码的无声模拟语音合成

值得把稳的是,在首次对脑机接口进行观点验证研究以掌握康健动物的手臂和手的运动之后,人们对这种脑机接口在瘫痪患者身上的适用性提出了类似的问题。
随后的临床试验令人信服地证明,利用脑机接口,人类可以快速互换、掌握机器臂、规复瘫痪肢体的觉得和运动等。

末了,这些令人信服的观点验证证明了不能说话的个体也能实现语音合成,结合脑机接口在上肢瘫痪患者中的快速进展,研究职员认为该当大力考虑涉及言语障碍患者的临床研究。
随着持续的进步,希望更多有措辞障碍的人能够重新得到自由表达思想的能力,并重新与周围的天下联系起来。

华裔科学家解码,马斯克脑机接口公司也会有新动作

Nature这篇文章的作者之一是加州大学旧金山分校神经外科教授Edward Chang博士。

Edward Chang

Edward Chang博士的研究重点是言语、运动和人类情绪的大脑机制,同时他也是加州大学旧金山分校和加州大学伯克利分校的互助单位——神经工程与假肢中央的联合卖力人。
该中央搜集了工程、精力病学和神经外科方面的专家,以开拓最前辈的生物医学技能,用以规复神经系统残疾患者的功能,如瘫痪和言语障碍。

Edward Chang博士表示,这次在Nature上的研究,“我们通过解码大脑活动提升语音的清晰度,仿照的语音比从大脑中提取声音表示的合针言音更准确、更自然。

人类将大脑与打算机相连的努力越来越多。

上个月,美国一组科学家在biorxiv.org上揭橥一篇论文,称找到了快速将电线植入大鼠大脑的方法,论文中描述这个过程是“向人类大脑直接插入打算机潜在系统迈出的主要一步”。

研究职员将他们的系统称为“缝纫机”(sewing machine),科学家在实验室中移除一块老鼠的头骨并插入一根针头,将柔性电极送入老鼠的脑组织。

彭博新闻宣布,这组科学家与马斯克的脑机接口公司Neuralink有各种疏松关联。

Neuralink于2016年注册为加州的一家医学研究公司,该公司聘请了来自不同大学的几位有名神经科学家,并与加州大学戴维斯分校的实验室签约,对灵长类动物进行研究。

本周三,当Twitter用户讯问Neurink的进展时,马斯克说,“可能会在几个月内宣告一些值得把稳的事情。

马斯克认为,脑机接口技能能在2021年之前治疗严重的脑损伤。
此外,科学可以通过脑机接口扩大人类的能力。
他举了一个例子:人们可以通过心灵感应来传达繁芜的观点,“你不须要用措辞表达”。

人类是否有一天会与机器合并?马斯克认为,人类已经在某种程度上做到了这一点,由于智好手机等近乎无所不在的技能,因此脑机接口这项事情该当连续下去。

这可能会导致科幻未来,由于人们可以在脑海中下载外语,你以为呢?

参考链接:

https://www.nature.com/articles/d41586-019-01181-y

https://www.sfchronicle.com/bayarea/article/UCSF-technology-could-be-breakthrough-for-those-13790358.php

https://www.bloomberg.com/news/articles/2019-04-11/team-linked-to-elon-musk-neuralink-outline-brain-monitor-system

标签:

相关文章

语言枚举类型,探索人类语言多样性的奥秘

语言是人类交流的重要工具,也是人类文明发展的重要标志。随着全球化进程的不断推进,各种语言枚举类型应运而生。本文将从语言枚举类型的定...

SEO优化 2024-12-29 阅读0 评论0

语言栏消失,科技变革下的挑战与机遇

近年来,随着科技的飞速发展,智能手机、平板电脑等移动设备的普及,语言栏这一功能已经成为了我们日常生活中不可或缺的一部分。近期有消息...

SEO优化 2024-12-29 阅读0 评论0

语言混合现象的多元魅力与挑战

语言混合作为一种跨文化交流的现象,逐渐成为世界范围内语言学研究的热点。它不仅丰富了语言的多样性,也反映了全球化背景下人类社会的交流...

SEO优化 2024-12-29 阅读0 评论0

语言是思想的载体,介绍语言与思想的关系

在人类文明的进程中,语言一直扮演着至关重要的角色。它不仅是人们沟通交流的工具,更是承载着人类思想的载体。自古以来,人们就深知语言与...

SEO优化 2024-12-29 阅读0 评论0