语言解码器重建“想象中的语言”-中国自动化学会

CAA科普

Popular science work

首页 - CAA科普 - 科普知识

语言解码器重建“想象中的语言”

日期：2023-05-03 15:26

英国《自然·神经科学》发表的一篇论文，描述了一种非侵入性的语言解码器，可通过功能性磁共振（fMRI）数据，重建感知到或想象出的语言。

过去的语音解码器被用于侵入性神经外科手术后记录神经活动，这限制了它们的用途。其他使用非侵入性脑活动记录的解码器限制在解码单个词汇或短语，还不清楚此类解码器是否可用于连续的自然语言。

美国得克萨斯大学奥斯汀分校研究人员开发了一个解码器，可通过来自fMRI数据获得的脑模式重建连续语言。他们记录了3名参与者倾听16小时叙事故事的fMRI数据，以训练模型在脑活动和语义特征之间进行映射，捕捉特定词组含义和相关的大脑响应。这一解码器模型随后测试了参与者听新故事的脑响应，这些故事没有用在初始训练数据集中。使用这一脑活动，解码器可生成词汇序列，捕捉到新故事的含义，还生成了一些精确的故事词汇和短语。他们发现，解码器可从大多数已知处理语言的脑区和网络的活动中推断连续语言。

这一解码器还可通过fMRI数据预测某个参与者想象的故事的含义，或观看一部无声电影的内容。当一名参与者主动听一个故事，忽略其他同时播放的故事，解码器可识别出那个被主动听的故事的含义。

团队对解码器作了隐私分析，发现当它基于一名参与者的fMRI数据进行训练时，对预测另一名参与者数据的语义内容预测表现不佳。他们总结说，参与者的合作在训练和应用这些非侵入性解码器中非常关键，而未来此类技术的发展，亦需要政策保护心理隐私。

来源：科技日报