-
题名非侵入性连续中文语言语义解码与重建
- 1
-
-
作者
马磊
崔文浩
杨汶汶
王朝欣
-
机构
南通大学信息科学技术学院
伦敦国王学院精神病学、心理学和神经科学研究所
-
出处
《数据采集与处理》
北大核心
2025年第3期616-636,共21页
-
文摘
语言是沟通和认知的基础,大脑多功能区域通过复杂神经网络共同参与语言的感知、理解与生成,深入探索中文语义解码的神经机制对于中文脑机接口(Brain-computer interface,BCI)的研究意义重大。本研究旨在构建一种基于功能性磁共振成像(Functional magnetic resonance imaging,fMRI)的长序列中文连续语义解码方法,称为中文长序列连续语义解码器(Chinese long-sequence continuous semantic decoder,CLCSD),通过信号处理流程和算法优化,实现连续中文语义的高效解码。CLCSD包含神经响应降维、编码模型、语速模型和束搜索解码模型4个部分。神经响应降维通过皮层重建、图像配准和脑区划定等方法,将4维脑响应数据降为2维矩阵。编码模型采用L2正则化回归(岭回归)建立刺激特征与脑响应之间的关系,通过自举法估计噪声协方差以增强泛化。语速模型采用与编码模型类似的思路,将脑响应特征映射到预测的语速。束搜索解码模型利用语言模型的先验概率和编码模型的似然概率,通过束搜索生成最可能的语义序列。CLCSD在公开数据集SMN4Lang上取得了0.674的BERTScore,高于其他长序列中文连续语义解码模型。本研究提出一种高效的长序列中文连续语义解码方法,为中文脑机接口技术的发展提供理论基础和方法参考。
-
关键词
脑机接口
中文语义解码
岭回归
语速模型
束搜索
-
Keywords
brain-computer interface(BCI)
Chinese semantic decoding
ridge regression
speech rate model
beam search
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
Q189
[生物学—神经生物学]
-