期刊文献+
共找到1,129篇文章
< 1 2 57 >
每页显示 20 50 100
Function Words Analysis——A Reading Comprehension Aid for Chinese Engineers
1
作者 Wu Shuoping and Liu Lian(The Second Academy, MAS) 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 1990年第1期86-90,共5页
Background Generally speaking. Chinese college graduates in the fifties and sixties took Russian as their second language, and those who graduated in the seventies had no second language to speak of. Now, in the years... Background Generally speaking. Chinese college graduates in the fifties and sixties took Russian as their second language, and those who graduated in the seventies had no second language to speak of. Now, in the years of our Open Door Policy, they find they have to learn some English and learn it quickly. They try to learn from radio and TV and many take English courses of 4 to 6 months, with varying degree of success. Their chief stumbling blocks 展开更多
关键词 Function words Analysis A Reading Comprehension Aid for chinese Engineers
在线阅读 下载PDF
Effective Analysis of Chinese Word-Segmentation Accuracy
2
作者 MA Weiyin 《现代电子技术》 2007年第4期108-110,共3页
Automatic word-segmentation is widely used in the ambiguity cancellation when processing large-scale real text,but during the process of unknown word detection in Chinese word segmentation,many detected word candidate... Automatic word-segmentation is widely used in the ambiguity cancellation when processing large-scale real text,but during the process of unknown word detection in Chinese word segmentation,many detected word candidates are invalid.These false unknown word candidates deteriorate the overall segmentation accuracy,as it will affect the segmentation accuracy of known words.In this paper,we propose several methods for reducing the difficulties and improving the accuracy of the word-segmentation of written Chinese,such as full segmentation of a sentence,processing the duplicative word,idioms and statistical identification for unknown words.A simulation shows the feasibility of our proposed methods in improving the accuracy of word-segmentation of Chinese. 展开更多
关键词 中文信息处理 汉字处理 自动分割 效率分析
在线阅读 下载PDF
顶中区N200是中文单字字形识别的神经标识
3
作者 胡伟 张豹 +4 位作者 贾小飞 陈辉贤 袁杰 方卓 张学新 《心理学报》 北大核心 2025年第7期1127-1138,I0001-I0003,共15页
中文视觉词汇加工近年来的一个重要发现是,中文双字词识别诱发了一个反映词形加工的顶中区N200脑电成分,该成分呈现了较为少见的重复增强效应。双字词的词形加工是一个复杂过程,不仅包含对两个单字字形信息的加工,还有两个单字间的相对... 中文视觉词汇加工近年来的一个重要发现是,中文双字词识别诱发了一个反映词形加工的顶中区N200脑电成分,该成分呈现了较为少见的重复增强效应。双字词的词形加工是一个复杂过程,不仅包含对两个单字字形信息的加工,还有两个单字间的相对位置关系信息。要进一步理解N200对应的字形加工过程,需要回应一个关键问题,N200是否与单字的字形加工有关。本文以3个实验系统研究了在双字词N200这一时间段内单字诱发的脑电反应,发现与双字词一样,单字在刺激呈现后200 ms也诱发了清晰的顶中区N200反应,且该效应在重复启动时出现增强效应。N200的幅度在双字条件下高于单字,在真字条件下高于假字、非字,说明该成分反映了从部件到单字,从单字到双字的整合加工,是中文单字字形识别的神经标识,为揭示中文词汇识别的时间进程提供了一个关键线索。 展开更多
关键词 顶中区N200 中文 单字 字形加工 词汇识别
在线阅读 下载PDF
词间空格在维吾尔族大学生不同文本呈现方向的汉语句子阅读中的促进作用
4
作者 王永胜 韩洋 +1 位作者 李馨 何立媛 《心理与行为研究》 北大核心 2025年第1期41-48,共8页
为探讨词间空格在维吾尔族大学生不同文本呈现方向汉语阅读中的作用,本研究使用眼动仪记录读者的阅读过程,操纵了文本呈现方向(从左向右和从右向左)、词切分线索(无空格和词间空格)和目标词的词频(高频和低频)。结果发现:维吾尔族大学... 为探讨词间空格在维吾尔族大学生不同文本呈现方向汉语阅读中的作用,本研究使用眼动仪记录读者的阅读过程,操纵了文本呈现方向(从左向右和从右向左)、词切分线索(无空格和词间空格)和目标词的词频(高频和低频)。结果发现:维吾尔族大学生阅读词间空格句子的效率显著高于阅读无空格的句子,从右向左阅读时词间空格条件下的总注视次数显著少于无空格条件;词间空格条件下目标词的注视时间显著短于无空格条件,但词切分线索与词频没有显著的交互作用。结果表明,词间空格作为词切分线索可以提升维吾尔族大学生的汉语阅读效率与词汇加工效率。 展开更多
关键词 词切分 维吾尔族大学生 汉语阅读 眼动
在线阅读 下载PDF
汉语新词学习中的睡眠依赖性记忆巩固
5
作者 刘妮娜 孙文涛 +2 位作者 于杰 高乾程 邬诗卉 《心理与行为研究》 北大核心 2025年第3期289-296,共8页
睡眠在离线记忆巩固中起重要作用。本研究以动物古代雅称的双字生僻真词为材料,探讨立即与延迟睡眠在汉语新词语义学习中的作用。41名大学生被分为夜晚学习的睡眠-清醒组和清晨学习的清醒-睡眠组,并在学习后进行立即、12h和24h的三次测... 睡眠在离线记忆巩固中起重要作用。本研究以动物古代雅称的双字生僻真词为材料,探讨立即与延迟睡眠在汉语新词语义学习中的作用。41名大学生被分为夜晚学习的睡眠-清醒组和清晨学习的清醒-睡眠组,并在学习后进行立即、12h和24h的三次测试。结果显示,在外显测试任务中,睡眠-清醒组在12h后的成绩提升(vs.立即)大于清醒-睡眠组,即立即睡眠有助于巩固记忆,其优势在定义任务中保持至24h;而清醒-睡眠组在24h的提升(vs.12h)更大,即延迟睡眠也能有效巩固记忆,且在图片命名任务中与立即睡眠作用相当。在内隐大小判断任务中,立即和延迟睡眠均促进了新词的语义整合,但方式不同。结果支持睡眠在记忆巩固中的积极巩固和被动保护的双重作用。 展开更多
关键词 睡眠依赖性记忆巩固 新词学习 汉语
在线阅读 下载PDF
民族的现代的法理学的夺人先声——上海交大法学先贤杨廷栋学术思想考论
6
作者 郭延军 童之伟 《交大法学》 北大核心 2025年第2期90-103,共14页
在杨廷栋之前,汉语的“权利”概念在中日两国都曾广泛使用,但从来没有形成以它和对应的“权力”为基本范畴的体系化法学论述。杨廷栋坚持以汉语的“权利”和与其对称的“权力”为基本范畴,创造性地建构出了自己的法理学体系的雏形,后者... 在杨廷栋之前,汉语的“权利”概念在中日两国都曾广泛使用,但从来没有形成以它和对应的“权力”为基本范畴的体系化法学论述。杨廷栋坚持以汉语的“权利”和与其对称的“权力”为基本范畴,创造性地建构出了自己的法理学体系的雏形,后者与以和化的“权利”为核心形成的法理学体系有根本区别。杨氏的法理学体系框架由十二个要点构成,其学术价值已被我国当代法律体系、官方权威性文献的用语和当代有代表性的汉语辞书所证实。可以确信,一百多年来在中国法律生活、法学研究和教学活动中坚持使用汉语的“权利”概念的人们,一定已经或能够直接间接、或多或少从杨氏的法学思想中获得精神滋养。在寻求民族的现代的法理学的今天,杨氏遗留的宝贵思想遗产,值得我们继续发掘、继承和发扬光大。 展开更多
关键词 杨廷栋 汉语权利 和化权利 权力 法理学
在线阅读 下载PDF
英汉两种语言“对应”与“对称”之别——基于体认语言学再议作为汉语最重要语法机制的对称性
7
作者 王寅 《北京第二外国语学院学报》 北大核心 2025年第3期47-60,共14页
世界上普遍存在对称现象,根据体认语言学的核心原则“现实—认知—语言”,人们在心智中形成了“对称性体认方式”,语言中也就产生了很多对称表达。特别是在汉语中,从音、字、词到句、章,各层面都出现了大量的对称现象,我们拟将其视为属... 世界上普遍存在对称现象,根据体认语言学的核心原则“现实—认知—语言”,人们在心智中形成了“对称性体认方式”,语言中也就产生了很多对称表达。特别是在汉语中,从音、字、词到句、章,各层面都出现了大量的对称现象,我们拟将其视为属于孤立语的汉语之最重要语法机制。与之相比,像英语一类的屈折语,词进入句子后必须根据句法规则调整词形,以使词性对应于句法成分,这便是“词本位”语法理论。近年来,很多学者发现用该理论来构建汉语语法体系多有不妥,因此在我国出现了多种本位论,但这些理论都忽视了汉语广泛使用的“对称法”。在进行英汉对比研究时必须重视对应法与对称法之别,这对语言的研究和教学具有重要意义。 展开更多
关键词 英汉对比 对应 对称 词本位 体认语言学
在线阅读 下载PDF
基于大语言模型的中文多义词义项融合技术研究
8
作者 尹宝生 宗辰 《计算机科学》 北大核心 2025年第S1期53-59,共7页
针对中文的一词多义特点,基于现有各类汉语词典资源构建一个义项全面、描述规范的中文多义词知识库,对于汉语语义分析、智能问答、机器翻译以及大语言模型消歧能力调优和评估等具有重要意义。文中针对《现代汉语词典》和《现代汉语规范... 针对中文的一词多义特点,基于现有各类汉语词典资源构建一个义项全面、描述规范的中文多义词知识库,对于汉语语义分析、智能问答、机器翻译以及大语言模型消歧能力调优和评估等具有重要意义。文中针对《现代汉语词典》和《现代汉语规范词典》等资源整合过程中“词条义项含义相同但描述不同”等问题进行了深入分析,并创新性地提出了基于大语言模型和提示学习的多义词义项融合技术,即充分利用大语言模型对常识知识的分析理解和辅助决策能力,通过有效的问题分解策略和提示模版设计,以及义项关系交叉验证等手段完成了多义词义项的自动化融合工作。实验结果表明,在通过正态分布抽取50个多义词共754个义项对的评测数据上,基于上述算法的义项融合的正确率达96.26%,Dice系数为0.973 3。该项研究验证了利用大语言模型开展中文知识资源自动化加工的可行性和有效性,与传统依赖语言专家加工模式相比,在保证较高质量的前提下,显著提升了知识加工效率。 展开更多
关键词 多义词 义项融合 大语言模型 提示学习 中文信息处理
在线阅读 下载PDF
基于中文WordNet的中英文词语相似度计算 被引量:21
9
作者 吴思颖 吴扬扬 《郑州大学学报(理学版)》 CAS 北大核心 2010年第2期66-69,共4页
介绍一种基于中文WordNet的中英文词语相似度计算方法.在WordNet同义词集的上下位关系图中,引入了距离、密度、深度3个因素来估计同义词集之间的相似度,采用一个自适应的方案来解决候选同义词集组合的权重和取舍问题.实现了一个可以计算... 介绍一种基于中文WordNet的中英文词语相似度计算方法.在WordNet同义词集的上下位关系图中,引入了距离、密度、深度3个因素来估计同义词集之间的相似度,采用一个自适应的方案来解决候选同义词集组合的权重和取舍问题.实现了一个可以计算英-英、汉-英、汉-汉词语之间相似度的算法,所得结果比较符合人们对词语的理解. 展开更多
关键词 中文wordNet 词语相似度 语义相似度
在线阅读 下载PDF
面向新闻文本的汉藏新词抽取及分析
10
作者 庞仙 陈波 赵小兵 《北京大学学报(自然科学版)》 北大核心 2025年第1期45-52,共8页
提出一种有效的面向新闻文本的无监督新词抽取方法。该方法通过结合无监督的TopWORDS算法和分词工具PKUSEG,辅助启发式词语抽取方法,实现从汉文和藏文新闻文本中抽取年度新词,共抽取到2022年度汉文新词606个,藏文新词664个。该方法能够... 提出一种有效的面向新闻文本的无监督新词抽取方法。该方法通过结合无监督的TopWORDS算法和分词工具PKUSEG,辅助启发式词语抽取方法,实现从汉文和藏文新闻文本中抽取年度新词,共抽取到2022年度汉文新词606个,藏文新词664个。该方法能够减少人工筛选工作量,并显著地提高新词抽取的效率。与《中国语言生活状况报告2023》发布的2022年度汉文新词相比,该方法抽取的新词在数量和语种方面优势明显。此外,对汉文和藏文新词进行对齐,并从新词的发展和使用状况角度开展案例分析。 展开更多
关键词 新闻文本 汉文 藏文 新词抽取
在线阅读 下载PDF
WNCT:一种WordNet概念自动翻译方法 被引量:6
11
作者 王石 曹存根 《中文信息学报》 CSCD 北大核心 2009年第4期63-70,94,共9页
WordNet是在自然语言处理领域有重要作用的英语词汇知识库,该文提出了一种将WordNet中词汇概念自动翻译为中文的方法。首先,利用电子词典和术语翻译工具将英语词汇在义项的粒度上翻译为中文;其次,将特定概念中词汇的正确义项选择看作分... WordNet是在自然语言处理领域有重要作用的英语词汇知识库,该文提出了一种将WordNet中词汇概念自动翻译为中文的方法。首先,利用电子词典和术语翻译工具将英语词汇在义项的粒度上翻译为中文;其次,将特定概念中词汇的正确义项选择看作分类问题,归纳出基于翻译唯一性、概念内和概念间翻译交集、中文短语结构规则,以及基于PMI的翻译相关性共12个特征,训练分类模型实现正确义项的选择。实验结果表明,该方法对WordNet 3.0中概念翻译的覆盖率为85.21%,准确率为81.37%。 展开更多
关键词 人工智能 机器翻译 wordNet翻译 词汇翻译 翻译消歧 中文词汇知识库 中文信息处理
在线阅读 下载PDF
融合N-Gram和多重注意力机制的能源领域新词发现方法
12
作者 王祎涵 张思佳 +2 位作者 曹恒 刘珈宁 张正龙 《科学技术与工程》 北大核心 2025年第18期7668-7677,共10页
随着能源行业的快速发展和技术革新,大量的专业术语和表达方式不断更新,新词不断涌现。然而,传统的新词发现方法通常依赖于词典或规则,且难以高效率地处理和更新大量的专业术语,特别是在快速变化的能源领域。因此,结合能源领域文本数据... 随着能源行业的快速发展和技术革新,大量的专业术语和表达方式不断更新,新词不断涌现。然而,传统的新词发现方法通常依赖于词典或规则,且难以高效率地处理和更新大量的专业术语,特别是在快速变化的能源领域。因此,结合能源领域文本数据特性,提出了一种融合N-Gram和多重注意力机制的能源领域新词发现方法(new word discovery method in the energy field combining N-Gram and multiple attention mechanism, ENFM)。该方法首先利用N-Gram模型对能源领域的文本数据进行初步处理,通过统计和分析词频来生成新词候选列表。随后,引入融合多重注意力机制的ERNIE-BiLSTM-CRF模型,以进一步提升新词发现的准确性和效率。与传统的新词发现技术相比,在新词的准确识别和整体效率上均有显著提升,将其于能源领域政策文本数据集,准确率、召回率和F1分别为95.71%、95.56%、95.63%。实验结果表明,该方法能够准确地在能源领域的大量文本数据中识别新词,有效识别出能源领域特有的词汇和表达方式,显著提高了中文分词任务中对能源领域专业术语的识别能力。 展开更多
关键词 能源领域 新词发现 预训练模型 N-GRAM 中文分词
在线阅读 下载PDF
TCPColor:基于文本到图像生成模型的中国画配色方案推荐系统
13
作者 张迪 张文安 +4 位作者 姜智德 吴爱霞 孔浩 郭显 陈为 《图学学报》 北大核心 2025年第3期520-531,共12页
传统中国绘画(国画)是中国特有的绘画形式,在其基础上探索配色方案的使用,对现代设计师探索传统艺术与现代设计理念融合有重要意义,但是基于国画知识的色彩推荐系统研究较少,尚未有基于主题、物象和意境等多维度特征提供有效的配色检索... 传统中国绘画(国画)是中国特有的绘画形式,在其基础上探索配色方案的使用,对现代设计师探索传统艺术与现代设计理念融合有重要意义,但是基于国画知识的色彩推荐系统研究较少,尚未有基于主题、物象和意境等多维度特征提供有效的配色检索和推荐的方案。为此,提出一个中国画配色方案推荐系统TCPColor,以中文文本到图像生成模型太乙为基础,使用专家标注的宋代国画数据对模型进行了微调,然后对生成图像使用视觉显著性算法、K-Means聚类和基于色彩距离的色表匹配生成了具有国画风格的配色方案,通过消融实验验证了配色方案提取方法的有效性,并通过客观色彩分析评估了生成配色方案的差异性及与国画配色方案的相似度。与国画专家和志愿者合作进行案例分析、专家评估和用户研究,证明了该研究在配色方案推荐方面的实用性。 展开更多
关键词 传统中国绘画 配色方案 色彩推荐系统 单词颜色关联 文本到图像生成
在线阅读 下载PDF
中西史学研究中“叙事”的概念谱系与理论范式
14
作者 王胜军 张立芹 《河南师范大学学报(哲学社会科学版)》 北大核心 2025年第3期98-104,共7页
“叙事”是目前中西史学界研究的热点之一。在词语使用方面,“叙事”与“序事”是一种包含与被包含的关系,“叙事”和“叙述”则可以在不同情况下使用。英文“narrative”既可作“叙事”,亦可作“叙述”,其选择应依据中文语境下“叙事... “叙事”是目前中西史学界研究的热点之一。在词语使用方面,“叙事”与“序事”是一种包含与被包含的关系,“叙事”和“叙述”则可以在不同情况下使用。英文“narrative”既可作“叙事”,亦可作“叙述”,其选择应依据中文语境下“叙事”和“叙述”的考量标准而定。中国传统叙事理论之叙事与新叙事史之叙事的思想基础虽不同,但都认为史家在充分占有史料的基础上,利用目前掌握的批判考证的一整套家法便可以得到历史事实。西方古典叙事理论之叙事虽然也以追求历史真实为宗旨,但认识历史的方式却是亲眼所见或亲耳所闻。叙事主义历史哲学之叙事从“结构主义”和“语言学”入手,把历史文本等同于文学作品,否定了历史事实的可知性,其理论具有明显的矛盾和局限,但也提醒了人们建立历史叙事和历史实在关联的任务比以往设想的更为严峻。 展开更多
关键词 中西史学 叙事 词语使用 理论内涵
在线阅读 下载PDF
中文专利文本结构信息提取方法
15
作者 吕国燕 戴佳呈 +1 位作者 吕学强 游新冬 《计算机工程与设计》 北大核心 2025年第3期665-672,共8页
专利文本的主体-行为-客体(SAO)结构提取直接影响着专利相似性计算、专利聚类与分类等专利文本挖掘下游任务的应用与效果,但目前存在效率低下和提取结构信息不充分等问题。对此进一步提取中文专利文本的技术方法F和功能效果E。为解决这... 专利文本的主体-行为-客体(SAO)结构提取直接影响着专利相似性计算、专利聚类与分类等专利文本挖掘下游任务的应用与效果,但目前存在效率低下和提取结构信息不充分等问题。对此进一步提取中文专利文本的技术方法F和功能效果E。为解决这一全新任务,提出一种基于深度语义的提取模型,通过词嵌入更好理解专利文本的语义信息,利用双向长短期记忆捕捉长距离的上下文依赖关系,应用多头注意力对关键特征进行更精准的关注。实验结果表明,该方法相较于传统SAO提取方法F1值提升了5.15%,验证了高效提取SAO、F和E结构时,模型各部分的正向效果。 展开更多
关键词 主体-行为-客体结构 中文专利 技术方法 功能效果 词嵌入 双向长短期记忆 多头注意力
在线阅读 下载PDF
基于多特征融合和注意力机制的中文命名实体识别
16
作者 陈奕全 吴晓鸰 +1 位作者 占文韬 HEO Hoon 《小型微型计算机系统》 北大核心 2025年第2期339-345,共7页
近年来,基于字符级嵌入的BERT模型和基于词融合的模型都在中文命名实体识别领域取得了较好的效果,但目前这些模型从字符序列中提取出的特征信息还不够充分,模型性能还有一定的提升空间.因此本文提出了一种用于中文命名实体识别的多特征... 近年来,基于字符级嵌入的BERT模型和基于词融合的模型都在中文命名实体识别领域取得了较好的效果,但目前这些模型从字符序列中提取出的特征信息还不够充分,模型性能还有一定的提升空间.因此本文提出了一种用于中文命名实体识别的多特征融合模型,首先将输入中文语句转换为字词对序列,通过RoBERTa-wwm预训练语言模型将字词对序列中的字符序列表征为字符向量,获得全局语义特征;然后把词序列转化为词向量,再将字符向量和词向量输入到基于双线性注意力机制的词汇适配器获得字词融合特征;同时将字符向量送入到双向长短时记忆网络(BiLSTM)获得包含字符方向信息的上下文特征;最后将词汇适配器的输出和BiLSTM的输出进行动态特征融合获得包含全局语义信息、词汇信息和方向信息的上下文特征,再通过CRF解码获得最优预测序列.在多个公共数据集的实验结果验证了该模型能提取到更充分的特征信息,提高了识别性能. 展开更多
关键词 中文命名实体识别 多特征融合 词融合 预训练模型
在线阅读 下载PDF
加权平均Word2Vec实体对齐方法 被引量:6
17
作者 罗钰敏 刘丹 +1 位作者 尹凯 赵宏森 《计算机工程与设计》 北大核心 2019年第7期1927-1933,共7页
针对已有文本相似度计算方法应用在实体对齐上准确率低的问题,提出一种加权平均Word2Vec的实体对齐方法。利用Word2Vec训练文本,得到词向量模型;使用LTP(language technology platform)工具抽取文本中的命名实体并对其进行分词、去停用... 针对已有文本相似度计算方法应用在实体对齐上准确率低的问题,提出一种加权平均Word2Vec的实体对齐方法。利用Word2Vec训练文本,得到词向量模型;使用LTP(language technology platform)工具抽取文本中的命名实体并对其进行分词、去停用词处理,由Word2Vec得到处理后的词向量;根据分词后出现相同词的情况进行加权归一,得到各实体的特征向量;利用特征向量计算余弦相似度得到对齐结果。实验结果表明,与已有的文本相似度方法及未改进的Word2Vec方法对比,所提方法降低了实体对齐的漏检率,提高了准确性。 展开更多
关键词 词嵌入 命名实体识别 中文组织机构名 实体对齐 词向量
在线阅读 下载PDF
阅读伴随词汇学习的词切分:首、尾词素位置概率的不同作用 被引量:5
18
作者 梁菲菲 冯琳琳 +2 位作者 刘瑛 李馨 白学军 《心理学报》 CSSCI CSCD 北大核心 2024年第3期281-294,共14页
本研究通过两个平行实验,探讨重复学习新词时首、尾词素位置概率信息作用于词切分的变化模式。采用阅读伴随词汇学习范式,将双字假词作为新词,实验1操纵首词素位置概率高低,保证尾词素相同;实验2操纵尾词素位置概率高低,保证首词素相同... 本研究通过两个平行实验,探讨重复学习新词时首、尾词素位置概率信息作用于词切分的变化模式。采用阅读伴随词汇学习范式,将双字假词作为新词,实验1操纵首词素位置概率高低,保证尾词素相同;实验2操纵尾词素位置概率高低,保证首词素相同。采用眼动仪记录大学生阅读时的眼动轨迹。结果显示:(1)首、尾词素位置概率信息的词切分作用随新词在阅读中学习次数的增加而逐步变小,表现出“熟悉性效应”。(2)首词素位置概率信息的“熟悉性效应”表现在回视路径时间、总注视次数两个相对晚期的眼动指标,而尾词素位置概率信息的“熟悉性效应”则从凝视时间开始,到回视路径时间,再持续到总注视时间。结果表明首、尾词素的位置概率信息均作用于阅读伴随词汇学习的词切分,但首词素的作用时程更长,更稳定,支持了首词素在双字词加工中具有优势的观点。 展开更多
关键词 词素位置概率 词切分 阅读伴随词汇学习 中文阅读
在线阅读 下载PDF
基于多头注意力机制字词联合的中文命名实体识别 被引量:2
19
作者 王进 王猛旗 +2 位作者 张昕跃 孙开伟 朴昌浩 《江苏大学学报(自然科学版)》 CAS 北大核心 2024年第1期77-84,共8页
针对现有基于字词联合的中文命名实体识别方法会引入冗余词汇干扰、模型网络结构复杂、难以迁移的问题,提出一种基于多头注意力机制字词联合的中文命名实体识别算法.算法采用多头注意力机制融合词汇边界信息,并通过分类融合BIE词集降低... 针对现有基于字词联合的中文命名实体识别方法会引入冗余词汇干扰、模型网络结构复杂、难以迁移的问题,提出一种基于多头注意力机制字词联合的中文命名实体识别算法.算法采用多头注意力机制融合词汇边界信息,并通过分类融合BIE词集降低冗余词汇干扰.建立了多头注意力字词联合模型,包含字词匹配、多头注意力、融合等模块.与现有中文命名实体识别方法相比,本算法避免了设计复杂的序列模型,方便与现有基于字的中文命名实体识别模型结合.采用召回率、精确率以及F 1值作为评价指标,通过消融试验验证模型各个部分的效果.结果表明,本算法在MSRA和Weibo数据集上F 1值分别提升0.28、0.69,在Resume数据集上精确率提升0.07. 展开更多
关键词 中文命名实体识别 词汇冗余 词汇边界信息 字词联合 多头注意力机制 BIE词集
在线阅读 下载PDF
中文阅读伴随词汇学习中的视觉复杂性效应:基于笔画数和词长的证据 被引量:1
20
作者 梁菲菲 刘瑛 +3 位作者 贺斐 冯琳琳 王峥 白学军 《心理学报》 CSSCI CSCD 北大核心 2024年第12期1734-1750,共17页
通过两个实验考查重复学习新词过程中视觉复杂性效应的变化模式。采用阅读伴随词汇学习范式,将双字假词作为新词,嵌入15个语境,分5个时间段供被试阅读。实验1操纵新词笔画数(多、少),实验2操纵新词词长(两字词、三字词),记录大学生阅读... 通过两个实验考查重复学习新词过程中视觉复杂性效应的变化模式。采用阅读伴随词汇学习范式,将双字假词作为新词,嵌入15个语境,分5个时间段供被试阅读。实验1操纵新词笔画数(多、少),实验2操纵新词词长(两字词、三字词),记录大学生阅读句子时的眼动轨迹。结果发现,随着新词学习次数的增加,笔画数效应并未发生显著变化,表明笔画数作为反映汉字视觉复杂性的因素之一,同时作用于词汇学习的早期和晚期,符合视觉限制性假说;相比之下,随着新词学习次数的增加,词长效应逐步减小,表现出词长的“熟悉性”效应,符合视觉和语言共同限制性假说。上述发现表明,笔画数和词长在中文阅读伴随词汇习得中的作用机制存在差异:笔画数类似于一种低水平视觉信息,作用于词汇加工的视觉层;而词长则更加类似语言信息的加工方式,作用于词汇加工的较高层级。 展开更多
关键词 笔画数 词长 阅读伴随词汇学习 中文阅读 眼动
在线阅读 下载PDF
上一页 1 2 57 下一页 到第
使用帮助 返回顶部