期刊文献+
共找到44篇文章
< 1 2 3 >
每页显示 20 50 100
中国计算语言学研究现状与展望 被引量:4
1
作者 耿立波 酆格斐 +1 位作者 詹卫东 杨亦鸣 《语言科学》 CSSCI 北大核心 2021年第5期491-499,共9页
“十三五”期间我国的计算语言学取得了长足的进步与发展,受到深度学习算法的推进,基础研究方面出现了较大突破,在语音识别、机器翻译、自动问答系统、知识资源建设、古文字和其他语种语言信息处理等应用方面也出现了很多重要成果。但... “十三五”期间我国的计算语言学取得了长足的进步与发展,受到深度学习算法的推进,基础研究方面出现了较大突破,在语音识别、机器翻译、自动问答系统、知识资源建设、古文字和其他语种语言信息处理等应用方面也出现了很多重要成果。但与世界先进水平相比,目前在很多领域内我们还只是处于跟跑阶段,并且深度学习算法的红利也已接近释放殆尽,在未来仍需要从算法基础架构、人脑语言的本质、深层语言理解等方面展开研究,发展机器语言能力等新兴方向,并积极开展复合型语言学人才的培养。 展开更多
关键词 计算语言学 深度学习 机器语言能力
在线阅读 下载PDF
当代机器语言能力的研究现状与展望 被引量:11
2
作者 耿立波 刘涛 +2 位作者 俞士汶 孙茂松 杨亦鸣 《语言科学》 CSSCI 北大核心 2014年第1期34-41,共8页
机器语言能力是当代科学研究领域中的前沿和重大课题。文章首先对机器语言能力研究的现状进行了回顾和分析,然后对其发展趋势进行了展望,指出研究语言的大脑神经机制是实现机器语言能力研究突破的新路径;有必要构建机器语言能力评估等... 机器语言能力是当代科学研究领域中的前沿和重大课题。文章首先对机器语言能力研究的现状进行了回顾和分析,然后对其发展趋势进行了展望,指出研究语言的大脑神经机制是实现机器语言能力研究突破的新路径;有必要构建机器语言能力评估等级量表,以便有针对性地提升机器处理人类自然语言的能力;提高机器的语言能力还必须加强学科间的合作和研究队伍的培养与建设。 展开更多
关键词 机器 语言能力 神经机制 等级量表
在线阅读 下载PDF
机器翻译与语言研究 被引量:3
3
作者 詹卫东 常宝宝 俞士汶 《语言科学》 2002年第1期47-61,共15页
本文从机器翻译的一般模式谈起,讨论了服务于机器翻译的语言研究应该注意的问题,包括:应更加重视形式与意义之间对应关系的系统研究;应重视以机器为“标准”来扩大关注的语言现象的范围;应重视在形式化的知识表示框架下进行大规模的语... 本文从机器翻译的一般模式谈起,讨论了服务于机器翻译的语言研究应该注意的问题,包括:应更加重视形式与意义之间对应关系的系统研究;应重视以机器为“标准”来扩大关注的语言现象的范围;应重视在形式化的知识表示框架下进行大规模的语言工程实践的研究工作。 展开更多
关键词 机器翻译 语言研究 电子词典 短语结构规则 形式化 语言知识库
在线阅读 下载PDF
一种基于情感计算与层次化多头注意力机制的负面新闻识别方法 被引量:3
4
作者 张仰森 周炜翔 +1 位作者 张禹尧 吴云芳 《电子学报》 EI CAS CSCD 北大核心 2020年第9期1720-1728,共9页
网络负面新闻识别在网络舆情监测中具有重要的研究意义.针对当前海量数据下负面新闻难以检测的问题,提出了一种基于情感计算与层次化多头注意力机制相结合的负面新闻识别方法.首先,从新闻文本中采用TF-IDF(Term Frequeney-Inverse Docum... 网络负面新闻识别在网络舆情监测中具有重要的研究意义.针对当前海量数据下负面新闻难以检测的问题,提出了一种基于情感计算与层次化多头注意力机制相结合的负面新闻识别方法.首先,从新闻文本中采用TF-IDF(Term Frequeney-Inverse Document Frquency)和语义相似度算法构建负面新闻情感词库;其次,采用情感倾向计算方法计算负面新闻情感词的情感倾向度;最后,将词语和词语的情感倾向度进行向量化表示,并采用层次化多头注意力机制进行正负面新闻的判定.情感计算和多头注意力机制的引入,对于捕获文本中的情感词语提供了很大帮助.最终本文基于真实的网络新闻文本数据与现有的多种算法进行对比,证明了该模型具有较好的识别效果,相比于Han模型和LSTM模型分别提高了0.67%和3.29%. 展开更多
关键词 语义相似度 情感计算 多头注意力模型 情感倾向
在线阅读 下载PDF
面向语言能力提升的汉语成语知识库及其扩展 被引量:1
5
作者 俞士汶 罗鳯珠 +2 位作者 朱学锋 王雷 常宝宝 《西华大学学报(自然科学版)》 CAS 2015年第5期1-6,共6页
汉语成语知识库是北京大学计算语言学研究所研制的综合型语言知识库大家庭中的一名新成员,无论是对人还是机器的语言能力的提升,它都可以发挥作用。文章较详细地介绍汉语成语知识库的内容、构建理念和发展历程。将汉语成语知识库与台湾... 汉语成语知识库是北京大学计算语言学研究所研制的综合型语言知识库大家庭中的一名新成员,无论是对人还是机器的语言能力的提升,它都可以发挥作用。文章较详细地介绍汉语成语知识库的内容、构建理念和发展历程。将汉语成语知识库与台湾元智大学罗凤珠研制的诗词曲典故资料库相连接,2个知识库相得益彰。文章还提出了基于汉语成语知识库值得进一步研究的若干课题。 展开更多
关键词 !综合型语言知识库 语言能力 成语 成语知识库 典故资料库
在线阅读 下载PDF
面向自然语言处理的机器词典的研制 被引量:2
6
作者 俞士汶 朱学锋 《辞书研究》 2019年第2期22-30,I0001,共10页
北京大学计算语言学研究所积30余年之努力,研制了一部面向自然语言处理的机器词典,即《现代汉语语法信息词典》(以下简称GKB)。基于GKB,又衍生了一系列成果,进而集成为综合型语言知识库。文章扼要介绍GKB及相关成果,并总结从事大型语言... 北京大学计算语言学研究所积30余年之努力,研制了一部面向自然语言处理的机器词典,即《现代汉语语法信息词典》(以下简称GKB)。基于GKB,又衍生了一系列成果,进而集成为综合型语言知识库。文章扼要介绍GKB及相关成果,并总结从事大型语言工程的实践经验,期望这些经验不仅对语言工程的实践者,而且对探索学科交叉融合的学者都有参考价值。 展开更多
关键词 自然语言处理 语言工程 现代汉语语法信息词典 综合型语言知识库 交叉学科
在线阅读 下载PDF
论篇名语言的标记性 被引量:7
7
作者 刘云 《云梦学刊》 2003年第4期104-107,共4页
篇名语言与自然语言相比有众多差异,本文从标记理论出发给予了统一的解释,指出篇名语言与自然语言相比是一种标记性语言。文章揭示了篇名语言标记性的种种表现形式,并分析了篇名语言标记性的语用动因,具体包括三个因素:称名性、话题性... 篇名语言与自然语言相比有众多差异,本文从标记理论出发给予了统一的解释,指出篇名语言与自然语言相比是一种标记性语言。文章揭示了篇名语言标记性的种种表现形式,并分析了篇名语言标记性的语用动因,具体包括三个因素:称名性、话题性、经济性。 展开更多
关键词 篇名语言 标记性 语用动因
在线阅读 下载PDF
语义成分、意义的结构及释义语言研究的价值
8
作者 朱彦 《辞书研究》 北大核心 2010年第6期13-26,共14页
语义成分是词义分解中的一个重要的概念,但语义成分究竟是什么东西,目前还没有清晰的认识。文章认为,语义成分是释义语言的组成成分,并由此出发,重新解释了语义成分的"普遍性"、"有限性"和"不可还原性",... 语义成分是词义分解中的一个重要的概念,但语义成分究竟是什么东西,目前还没有清晰的认识。文章认为,语义成分是释义语言的组成成分,并由此出发,重新解释了语义成分的"普遍性"、"有限性"和"不可还原性",确认了语义成分分析的相对性,提出从释义语的结构入手研究意义结构的新思路。文章把实义义位的结构概括为公式"实义义位-参照点(+区别特征)",并指出了该公式在词义研究中的价值,以及释义语言研究在词义研究中的根基性地位。 展开更多
关键词 语义成分 释义语言 意义的结构
在线阅读 下载PDF
“综合型语言知识库”获国家科技进步奖二等奖
9
《汉语学报》 CSSCI 北大核心 2012年第2期94-94,共1页
由北京大学计算语言学研究所研制的综合型语言知识库(Comprehensive Language Knowledge Base,简称:CLKB)继近几年连续获得政府部门和全国性学术团体的奖励之后,又获得了2011年度国家科学技术进步奖二等奖(证书号:2011-J-220—2... 由北京大学计算语言学研究所研制的综合型语言知识库(Comprehensive Language Knowledge Base,简称:CLKB)继近几年连续获得政府部门和全国性学术团体的奖励之后,又获得了2011年度国家科学技术进步奖二等奖(证书号:2011-J-220—2—02)。项目第一完成人俞士汶教授2012年2月14日参加了在北京举行的国家科学技术奖励大会。 展开更多
关键词 计算语言学 国家科技进步奖 知识库 综合型 国家科学技术奖励大会 国家科学技术进步奖 LANGUAGE 北京大学
在线阅读 下载PDF
语料库技术及其应用 被引量:50
10
作者 常宝宝 俞士汶 《外语研究》 CSSCI 北大核心 2009年第5期43-51,共9页
现代意义上的语料库最早出现于20世纪60年代,40多年来,发展迅速,不但规模越来越大,而且加工深度越来越深,语料库方法在语言研究和计算语言学研究领域发挥了重要作用。本文首先概要介绍了语料库的概念、发展和应用,然后介绍了北京大学的... 现代意义上的语料库最早出现于20世纪60年代,40多年来,发展迅速,不但规模越来越大,而且加工深度越来越深,语料库方法在语言研究和计算语言学研究领域发挥了重要作用。本文首先概要介绍了语料库的概念、发展和应用,然后介绍了北京大学的现代汉语基本标注语料库和汉英双语平行语料库,最后介绍了北京大学计算语言学所开发的基于语料库的双语词典编纂平台,重点介绍了其中的词汇分析技术。 展开更多
关键词 语料库 汉语语料库 汉英平行语料库 词典编纂平台
在线阅读 下载PDF
从“如果”与“如果说”的差异看“说”的传信义 被引量:41
11
作者 李晋霞 刘云 《语言科学》 2003年第3期59-70,共12页
文章从“说”的传信义出发尝试解释“如果”句式与“如果说”句式之间的差异。主要考察了以下内容:“如果”句式与“如果说”句式之间的差异;“如果说”中“说”的传信义;表示传信义的“说”的来源及对其传信义的进一步验证;“如果说”... 文章从“说”的传信义出发尝试解释“如果”句式与“如果说”句式之间的差异。主要考察了以下内容:“如果”句式与“如果说”句式之间的差异;“如果说”中“说”的传信义;表示传信义的“说”的来源及对其传信义的进一步验证;“如果说”的功能扩展;由“说”的传信义引发的“如果说”句式的特殊修辞效果。文章提出以下一些观点:自然语流中,“如果”句式与“如果说”句式在推理类型上有所侧重,前者重在表示逻辑推理,后者重在表示隐喻推理;“如果说”中的“说”是标志言者对所述内容的真实性持弱信任态度的传信标记;这一传信标记的“说”很有可能来自于表示间接引语的“说”。 展开更多
关键词 如果 如果说 传信
在线阅读 下载PDF
参照生成词库理论对动名兼类现象再讨论 被引量:7
12
作者 俞士汶 朱学锋 刘扬 《辞书研究》 2020年第4期1-8,I0001,共9页
词的兼类问题及其处理策略是历久弥新的现代汉语词类研究中重要而又困难的课题之一。文章简要介绍汉语语法学界关于兼类的研究,然后参照生成词库理论,对其中最受关注的动名兼类现象再次进行讨论。根据陆俭明教授从汉语教学需要出发对兼... 词的兼类问题及其处理策略是历久弥新的现代汉语词类研究中重要而又困难的课题之一。文章简要介绍汉语语法学界关于兼类的研究,然后参照生成词库理论,对其中最受关注的动名兼类现象再次进行讨论。根据陆俭明教授从汉语教学需要出发对兼类词下的定义,认识到字形和读音相同的动词与名词互为兼类词的条件是它们互为语义角色。文章还从语义层面论述了名动词不处理为动名兼类的合理性。文章在融合语法研究与语义研究方面是一个尝试,最后提出与兼类相关的一些语言学问题及语言工程任务。 展开更多
关键词 生成词库理论 兼类词 动名兼类 名动词 语义角色
在线阅读 下载PDF
基于机器学习方法的汉语名词隐喻识别 被引量:4
13
作者 王治敏 王厚峰 俞士汶 《高技术通讯》 CAS CSCD 北大核心 2007年第6期575-580,共6页
把机器学习方法引入汉语隐喻识别的研究。隐喻识别过程被描述成隐喻义与字面义的分类问题,通过最大熵和朴素贝叶斯两种方法的隐喻建模,在综合上下文词语、词性等多项特征的基础上,最后初步确定了最大熵识别的理想窗口,进而又引入左右位... 把机器学习方法引入汉语隐喻识别的研究。隐喻识别过程被描述成隐喻义与字面义的分类问题,通过最大熵和朴素贝叶斯两种方法的隐喻建模,在综合上下文词语、词性等多项特征的基础上,最后初步确定了最大熵识别的理想窗口,进而又引入左右位置特征来提高实验效果。在两种模型的比较实验中,最大熵模型在隐喻识别方面有明显的优势。 展开更多
关键词 隐喻识别 优选语义 最大熵 朴素贝叶斯 特征选取
在线阅读 下载PDF
疑问代词“谁”的虚指和否定意义的形成机制 被引量:17
14
作者 袁毓林 刘彬 《语言科学》 CSSCI 北大核心 2017年第2期113-125,共13页
文章主要讨论疑问代词"谁"的虚指意义和否定意义的形成机制。文章尝试证明虚指用法的"谁"字句通过不确定性陈述语气,来消除疑问代词"谁"的询问意义,但是保留了它的预设意义"存在着某些个人",... 文章主要讨论疑问代词"谁"的虚指意义和否定意义的形成机制。文章尝试证明虚指用法的"谁"字句通过不确定性陈述语气,来消除疑问代词"谁"的询问意义,但是保留了它的预设意义"存在着某些个人",从而使虚指用法的"谁"表示"不能确定一定存在的某些个人"。而否定用法的"谁"字句通过质疑和反驳等反问语气,在"疑有信无"原则的指导下,不仅消除了疑问代词"谁"的询问意义,而且消除了它的预设意义"存在着某些个人",从而使否定用法的"谁"表示"确定不存在的某些个人"。最后,文章还分析了"谁让我小呢?"之类特殊句式的意义,说明它跟一般的"谁"类反问句在语义解释上具有一致性。 展开更多
关键词 疑问代词“谁” 询问意义 虚指意义 否定意义 疑有信无 语义解释
在线阅读 下载PDF
从中动句看主语名词的物性结构的句型投射 被引量:17
15
作者 袁毓林 曹宏 《语言科学》 CSSCI 北大核心 2021年第3期246-261,共16页
文章先介绍和评论胡旭辉(2019)基于分布式形态学理论,对汉语中动句的解决方案,指出其在理论和经验上可能存在的问题;然后提出我们对于汉语中动句的朴素的解释方案:基于主语名词的物性结构,不仅关注中动词(V)与主语名词(NP)之间的处置关... 文章先介绍和评论胡旭辉(2019)基于分布式形态学理论,对汉语中动句的解决方案,指出其在理论和经验上可能存在的问题;然后提出我们对于汉语中动句的朴素的解释方案:基于主语名词的物性结构,不仅关注中动词(V)与主语名词(NP)之间的处置关系,而且关注句末形容词性成分(AP)与主语名词(NP)之间的评价关系,更进一步关注这两种物性角色关系之间的"背景-图像"式的视角关系;最后,把这种从主语名词的物性结构出发看待句子的结构方式和语义表达思想,推广到主语名词的各种物性角色作谓语所造成的不同语义-语用类型句子上,从而提出一种基于主语(或话题)名词的物性结构来解释句型构造及其语义表达的语法分析方法。 展开更多
关键词 分布式形态学 中动句 中动词 主语名词 物性角色 句型构造
在线阅读 下载PDF
基于多种词特征的微博突发事件检测方法 被引量:5
16
作者 张仰森 段宇翔 +1 位作者 王建 吴云芳 《电子学报》 EI CAS CSCD 北大核心 2019年第9期1919-1928,共10页
近年来,各领域内频频发生各类突发事件,对社会稳定发展产生了一定程度的影响.本文提出了一种基于多种词特征的微博突发事件检测模型,可以在海量微博数据中对突发事件进行检测,便于相关决策者进行微博监控和舆论引导,尽可能减少突发事件... 近年来,各领域内频频发生各类突发事件,对社会稳定发展产生了一定程度的影响.本文提出了一种基于多种词特征的微博突发事件检测模型,可以在海量微博数据中对突发事件进行检测,便于相关决策者进行微博监控和舆论引导,尽可能减少突发事件给社会带来的危害.首先根据时间信息对微博数据进行时间切片,对每一个时间窗口内的数据分别计算各个词语的词频特征、话题标签特征和词频增长率特征;然后基于D-S证据理论和层次分析法,确定词的各个特征权重,并进行加权融合得到词的突发特征值,将突发特征值大的词挑选出来构成突发特征词集,构建基于共现度和结合紧密度的突发事件特征词集的耦合度矩阵;最后将该耦合度矩阵作为凝聚式层次聚类算法的输入,生成一棵由突发词为叶子节点的二叉树,并采用内部相似度的二叉树剪枝算法对聚类结果进行划分,即可实现对相应时间窗口突发事件的检测.实验结果表明,基于突发词的事件检测模型在簇内部相似度阈值等于1.1时效果最好,正确率达到0.8462、召回率达到0.8684、F值为0.8571,表明了本文所提方法的有效性. 展开更多
关键词 微博 突发事件 突发特征词 D-S证据理论 凝聚式层次聚类
在线阅读 下载PDF
“把”字句中的“了/着/过” 被引量:16
17
作者 王惠 《汉语学习》 CSSCI 北大核心 1993年第1期6-12,共7页
零 前言 “了/着/过”在“把”字句中共有以下两个可能的位置: A.处于句中(N<sub>1</sub>把N<sub>2</sub>V+了/着/过+其他成分) (1)护士把水端了进来。(2)她打三天前就天天把这副脸冲着我。(王朔《... 零 前言 “了/着/过”在“把”字句中共有以下两个可能的位置: A.处于句中(N<sub>1</sub>把N<sub>2</sub>V+了/着/过+其他成分) (1)护士把水端了进来。(2)她打三天前就天天把这副脸冲着我。(王朔《玩的就是心跳》)(3)她把小张打伤过三次 B.处于句末(N<sub>1</sub>把N<sub>2</sub>V+了/着/过) (4)护士把水端进来了。 (5)别忘了把介绍信带着! (6)他从没把小张打伤过本文要讨论的是B组中的“了/着/过”。过去一般都把它们看作与A组一样的时态助词(王力,1944;马真,1984;王军虎,1988)。可这样以来,就会遇到一些难以回答的问题, (ⅰ)既然单个动同加上时态助词形成“复杂形式”以后就有可能进入“把”字句,那么,为什么有的动词加上“了/着/过”可以在“把”字句中出现,而有的又不能呢?它们又分别是哪些动词呢? 展开更多
关键词 “把”字句 时态助词 “把”字结构 词尾 述补结构 “了” 单个动词 谓语 “着” 受事者
在线阅读 下载PDF
基于Web的无指导译文消歧词模型与N-gram模型及对比研究 被引量:3
18
作者 刘鹏远 赵铁军 《电子与信息学报》 EI CSCD 北大核心 2009年第12期2969-2974,共6页
该文提出了基于Web的无指导译文消歧的词模型及N-gram模型方法,并在尽可能相同的条件下进行了比较。两种方法均利用搜索引擎统计不同搜索片段在Web上的Page Count作为主要消歧信息。词模型定义了汉语词汇与英语词汇之间的双语词汇Web相... 该文提出了基于Web的无指导译文消歧的词模型及N-gram模型方法,并在尽可能相同的条件下进行了比较。两种方法均利用搜索引擎统计不同搜索片段在Web上的Page Count作为主要消歧信息。词模型定义了汉语词汇与英语词汇之间的双语词汇Web相关度,根据汉语上下文词汇与英语译文之间的相关度进行消歧;N-gram模型首先假设不同语义下的多义词N-gram序列行为模式不同,从而可对多义词不同语义类下词汇在实例中的N-gram序列进行统计与分析以进行消歧。两个模型的性能均超过了在国际语义评测SemEval2007的task#5上可比较的最好无指导系统。对这两个模型进行试验对比可发现N-gram模型性能优于词模型,也表明组合两类模型的结果有进一步提升消歧性能的潜力。 展开更多
关键词 计算语言学 无指导译文消歧 词模型 N-GRAM模型 PAGE COUNT 双语词汇Web相关度
在线阅读 下载PDF
来源于完整小句的话语标记“我告诉你” 被引量:71
19
作者 董秀芳 《语言科学》 CSSCI 北大核心 2010年第3期279-286,共8页
"我告诉你"在现代汉语中可以作为话语标记,表示强调其后引进的话语。话语标记"我告诉你"的功能根据其后引进话语的语义内容可分为以下几种类型:1)提供重要信息、郑重告知;2)重申某一重要信息;3)发出某种指令;4)提... "我告诉你"在现代汉语中可以作为话语标记,表示强调其后引进的话语。话语标记"我告诉你"的功能根据其后引进话语的语义内容可分为以下几种类型:1)提供重要信息、郑重告知;2)重申某一重要信息;3)发出某种指令;4)提出警告;5)提醒听话人注意某一事实。话语标记"我告诉你"可以出现在其所要强调的话语之前,也可以出现在其后,并存在很多变体形式。这一话语标记是从一个完整的小句结构演变而来,这证明了话语标记是高频使用的话语成分的规约化。英语中的"Itellyou"及古汉语中的"吾语汝"也有类似的话语标记功能。 展开更多
关键词 话语标记 习语化 词汇化
在线阅读 下载PDF
基于意象图式的动词“穿”的多义体系及意义连接机制 被引量:16
20
作者 朱彦 《语言科学》 CSSCI 北大核心 2010年第3期287-300,共14页
多义是认知的词汇语义学研究的重要课题之一,意义之间的连接机制更是多义研究的重点和难点。空间运动动词的语义受空间意象图式直接驱动。本文在空间意象图式的基础上,整理出空间运动动词"穿"的20余种不同意义,得到一个呈辐... 多义是认知的词汇语义学研究的重要课题之一,意义之间的连接机制更是多义研究的重点和难点。空间运动动词的语义受空间意象图式直接驱动。本文在空间意象图式的基础上,整理出空间运动动词"穿"的20余种不同意义,得到一个呈辐射结构的多义体系,并分析了"穿"不同义位之间的连接机制,即转喻和专指化。文末指出了精细多义研究的重要性和必要性。 展开更多
关键词 空间运动动词 空间意象图式 多义 多义连接
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部