期刊文献+
共找到2,775篇文章
< 1 2 139 >
每页显示 20 50 100
基于语料库的译者修改行为研究--以王际真英译《红楼梦》自我修改句法特征为例
1
作者 赵秋荣 肖燕 《外国语文》 北大核心 2026年第2期131-143,共13页
本文自建王际真1929年初译和1958年修改的《红楼梦》译本及原著的汉英平行语料库,借助TAASSC句法分析工具,基于短语复杂度、子句复杂度、句法精密度,提取了353个句法指标,考察王际真修改的语言特征,分析译者修改行为并探讨社会修改动因... 本文自建王际真1929年初译和1958年修改的《红楼梦》译本及原著的汉英平行语料库,借助TAASSC句法分析工具,基于短语复杂度、子句复杂度、句法精密度,提取了353个句法指标,考察王际真修改的语言特征,分析译者修改行为并探讨社会修改动因。研究发现:在文本层面,两译本间有15个句法特征具显著差异,其中修改本关系从句减少,呈规范化趋势;副词修饰语增多,呈明晰化趋势;搭配重复率降低,呈繁化趋势。在行为层面,译者呈现社会性务实、语言性求真、求真兼顾务实的译者修改行为。在社会层面,译者身份、翻译思想以及社会需求变化促使译者在修改本中协调语言性求真与社会性务实,促进了中国古典小说及中国文化的海外传播。 展开更多
关键词 王际真 《红楼梦》 自我修改 译者行为 句法特征
在线阅读 下载PDF
知识辅助和强化句法驱动的方面级情感分析
2
作者 郑诚 班晴晴 《计算机科学》 北大核心 2026年第4期406-414,共9页
方面级情感分析旨在对齐方面和其相应的意见表达,以识别特定方面的情感极性。现有的基于依赖树的图神经网络模型在方面级情感分析中取得了显著的性能提升,但大多数研究未充分利用句法依赖树的完整信息,通常忽略了句法依赖距离信息或依... 方面级情感分析旨在对齐方面和其相应的意见表达,以识别特定方面的情感极性。现有的基于依赖树的图神经网络模型在方面级情感分析中取得了显著的性能提升,但大多数研究未充分利用句法依赖树的完整信息,通常忽略了句法依赖距离信息或依赖标签信息。这种忽视可能导致在含有多个方面的句子中,意见词与相应的方面词无法有效对齐。针对上述问题,构造一种知识辅助和强化句法驱动的网络模型。具体来说,首先通过引入外部知识库设计一个意见词感知模块,以增强模型对句子中意见表达的识别能力。然后,利用强化学习指导句法距离图的构建,并将其与基于单词关系和依赖标签构建的动态句法标签图进行启发式集成,从而提高对给定方面捕获相关意见表达的准确性和全面性。此外,采用方面关注注意力机制来更好地处理句法结构不明确的句子。在3个公共数据集上进行广泛的实验,结果验证了该模型的有效性。 展开更多
关键词 方面级情感分析 情感词典 句法依赖树 强化学习 图卷积网络 注意力机制 深度学习
在线阅读 下载PDF
跨语言依存句法分析方法研究综述
3
作者 秦董洪 李路路 +3 位作者 白凤波 王敬凯 孔令儒 徐晨 《计算机工程与应用》 北大核心 2026年第4期1-28,共28页
跨语言依存句法分析是自然语言处理领域的一项关键任务,其核心目标是借助高资源语言(源语言)的依存句法资源来分析低资源语言(目标语言)的句子结构。综述了跨语言依存句法分析的研究方法,并根据改进途径的不同对方法进行了分类,深入分... 跨语言依存句法分析是自然语言处理领域的一项关键任务,其核心目标是借助高资源语言(源语言)的依存句法资源来分析低资源语言(目标语言)的句子结构。综述了跨语言依存句法分析的研究方法,并根据改进途径的不同对方法进行了分类,深入分析了各类方法的主要思路及其不足。介绍了跨语言依存句法分析的数据集、研究方法和在下游中的应用。从模型框架、数据处理、学习方法和大语言模型驱动四个角度对现有研究方法进行了系统总结。对比分析了不同方法在特定条件下的表现,并基于此提出未来值得关注的研究方向,包括语言类型学特征研究、集成系统的构建与应用、多语言文本表示的优化以及多种语言资源整合利用等。 展开更多
关键词 跨语言依存句法分析 自然语言处理 迁移学习
在线阅读 下载PDF
深度融合句法和语义特征的情感三元组片段级抽取方法 被引量:1
4
作者 常轩伟 段利国 +2 位作者 陈嘉昊 崔娟娟 李爱萍 《计算机科学》 北大核心 2026年第2期322-330,共9页
方面情感三元组抽取旨在以三元组的形式抽取出句子中包含的方面词及其对应的观点词和情感极性。现有的抽取模型存在未能充分挖掘句子中包含的句法和语义信息、多词实体边界识别错误等问题。对此,提出了一种深度融合句法信息和语义信息... 方面情感三元组抽取旨在以三元组的形式抽取出句子中包含的方面词及其对应的观点词和情感极性。现有的抽取模型存在未能充分挖掘句子中包含的句法和语义信息、多词实体边界识别错误等问题。对此,提出了一种深度融合句法信息和语义信息的片段抽取模型(Span Extractor Incorporating Semantic and Syntax Features,SESS)。SESS通过结合自注意力机制和多通道图卷积网络,深度挖掘句法与语义特征之间的关联,提升了模型对复杂句式和多词实体的处理能力。同时,模型采用基于片段的抽取方法抽取方面词和观点词,捕捉长实体的整体语义,减少情感不一致性的问题。在标准数据集ASTE-Data-V2上进行的实验表明,SESS在F1值上优于绝大多数对比模型,尤其在复杂语句和多对一、一对多情感关系的处理上表现出色。此外,消融实验和案例分析验证了模型各个模块的有效性及其对任务性能的贡献,进一步证明了所提方法的先进性和鲁棒性。 展开更多
关键词 方面情感三元组抽取 图卷积网络 自注意力机制 依存句法关系
在线阅读 下载PDF
基于文本答案融合与句法依存分析的问题生成模型
5
作者 李先铭 张灵 《计算机应用与软件》 北大核心 2026年第1期202-209,共8页
先前的问题生成研究主要使用基于循环神经网络构建的seq2seq框架,忽略了答案信息和文本中蕴含的句法信息。为了解决上述问题,提出一种基于文本答案融合与句法依存分析的问题生成模型(ACFDP)。在编码阶段使用门控图卷积神经网络捕获文本... 先前的问题生成研究主要使用基于循环神经网络构建的seq2seq框架,忽略了答案信息和文本中蕴含的句法信息。为了解决上述问题,提出一种基于文本答案融合与句法依存分析的问题生成模型(ACFDP)。在编码阶段使用门控图卷积神经网络捕获文本的句法依存关系,同时利用互注意力耦合输入的文本和答案。模型通过关注答案信息和文本的句法依存关系来生成更贴近答案的高质量问句。此外,还利用强化学习进一步提升了模型的表现。在公开数据集SQuAD上的实验结果表明,该方法在评价指标BLEU-4和ROUGE-L上的表现优于基线模型。 展开更多
关键词 问题生成 互注意力 句法依存分析 强化学习
在线阅读 下载PDF
依存句法信息增强的完全非自回归翻译
6
作者 张建新 郭沛 +1 位作者 李俊涛 张民 《软件学报》 北大核心 2026年第2期762-783,共22页
完全非自回归翻译(fully non-autoregressive translation,Fully NAT)的主要挑战在于,如何在保持解码速度优势的同时,达到与自回归翻译(autoregressive translation,AT)相当的翻译质量.这是因为并行解码的特性使得Fully NAT方法难以捕... 完全非自回归翻译(fully non-autoregressive translation,Fully NAT)的主要挑战在于,如何在保持解码速度优势的同时,达到与自回归翻译(autoregressive translation,AT)相当的翻译质量.这是因为并行解码的特性使得Fully NAT方法难以捕捉目标端的依赖信息,从而导致翻译质量下降.因此,利用源端的依赖信息来增强模型能力显得十分自然,尤其是在句法信息已被证明能够有效提升AT方法效果的背景下.尽管近年来这一领域取得了显著进展,但关于在Fully NAT中应用句法信息的研究仍然有限.通过在5个翻译基准(如workshop on machine translation,WMT)上的实验发现,依存语法信息对Fully NAT方法非常有帮助,可以显著提升翻译表现,同时解码速度的损失成本也在可接受范围内.代码开源地址https://github.com/tianxiexiaozhu77/syngec. 展开更多
关键词 非自回归翻译(NAT) 句法信息 依存关系 机器翻译
在线阅读 下载PDF
影像的句法:贝拉·塔尔电影中文学语言的视听转向
7
作者 张晓明 宗桦 《电影文学》 北大核心 2026年第2期42-45,共4页
享誉世界的匈牙利作家克拉斯诺霍尔卡伊·拉斯洛,在长达数十年的时间中与电影导演贝拉·塔尔互动频繁,其合作本质上是一种深层的跨媒介互文,为学界从“改编研究”转向对“文学性与电影性互构”的整体考察提供了一条有效路径。... 享誉世界的匈牙利作家克拉斯诺霍尔卡伊·拉斯洛,在长达数十年的时间中与电影导演贝拉·塔尔互动频繁,其合作本质上是一种深层的跨媒介互文,为学界从“改编研究”转向对“文学性与电影性互构”的整体考察提供了一条有效路径。从叙事时间、叙事节奏与哲学思辨三个维度出发,探讨文学文本在贝拉·塔尔电影中的感知重构机制,能够看到影像反向完成文学未竟的思辨进程。 展开更多
关键词 贝拉·塔尔 克拉斯诺霍尔卡伊·拉斯洛 互构 句法 哲学思辨
在线阅读 下载PDF
智能制造技术对我国出口贸易壁垒的影响——基于句法和语义分析的实证研究
8
作者 赵烁 《武汉大学学报(哲学社会科学版)》 北大核心 2026年第2期180-192,共13页
在我国大力推进“制造强国”战略的背景下,智能制造已经成为中国战略转型的重要着力点。智能制造在改变生产方式的同时,也对我国的出口贸易产生了深刻影响。智能制造可以优化劳动力结构,促进技术创新,降低生产成本,以此提高企业的相对... 在我国大力推进“制造强国”战略的背景下,智能制造已经成为中国战略转型的重要着力点。智能制造在改变生产方式的同时,也对我国的出口贸易产生了深刻影响。智能制造可以优化劳动力结构,促进技术创新,降低生产成本,以此提高企业的相对效率和出口竞争力,打破贸易壁垒。创新型智能制造对贸易壁垒的削减作用十分显著,而引入型智能制造的影响并不明显。自身创新程度越低、劳动力密集度越高、低技能劳动力占比越高的企业,在引入智能制造后,弱化其所遭受的贸易壁垒的作用更加明显。为增强我国的出口竞争力,未来我国政府和业界应继续加大智能制造的力度,不断优化制造业结构,推动制造业升级转型。 展开更多
关键词 智能制造 相对效率 贸易壁垒 句法分析 语义分析
在线阅读 下载PDF
基于句法、语义和情感知识的方面级情感分析 被引量:1
9
作者 郑诚 杨楠 《计算机科学》 北大核心 2025年第7期218-225,共8页
方面级情感分析的目标是识别句子中特定方面词的情感极性。近年来,许多工作都是利用句法依赖关系和自注意力机制分别获得句法知识和语义知识,并通过图卷积网络融合这两种信息更新节点的表示。然而句法依赖关系和自注意力机制都不是特定... 方面级情感分析的目标是识别句子中特定方面词的情感极性。近年来,许多工作都是利用句法依赖关系和自注意力机制分别获得句法知识和语义知识,并通过图卷积网络融合这两种信息更新节点的表示。然而句法依赖关系和自注意力机制都不是特定用于情感分析的工具,不能直接有效地捕获方面词的情感表达,而这一点正是方面级情感分析的关键之处。为了更准确地识别方面词的情感表达,构造了融合句法、语义和情感知识的网络。具体来说,利用句法依赖树中的句法知识构建句法图,并将外部情感知识库信息融合在句法图中。同时,采用自注意力机制获得句子中各单词的语义知识,并通过方面感知注意力机制使语义图关注与方面词相关的信息。此外,采用双向消息传播机制同时学习这两个图中的信息并更新节点表示。在3个基准数据集上的实验结果验证了所提模型的有效性。 展开更多
关键词 方面级情感分析 图卷积网络 注意力机制 句法依赖树 情感知识 自然语言处理 深度学习
在线阅读 下载PDF
从句法主语到篇章标记:“其+数词”形式的历时演变 被引量:1
10
作者 王天佑 《汉语学报》 北大核心 2025年第2期51-64,共14页
在古今汉语中,“其+数词”形式可充当主语、谓语、宾语和篇章标记四种角色,作为句法成分的用法均先于篇章标记。在多项并置条件下,“其+数词+(强调标记‘曰/是’等)+谓语”中的主语“其+数词”形式是后起篇章标记用法的源头。主语“其+... 在古今汉语中,“其+数词”形式可充当主语、谓语、宾语和篇章标记四种角色,作为句法成分的用法均先于篇章标记。在多项并置条件下,“其+数词+(强调标记‘曰/是’等)+谓语”中的主语“其+数词”形式是后起篇章标记用法的源头。主语“其+数词”形式之后“停顿”的延长、对强调标记“曰/是”等的删略、“其”的虚化、“排序/量化”功能的移植和重新分析是该形式标记化的主要机制。特定语境条件下的多项并置是“其+数词”形式标记化的源动力,基于“次第扫描”和“总括扫描”而浮现的“排序/量化”功能则是“其+数词”形式标记化的直接推手。此外,频率、韵律和信息结构安排等因素也对“其+数词”形式的标记化发挥了关键作用。 展开更多
关键词 其+数词 句法主语 篇章标记 历时演变
在线阅读 下载PDF
体认对话句法学视野下的对话者识解互动 被引量:1
11
作者 曾国才 《外国语文》 北大核心 2025年第1期34-42,共9页
体认语言学主张从体(感性)和认(理性)的角度分析语言的理据,强调语言产生于人类基于身体感知客观外界的过程,且与人类对感知结果进行认知处理密切相关。整合体认语言学的体认观和对话句法学理论的语言结构对称观,可进一步发现人类身体... 体认语言学主张从体(感性)和认(理性)的角度分析语言的理据,强调语言产生于人类基于身体感知客观外界的过程,且与人类对感知结果进行认知处理密切相关。整合体认语言学的体认观和对话句法学理论的语言结构对称观,可进一步发现人类身体在语言及其意义建构中具有基础性作用,本文尝试从话语互动的体认性出发建构体认对话句法学,主张语言本身是对话者的体验对象。对话中,说话人对他者的语言使用经历体验在本质上是说话者基于他者的视觉和/或心智注意力协调自身识解事体的方式,形成识解互动的过程。说话人在识解互动中协商话语的意义,从而扩展对话语篇。 展开更多
关键词 体认对话句法 互动 识解 对话
在线阅读 下载PDF
篇章结构句法化与系词“是”的产生和发展
12
作者 刘文正 《湖南大学学报(社会科学版)》 北大核心 2025年第4期82-90,共9页
“是”最初用于叙事篇章,只能做回指事物的指代词(“是物”),可做主、宾、同位语等成分,西周晚期分化出“是事”,回指事件。两周之交“是”扩大到“叙事+议论”篇章,“是物”的意义、功能没有变化,而“是事”产生了连接功能和多种谓词... “是”最初用于叙事篇章,只能做回指事物的指代词(“是物”),可做主、宾、同位语等成分,西周晚期分化出“是事”,回指事件。两周之交“是”扩大到“叙事+议论”篇章,“是物”的意义、功能没有变化,而“是事”产生了连接功能和多种谓词用法。“是物”和“是事”都可用于判断句,但前者是“是+NP+也”,后者是“是+谓+VP/NP”,到战国时期后者变得与前者一致。战国以来,“是事”的谓词用法继续增长,也推动“是物”产生谓词用法。二者所处的“叙事+议论”篇章都在朝句式演变,但“是物”所在篇章率先完成句法化,使“是物”演变为系词。汉代,“是事”所在篇章也完成句法化,“是事”也演变成系词。此后判断句的功能逐渐向描写扩展,“也”开始脱落,系词意义逐渐变化。东晋“是”已与现代汉语接近,南北朝基本只作系词。系词“是”是篇章句法化的产物,是隐喻和扩展、类推、韵律、重新分析等机制共同作用的结果。 展开更多
关键词 篇章 句法 指代词 系词
在线阅读 下载PDF
译者行为批评视域下《传习录》英译本的句法复杂度研究
13
作者 赵秋荣 孙培真 《北京第二外国语学院学报》 北大核心 2025年第6期78-92,共15页
本文以我国新儒学重要代表作《传习录》陈荣捷译本和亨克译本为语料,基于平均依存距离等句法复杂度指标,考察译入型与译出型译者行为的差异。研究发现:译出型译本平均依存距离较小,句法复杂度更低,简化程度较高,句法显化、范化程度较低... 本文以我国新儒学重要代表作《传习录》陈荣捷译本和亨克译本为语料,基于平均依存距离等句法复杂度指标,考察译入型与译出型译者行为的差异。研究发现:译出型译本平均依存距离较小,句法复杂度更低,简化程度较高,句法显化、范化程度较低,体现出“求真为本,兼顾务实”的译者行为特点;译入型译本平均依存距离较大,句法复杂度更高,简化程度较低,句法显化、范化程度较高,体现出“务实为本,求真为辅”的译者行为特点。本研究将翻译目的、译者身份和翻译背景等翻译外因素与译本语言特征相结合,以句法复杂度为切入点,尝试为现有译者行为“翻译外”研究提供新方法和新视角。 展开更多
关键词 《传习录》 译者行为批评 翻译外 翻译方向 句法复杂度
在线阅读 下载PDF
基于空间句法的城市绿地空间可达性分析——以常州市荆川公园为例
14
作者 孔强 戴丹骅 田治国 《现代园艺》 2025年第5期85-87,共3页
通过对常州市荆川公园及其周边进行实地调研,运用空间句法建立轴线模型,对公园及其周边空间分布特征、整合度及选择度、公园视域及人流模拟可达性进行分析。结果表明,常州市荆川公园区域绿地空间可达性整体较好,能够满足荆川东路周边街... 通过对常州市荆川公园及其周边进行实地调研,运用空间句法建立轴线模型,对公园及其周边空间分布特征、整合度及选择度、公园视域及人流模拟可达性进行分析。结果表明,常州市荆川公园区域绿地空间可达性整体较好,能够满足荆川东路周边街道社区80%的居民对于公共绿地的供给需求;通过人流模拟分析得出,去往荆川公园内的唐荆川武像、唐荆川墓、活动广场的次数较高人流量较大。研究结果可为相关城市公共绿地的建设与发展提供理论参考。 展开更多
关键词 城市绿地 绿地空间 空间句法 可达性
在线阅读 下载PDF
俄语动词概念隐喻语义句法探析
15
作者 彭玉海 《外国语文》 北大核心 2025年第3期25-40,共16页
动词概念隐喻是动词语义衍生的重要方法和机制,借助于概念隐喻的认知运作,俄语动词可以衍生出大量新的语义内容,而这些语义关系和相应语义变化会在动词句法行为、句法表征中反映和体现出来,由此形成动词隐喻语义的句法映射以及它同句法... 动词概念隐喻是动词语义衍生的重要方法和机制,借助于概念隐喻的认知运作,俄语动词可以衍生出大量新的语义内容,而这些语义关系和相应语义变化会在动词句法行为、句法表征中反映和体现出来,由此形成动词隐喻语义的句法映射以及它同句法特征的对应关系。本文旨在借鉴莫斯科语义学派集成描写方法,通过广义句法形式特征,着重对物理动词есть、резать的概念隐喻语义衍变展开句法方面的集成分析和描写,藉此深入揭示动词喻义变化中的句法映射和形式机制问题,将形式化的语义分析和微观层次的语义精细化描写引向深入,促进认知语义与语义句法的融合研究。 展开更多
关键词 动词概念隐喻 动词多义性 语义衍生 句法映射 语义句法探析
在线阅读 下载PDF
句法加工的脑机制 被引量:12
16
作者 高兵 曹晖 曹聘 《心理科学进展》 CSSCI CSCD 北大核心 2006年第1期32-39,共8页
语言理解中,句法加工至关重要,它把各个意义单元以不同的方式整合起来,从而形成整体的意义表征。句法加工的脑机制是心理语言学比较关注的问题,目前由于ERP技术和功能成像技术的进步,使对这一机制的探讨成为可能。该文对有关句法加工的... 语言理解中,句法加工至关重要,它把各个意义单元以不同的方式整合起来,从而形成整体的意义表征。句法加工的脑机制是心理语言学比较关注的问题,目前由于ERP技术和功能成像技术的进步,使对这一机制的探讨成为可能。该文对有关句法加工的脑机制的研究进行了回顾与总结,并针对目前该领域存在的问题与争论进行了讨论。 展开更多
关键词 句法加工 脑成像 脑损伤研究 句法违反 句法操作
在线阅读 下载PDF
融合格序列和多维语义特征的藏语句法成分标注研究
17
作者 尕藏扎西 多拉 冷本扎西 《高原科学研究》 2025年第1期119-128,共10页
深层句法分析是藏语自然语言理解中的关键难题之一。针对现有藏语句法分析模型性能欠佳的问题,文章提出一种融合格序列知识和多维语义特征的藏语句法成分标注方法。该方法以提取藏语格序列对句法成分的约束信息为主要语义特征,进而融合... 深层句法分析是藏语自然语言理解中的关键难题之一。针对现有藏语句法分析模型性能欠佳的问题,文章提出一种融合格序列知识和多维语义特征的藏语句法成分标注方法。该方法以提取藏语格序列对句法成分的约束信息为主要语义特征,进而融合藏文字丁、词、词性等多维语义特征后,用Bi-LSTM+CRF联合预测藏语句法成分标记。实验结果显示,该方法在真实语料中的准确率达90.67%、精确率达87.00%、召回率达87.33%,F1值达87.16%,其F1值高于所有基线模型。此外,通过消融实验验证了融合藏语格序列知识及其他特征的WPCc_BiLSTM+CRF模型可大幅提升藏语句法成分标注性能。 展开更多
关键词 藏语格序列 语义特征 句法成分标注 句法分析
在线阅读 下载PDF
基于空间句法的城市公园空间公平性研究——以深圳市龙岗区为例 被引量:3
18
作者 张林林 王玉华 +2 位作者 雍亚利 李鉴明 徐岩 《生态学报》 北大核心 2025年第10期4656-4666,共11页
城市化的快速发展致使大城市城区人口规模不断扩张,以城市公园为代表的城市公共服务设施资源的需求急剧上升,但公园绿地资源与人口匹配协同性较差、配置效率低下、服务质量难以满足多样化需求等空间不公平问题日益突出。以深圳市龙岗区2... 城市化的快速发展致使大城市城区人口规模不断扩张,以城市公园为代表的城市公共服务设施资源的需求急剧上升,但公园绿地资源与人口匹配协同性较差、配置效率低下、服务质量难以满足多样化需求等空间不公平问题日益突出。以深圳市龙岗区27个城市公园为例,利用空间句法(sDNA)与Moran′s I分析从接近度、穿行度和空间集聚差异三个方面对龙岗区城市公园空间公平性特征进行精准测度,提升城市公园空间公平性优化的空间效率。结果表明:龙岗区城市公园与人口分布存在“空间错位”现象,城市公园与城市居民需求匹配性差;龙岗区接近度呈现“南强北弱、西强东弱”的态势,区域发展不协调;龙岗区城市公园本底的路网结构整体的穿行度较差,中部区域明显高于周围其他区域;城市公园空间集聚差异表现出全局和局部接近度空间集聚显著、中心区域优势明显、穿行度空间集聚态势不清晰的特点。未来龙岗区城市公园发展中应优化本底的路网结构,提高路网密度,丰富不同等级路网间的连接方式,提升公园质量等方式改善其空间公平性水平,提高城市公园空间服务效率、协调性与人口分布的匹配程度,为深圳市公园城市建设和龙岗区公园体系规划提供新的思路。 展开更多
关键词 空间公平 城市公园 空间句法 深圳龙岗区
在线阅读 下载PDF
面向中文电子病历的句法分析融合模型 被引量:5
19
作者 蒋志鹏 关毅 《自动化学报》 EI CSCD 北大核心 2019年第2期276-288,共13页
完全句法分析是自然语言处理(Natural language processing, NLP)中重要的结构化过程,由于中文电子病历(Chinese electronic medical record, CEMR)句法标注语料匮乏,目前还没有面向中文电子病历的完全句法分析研究.本文针对中文电子病... 完全句法分析是自然语言处理(Natural language processing, NLP)中重要的结构化过程,由于中文电子病历(Chinese electronic medical record, CEMR)句法标注语料匮乏,目前还没有面向中文电子病历的完全句法分析研究.本文针对中文电子病历模式化强的子语言特征,首次以树片段形式化中文电子病历复用的模式,提出了面向数据句法分析(Dataoriented parsing, DOP)和层次句法分析融合模型.在树片段抽取阶段,提出效率更高的标准树片段和局部树片段抽取算法,分别解决了标准树片段的重复比对问题,以及二次树核(Quadratic tree kernel, QTK)的效率低下问题,获得了标准树片段集和局部树片段集.基于上述两个树片段集,提出词汇和词性混合匹配策略和最大化树片段组合算法改进面向数据句法分析模型,缓解了无效树片段带来的噪声.实验结果表明,该融合模型能够有效改善中文电子病历句法分析效果,基于少量标注语料F1值能够达到目前最高的80.87%,并且在跨科室句法分析上超过Stanford parser和Berkeley parser 2%以上. 展开更多
关键词 中文电子病历 完全句法分析 面向数据句法分析 层次句法分析
在线阅读 下载PDF
基于改进线图分析算法的浅层汉语句法分析器的设计与实现 被引量:4
20
作者 吴江宁 朱国华 《计算机应用研究》 CSCD 北大核心 2007年第9期164-167,共4页
针对传统的汉语句法分析算法进行改进,采用了自底向上与自顶向下相结合的线图分析方法,分析、设计和实现了一个汉语句法分析原型系统。该系统实现了基于最大词长匹配算法的分词模块、基于统计方法的词性标注模块和基于改进的线图分析算... 针对传统的汉语句法分析算法进行改进,采用了自底向上与自顶向下相结合的线图分析方法,分析、设计和实现了一个汉语句法分析原型系统。该系统实现了基于最大词长匹配算法的分词模块、基于统计方法的词性标注模块和基于改进的线图分析算法的句法分析模块。最后对系统进行小规模中文文本试验测试,测试结果表明利用改进的分析算法,使得句法分析效率和分析结果的准确率均有一定程度的提高。 展开更多
关键词 文本信息处理 汉语句法分析 线图分析法 句法解析器 句法结构
在线阅读 下载PDF
上一页 1 2 139 下一页 到第
使用帮助 返回顶部