期刊文献+
共找到175篇文章
< 1 2 9 >
每页显示 20 50 100
基于自然语言语义分析的Internet文件分类与过滤 被引量:5
1
作者 张天庆 唐常杰 左劼 《计算机应用》 CSCD 北大核心 2001年第9期4-7,共4页
网上文件过滤是网络信息安全研究的重要课题。传统的过滤方法简单地把关键字匹配作为分类的依据 ,常导致漏判误判等问题。文中提出一种基于自然语言理解的语义模板算法解决网上文件分类过滤的问题。实验结果表明该方法漏判误判率较低 。
关键词 inTERNET 文件分类 文件过滤 自然语言语义分析 自然语言处理
在线阅读 下载PDF
KingCloud:智能对象归档系统 被引量:1
2
作者 缪嘉嘉 付印金 毛捍东 《计算机科学》 CSCD 北大核心 2016年第S2期575-577,596,共4页
随着信息化进程的不断推进,生产系统积累了大量的数据,形成了归档需求;与此同时,数据信息类型不断丰富,非结构化数据的处理是挖掘数据价值的关键。设计并实现了KingCloud智能对象归档系统,通过文档分类技术实现了文本文件的分类,并提供... 随着信息化进程的不断推进,生产系统积累了大量的数据,形成了归档需求;与此同时,数据信息类型不断丰富,非结构化数据的处理是挖掘数据价值的关键。设计并实现了KingCloud智能对象归档系统,通过文档分类技术实现了文本文件的分类,并提供了文档逻辑视图;利用图像识别、视频关键帧提取等技术实现图片和视频文件的内容元数据获取,在整体存储结构上结合文件系统语义研究对文件预取、存储缓存、数据布局和策略感知等方面进行优化,能够对数据进行智能的分类、归纳总结、智能的发现和预测及智能的分析,有效提升了存储系统的服务能力、服务质量和服务性能。 展开更多
关键词 文件系统语义 归档系统 文档分类 数据布局 文件预取
在线阅读 下载PDF
基于TextRank和自注意力的长文档无监督抽取式摘要
3
作者 邢玲 程兵 闫强 《计算机应用与软件》 北大核心 2025年第3期274-283,共10页
针对中文长文档自动文本摘要问题,提出将TextRank与自注意力相融合的两种模型:TRAI和TRAO。TRAI将基于统计共现字数得到的句子相似性同基于自注意力得到的句子相关性进行加权求和,作为TextRank边的权重参与迭代计算,对句子进行打分。TRA... 针对中文长文档自动文本摘要问题,提出将TextRank与自注意力相融合的两种模型:TRAI和TRAO。TRAI将基于统计共现字数得到的句子相似性同基于自注意力得到的句子相关性进行加权求和,作为TextRank边的权重参与迭代计算,对句子进行打分。TRAO利用TextRank对句子打分;利用自注意力重新表示每个句子融合整个文档信息的分布式向量,在此基础上计算句子间余弦相似度,作为TextRank边的权重参与迭代计算,给句子打分;将两种得分加权求和作为句子最终得分。两种模型均根据得分对句子进行排序得到候选摘要。为去除摘要冗余性,利用最大边界相关法(Maximal Marginal Relevance,MMR)在候选摘要中选取摘要句子。将提出的两种模型在构建的长文档上进行实验,与TextRank方法相比,所提方法在ROUGE评价指标上有显著提高。 展开更多
关键词 中文长文本摘要 TextRank 自注意力机制 分布式向量表示 语义信息 融合文档信息
在线阅读 下载PDF
Combinator演算族的π演算语义
4
作者 张红 刘磊 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2006年第3期391-396,共6页
以SKI演算作为Combinator演算族的代表,通过形式化的手段给出了SKI演算的π演算语义;通过一个实例验证了所论方法的正确性.所给出的转换方法证明了π演算的表达能力:π演算为图灵完备的.由于高阶函数式语言与Combinator演算族之间存在... 以SKI演算作为Combinator演算族的代表,通过形式化的手段给出了SKI演算的π演算语义;通过一个实例验证了所论方法的正确性.所给出的转换方法证明了π演算的表达能力:π演算为图灵完备的.由于高阶函数式语言与Combinator演算族之间存在着自然的转换,所给的转换思想不仅为在π演算的理论框架下研究Combinator演算族提供了基础,也为探讨高阶函数式语言的表示和实现问题提供了新途径. 展开更多
关键词 Π演算 Combinator演算族 SKI演算 语义
在线阅读 下载PDF
基于伪文档与全局信息互补的文档级关系抽取
5
作者 胡建洋 高永彬 +1 位作者 沈马磊 张开昱 《计算机工程与设计》 北大核心 2025年第5期1403-1409,共7页
针对文档级关系抽取中文本处理复杂性高且抽取过程存在噪音的问题,提出一种基于伪文档与全局信息互补的文档级关系抽取方法。通过BERT模型对文档进行编码,使用实体间门控计算模块与语义分割模块抽取原始文档中的关系;使用伪文档抽取模... 针对文档级关系抽取中文本处理复杂性高且抽取过程存在噪音的问题,提出一种基于伪文档与全局信息互补的文档级关系抽取方法。通过BERT模型对文档进行编码,使用实体间门控计算模块与语义分割模块抽取原始文档中的关系;使用伪文档抽取模块过滤文档中无用的句子,抽取伪文档中的实体间关系;将原始文档关系抽取模块与伪文档关系抽取模块的抽取结果进行融合。实验结果表明,所提方法能够有效提高长文本关系抽取的准确率。 展开更多
关键词 文档级 伪文档 全局信息互补 实体间门控计算 语义分割 关系抽取 结果融合
在线阅读 下载PDF
扩充关系型激光点云数据库语义精准标注方法
6
作者 段宏伟 郇甜甜 白彦辉 《激光杂志》 北大核心 2025年第9期202-207,共6页
为了显著提升扩充关系型激光点云数据库的语义标注精度,提出扩充关系型激光点云数据库语义精准标注方法。首先,建立扩充关系型激光点云数据库,为后续的激光点云数据分割和语义标注提供支撑;其次,利用RANSAC与欧氏聚类结合方法对激光点... 为了显著提升扩充关系型激光点云数据库的语义标注精度,提出扩充关系型激光点云数据库语义精准标注方法。首先,建立扩充关系型激光点云数据库,为后续的激光点云数据分割和语义标注提供支撑;其次,利用RANSAC与欧氏聚类结合方法对激光点云数据库内激光点云数据展开分割处理,将复杂的点云数据简化为多个相对简单的部分,以便于后续的精准标注;最后,利用改进排序批处理模式采样算法(MRBMS)通过排序和批处理的方式从分割后的点云数据中选取具有代表性的样本实行语义精准标注。实验结果表明,所提方法的扩充关系型激光点云数据库语义精度更高,且适用于实际应用。 展开更多
关键词 激光点云数据库 RANSAC算法 欧氏聚类结合方法 MRBMS算法 语义精准标注
在线阅读 下载PDF
End-to-end dilated convolution network for document image semantic segmentation 被引量:8
7
作者 XU Can-hui SHI Cao CHEN Yi-nong 《Journal of Central South University》 SCIE EI CAS CSCD 2021年第6期1765-1774,共10页
Semantic segmentation is a crucial step for document understanding.In this paper,an NVIDIA Jetson Nano-based platform is applied for implementing semantic segmentation for teaching artificial intelligence concepts and... Semantic segmentation is a crucial step for document understanding.In this paper,an NVIDIA Jetson Nano-based platform is applied for implementing semantic segmentation for teaching artificial intelligence concepts and programming.To extract semantic structures from document images,we present an end-to-end dilated convolution network architecture.Dilated convolutions have well-known advantages for extracting multi-scale context information without losing spatial resolution.Our model utilizes dilated convolutions with residual network to represent the image features and predicting pixel labels.The convolution part works as feature extractor to obtain multidimensional and hierarchical image features.The consecutive deconvolution is used for producing full resolution segmentation prediction.The probability of each pixel decides its predefined semantic class label.To understand segmentation granularity,we compare performances at three different levels.From fine grained class to coarse class levels,the proposed dilated convolution network architecture is evaluated on three document datasets.The experimental results have shown that both semantic data distribution imbalance and network depth are import factors that influence the document’s semantic segmentation performances.The research is aimed at offering an education resource for teaching artificial intelligence concepts and techniques. 展开更多
关键词 semantic segmentation document images deep learning NVIDIA jetson nano
在线阅读 下载PDF
基于注意力机制语义增强的文档级关系抽取 被引量:1
8
作者 柳先辉 吴文达 +1 位作者 赵卫东 侯文龙 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第5期822-828,共7页
文档级关系抽取旨在从文档中抽取出多个实体对之间的关系,具有较高的复杂性。针对文档级关系抽取中的多实体、关系相关性、关系分布不平衡等问题,提出了一种基于注意力机制(Attention)语义增强的文档级关系抽取方法,能够实现实体对之间... 文档级关系抽取旨在从文档中抽取出多个实体对之间的关系,具有较高的复杂性。针对文档级关系抽取中的多实体、关系相关性、关系分布不平衡等问题,提出了一种基于注意力机制(Attention)语义增强的文档级关系抽取方法,能够实现实体对之间关系的推理。具体来说,首先在数据编码模块改进编码策略,引入更多实体信息,通过编码网络捕获文档的语义特征,获得实体对矩阵;然后,设计了一个基于Attention门控机制的U-Net网络,对实体对矩阵进行局部信息捕获和全局信息汇总,实现语义增强;最后,使用自适应焦点损失函数缓解关系分布不平衡的问题。在4个公开的文档级关系抽取数据集(DocRED、CDR、GDA和DWIE)上评估了Att-DocuNet模型并取得了良好的实验结果。 展开更多
关键词 文档级关系抽取 注意力机制 语义增强 焦点损失
在线阅读 下载PDF
名词融合与复杂谓词的形成 被引量:1
9
作者 罗琼鹏 《汉语学习》 CSSCI 北大核心 2024年第1期33-42,共10页
文章以及物化的“VN”型复杂谓词(“踩雷乐视、取道北京”)为出发点,引入跨语言视角,探索汉语名词融合的句法、语义机制以及类型特征。在句法上,“V”和“N”通过词根移位融合,然后和事件有关的其他论旨角色会提升到“N”原有的论元槽位... 文章以及物化的“VN”型复杂谓词(“踩雷乐视、取道北京”)为出发点,引入跨语言视角,探索汉语名词融合的句法、语义机制以及类型特征。在句法上,“V”和“N”通过词根移位融合,然后和事件有关的其他论旨角色会提升到“N”原有的论元槽位,表现为“VN”结构携带旁格论元的情况。在语义上,“N”并非“V”独立的语义论元,而是对“V”的语义进行修饰,对“V”所述事件进行限定和细分,但不改变“V”的价位。及物化的“VN”型复杂谓词的产生,不仅证明汉语中存在丰富的名词融合现象,更表明名词融合内部存在不同的演化轨迹,呈现谱系特性。文章提出的将形式语义学与分布式形态学相结合的形态—语义界面思路,为处理汉语中次短语层面的语言现象提供了新的框架性构想。 展开更多
关键词 名词融合 动宾带宾 旁格论元 形态-语义界面 分布式形态学
在线阅读 下载PDF
组合光透视下小面积室内封闭空间分割方法
10
作者 赵会宾 张立 《激光杂志》 CAS 北大核心 2024年第5期231-235,共5页
为提高室内空间的优化规划设计能力,提出基于点云数据语义分割的组合光透视下小面积室内封闭空间分割方法。构建小面积室内封闭空间的环境三维信息感知模型,采用室内空间点云提取室内封闭空间图像的坐标信息,结合语义组合特征分割方法... 为提高室内空间的优化规划设计能力,提出基于点云数据语义分割的组合光透视下小面积室内封闭空间分割方法。构建小面积室内封闭空间的环境三维信息感知模型,采用室内空间点云提取室内封闭空间图像的坐标信息,结合语义组合特征分割方法将融合空间信息映射到高分辨空间异质单元结构中,引入几何约束的子空间投影特征信息,结合组合光透视的高分辨率分割图模型参数融合方法,提取小面积室内封闭的端元,采用点云数据语义分割方法实现空间分割。结果表明,采用该方法有效实现对复杂室内场景的三维重建,空间分割的均方根误差较低为0.808%,峰值信噪比较高42.156 dB,空间分割速度较快,平均为12.83 ms。 展开更多
关键词 组合光透视 小面积 室内封闭空间 分割 语义组合特征分割
在线阅读 下载PDF
跨文档类型的语义元数据支持方法 被引量:1
11
作者 王詠萱 李宁 田英爱 《计算机工程与设计》 北大核心 2024年第11期3507-3513,共7页
针对当前可编辑的流式文档在语义元数据支持方面的不足,设计一种在流式文档中记录语义元数据的方法,允许语义元数据随文档内容的编辑而修改,并与文档内容保持同步。为从流式文档中导出独立的元数据内容,提出一种元数据到文本位置的定位... 针对当前可编辑的流式文档在语义元数据支持方面的不足,设计一种在流式文档中记录语义元数据的方法,允许语义元数据随文档内容的编辑而修改,并与文档内容保持同步。为从流式文档中导出独立的元数据内容,提出一种元数据到文本位置的定位方法,避免数据冗余。为实现元数据的共享,提出一种流式文档到版式文档的元数据支持方法,充分发挥元数据的作用。通过实际系统的构建验证了所述方法的可行性。研究成果对于文档的自动理解和智能化处理具有应用价值。 展开更多
关键词 语义元数据 元数据转换 流式文档 固定版式文档 元数据定位 元数据嵌入 元数据提取
在线阅读 下载PDF
基于改进TF-IDF与BERT的领域情感词典构建方法 被引量:10
12
作者 蒋昊达 赵春蕾 +1 位作者 陈瀚 王春东 《计算机科学》 CSCD 北大核心 2024年第S01期150-158,共9页
领域情感词典的构建是领域文本情感分析的基础。现有的领域情感词典构建方法存在所筛选候选情感词冗余度高、情感极性判断失准、领域依赖性强等问题。为了提高所筛选候选情感词的领域性和判断领域情感词极性的准确程度,提出了一种基于... 领域情感词典的构建是领域文本情感分析的基础。现有的领域情感词典构建方法存在所筛选候选情感词冗余度高、情感极性判断失准、领域依赖性强等问题。为了提高所筛选候选情感词的领域性和判断领域情感词极性的准确程度,提出了一种基于改进词频-逆文档频率(TF-IDF)与BERT的领域情感词典构建方法。该方法在筛选领域候选情感词阶段对TF-IDF算法进行改进,将隐含狄利克雷分布(LDA)算法与改进后的TF-IDF算法结合,进行领域性修正,提升了所筛选候选情感词的领域性;在候选情感词极性判断阶段,将情感倾向点互信息算法(SO-PMI)与BERT结合,利用领域情感词微调BERT分类模型,提高了判断领域候选情感词情感极性的准确程度。在不同领域的用户评论数据集上进行实验,结果表明,该方法可以提高所构建领域情感词典的质量,使用该方法构建的领域情感词典用于汽车领域和手机领域文本情感分析的F1值分别达到78.02%和88.35%。 展开更多
关键词 情感分析 领域情感词典 词频-逆文档频率 隐含狄利克雷分布 情感倾向点互信息算法 BERT模型
在线阅读 下载PDF
基于文本摘要的无监督关键词抽取方法
13
作者 尤泽顺 周喜 +2 位作者 董瑞 张洋宁 杨奉毅 《计算机工程与设计》 北大核心 2024年第9期2779-2784,共6页
为克服基于嵌入的关键词抽取方法在长文档上性能下降的问题,提出一种基于文本摘要的方法(summarization-based document embedding rank,SDERank)。将句向量的加权和作为文档嵌入,根据每个句子与文档主题的语义相关度赋予权重。以往基... 为克服基于嵌入的关键词抽取方法在长文档上性能下降的问题,提出一种基于文本摘要的方法(summarization-based document embedding rank,SDERank)。将句向量的加权和作为文档嵌入,根据每个句子与文档主题的语义相关度赋予权重。以往基于嵌入的方法选择关键词时忽略候选词之间的关联,针对该问题,在SDERank的改进版SDERank+中,PageRank算法被用于提取候选词之间的共现权重作为相似度分数的修正。实验结果表明,在4个广泛使用的数据集上SDERank和SDERank+比之前最好的模型MDERank的F1分数平均高出2.2%和3.29%。 展开更多
关键词 自动关键词抽取 文本摘要 长文档建模 文档主题分析 语义处理 权重优化 向量相似性
在线阅读 下载PDF
基于孪生网络文本语义匹配的多文档摘要
14
作者 钟琪 王中卿 王红玲 《中文信息学报》 CSCD 北大核心 2024年第5期107-116,共10页
多文档摘要旨在从一组主题相关的文档集中抽取出最能代表文档集中心内容的句子作为摘要,文本语义匹配则是指学习两个文本单元之间的语义关系,使句子表征具有更加丰富的语义信息。该文提出了一种基于孪生网络文本语义匹配的多文档抽取式... 多文档摘要旨在从一组主题相关的文档集中抽取出最能代表文档集中心内容的句子作为摘要,文本语义匹配则是指学习两个文本单元之间的语义关系,使句子表征具有更加丰富的语义信息。该文提出了一种基于孪生网络文本语义匹配的多文档抽取式摘要方法,该方法将孪生网络和预训练语言模型BERT相结合,构建一个文本语义匹配与文本摘要联合学习模型。该模型运用孪生网络从不同的视角考察任意两个文本单元之间的语义关联,学习文档集中碎片化的信息,进一步对重要信息进行评估,最后结合文本摘要模型选择出更能代表文档集主要内容的句子组织成摘要。实验结果表明,该文所提方法和当前主流的多文档抽取式摘要方法相比,在ROUGE评价指标上有较大提升。 展开更多
关键词 多文档抽取式摘要 语义关系 预训练语言模型
在线阅读 下载PDF
语义识别驱动的化工泄漏事故事前预防研究 被引量:4
15
作者 刘勤明 董宏霖 孔得朝 《安全与环境学报》 CAS CSCD 北大核心 2024年第12期4734-4742,共9页
化工泄漏事故报告蕴含事故信息量大,但利用度低,仅依赖传统的事故分析理论和方法对事故后果进行分析统计难以实现事前预防、控制损失最小化的目的,因此,构建了语义识别驱动的化工泄漏事故事前预防研究框架,基于潜在狄利克雷分配(Latent ... 化工泄漏事故报告蕴含事故信息量大,但利用度低,仅依赖传统的事故分析理论和方法对事故后果进行分析统计难以实现事前预防、控制损失最小化的目的,因此,构建了语义识别驱动的化工泄漏事故事前预防研究框架,基于潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)主题模型提取化工泄漏事故致因主题及关键词,利用关键词共现网络分析进行致因中心性和关联度分析,使用因子分析进行致因影响因子的计算,实现了对化工泄漏事故报告潜在信息的挖掘和有效分析。结果表明:通过LDA模型可以计算得到化工泄漏事故致因主题,得出安全意识缺失、物料逸出、设备故障等5个聚类;基于改进点互信息(Pointwise Mutual Information,PMI)的关键词共现网络可以得到事故的关键致因、环节、场所和事故类型,其中最重要且关联度较高的致因是人员操作不当和现场管理不力;最后,通过因子分析得到影响后果最严重的致因是危险作业环境,其次是违规操作或操作不当。提出的研究框架在更深入挖掘利用海量事故致因信息的同时,减少了事故致因评价指标的主观性,为结构复杂、非单一标准的事故报告文本信息提取提供了新的思路,同时将语义识别拓展到化工泄漏事故预防领域,有助于化工泄漏事故的风险识别、预测与防控。 展开更多
关键词 安全社会工程 化工事故 文本挖掘 语义识别 词频逆文档频率算法 潜在狄利克雷分配主题模型
在线阅读 下载PDF
基于异构图分层学习的细粒度多文档摘要抽取
16
作者 翁裕源 许柏炎 蔡瑞初 《计算机工程》 CAS CSCD 北大核心 2024年第3期336-344,共9页
抽取的目标是在多个文档中提取共有关键信息,其对简洁性的要求高于单文档摘要抽取。现有的多文档摘要抽取方法通常在句子级别进行建模,容易引入较多的冗余信息。为了解决上述问题,提出一种基于异构图分层学习的多文档摘要抽取框架,通过... 抽取的目标是在多个文档中提取共有关键信息,其对简洁性的要求高于单文档摘要抽取。现有的多文档摘要抽取方法通常在句子级别进行建模,容易引入较多的冗余信息。为了解决上述问题,提出一种基于异构图分层学习的多文档摘要抽取框架,通过层次化构建单词层级图和子句层级图来有效建模语义关系和结构关系。针对单词层级图和子句层级图这2个异构图的学习问题,设计具有不同层次更新机制的两层学习层来降低学习多种结构关系的难度。在单词层级图学习层,提出交替更新机制更新不同的粒度节点,以单词节点为载体通过图注意网络进行语义信息传递;在子句层级图学习层,提出两阶段分步学习更新机制聚合多种结构关系,第一阶段聚合同构关系,第二阶段基于注意力聚合异构关系。实验结果表明,与抽取式基准模型相比,该框架在Multinews数据集上取得了显著的性能提升,ROUGE-1、ROUGE-2和ROUGE-L分别提高0.88、0.23和2.27,消融实验结果也验证了两层学习层及其层次更新机制的有效性。 展开更多
关键词 抽取式多文档摘要 细粒度建模 异构图 分层学习 语义关系 结构关系
在线阅读 下载PDF
一种基于LDA的潜在语义区划分及Web文档聚类算法 被引量:19
17
作者 刘振鹿 王大玲 +2 位作者 冯时 张一飞 方东昊 《中文信息学报》 CSCD 北大核心 2011年第1期60-65,70,共7页
该文应用LDA模型进行文档的潜在语义分析,将语义分布划分成低频、中频、高频语义区,以低频语义区的语义进行Web游离文档检测,以中、高频语义区的语义作为文档特征进行文档聚类,采用文档类别与语义互作用机制对聚类结果进行修正。与相关... 该文应用LDA模型进行文档的潜在语义分析,将语义分布划分成低频、中频、高频语义区,以低频语义区的语义进行Web游离文档检测,以中、高频语义区的语义作为文档特征进行文档聚类,采用文档类别与语义互作用机制对聚类结果进行修正。与相关工作比较,该文不仅应用LDA模型表示文档,而且进行了深入的语义分布区域划分,并将分析结果应用于Web文档聚类。实验表明,该文提出的基于LDA的文档类别与语义互作用聚类算法获得了更好的聚类结果。 展开更多
关键词 LDA 潜在语义 语义分布 文档聚类
在线阅读 下载PDF
基于语义关系查询扩展的文档重构方法 被引量:55
18
作者 张敏 宋睿华 马少平 《计算机学报》 EI CSCD 北大核心 2004年第10期1395-1401,共7页
已知文档与用户查询之间相同概念不同表达形式造成的词不匹配问题是影响信息检索效果的重要原因之一 .该文提出了根据词之间的语义关系进行扩展和替换的文档重构方法 .它与传统的查询扩展不同 ,实现了同一概念信息的聚集 ,是更接近于人... 已知文档与用户查询之间相同概念不同表达形式造成的词不匹配问题是影响信息检索效果的重要原因之一 .该文提出了根据词之间的语义关系进行扩展和替换的文档重构方法 .它与传统的查询扩展不同 ,实现了同一概念信息的聚集 ,是更接近于人类进行信息查找的思维方法 .进一步地 ,研究给出一种有效的实时文档重构检索策略 ,解决了文档重构方法在实际应用中的可行性 .在标准测试数据集上的实验表明 ,基于查询扩展的文档重构方法不仅比不扩展的最佳性能始终有 14 %~ 2 3.4 %的提高 ,而且比相对应的传统查询扩展方法也有约 16 %的提高 . 展开更多
关键词 文档重构 语义关系 查询扩展 语义相似性 词不匹配 概念检索 信息检索 实时文档重构检索
在线阅读 下载PDF
文本信息隐藏检测算法研究 被引量:27
19
作者 周继军 杨著 +1 位作者 钮心忻 杨义先 《通信学报》 EI CSCD 北大核心 2004年第12期97-101,共5页
对当前流行的文本信息隐藏算法进行了分析,重点剖析了基于语义的文本信息隐藏算法存在的弱点,然后根据这些弱点借鉴概念图的思想设计了其通用检测算法--句间相关性度量判定法。实验测试结果表明该检测算法具有较高的检测可靠性。
关键词 信息隐藏 语义 文本 概念图
在线阅读 下载PDF
基于语义依存的汉语句子相似度计算 被引量:127
20
作者 李彬 刘挺 +1 位作者 秦兵 李生 《计算机应用研究》 CSCD 北大核心 2003年第12期15-17,共3页
句子间相似度的计算在自然语言处理的各个领域都占有很重要的地位,在多文档自动文摘技术中,句子间相似度的计算是一个关键的问题。由于汉语句子的表达形式是多种多样的,要准确地刻画一个句子所表达的意思,必须深入到语义一级并结合语法... 句子间相似度的计算在自然语言处理的各个领域都占有很重要的地位,在多文档自动文摘技术中,句子间相似度的计算是一个关键的问题。由于汉语句子的表达形式是多种多样的,要准确地刻画一个句子所表达的意思,必须深入到语义一级并结合语法结构信息,由此提出了一种基于语义依存的汉语句子相似度计算的方法,该方法取得了令人满意的实验效果。 展开更多
关键词 相似度计算 语义 依存结构 自然语言处理 多文档文摘
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部