期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
多文档文摘中基于时间信息的句子排序策略研究 被引量:8
1
作者 徐永东 王亚东 +2 位作者 刘杨 王伟 权光日 《中文信息学报》 CSCD 北大核心 2009年第4期27-33,共7页
文摘句排序是多文档自动文摘中的一个关键技术,直接影响到文摘的流畅程度和可读性。文本时间信息处理是影响排序算法质量的瓶颈技术,由于无法获得准确的时间信息,传统的句子排序策略均回避了这一问题,而且均无法获得稳定的高质量的排序... 文摘句排序是多文档自动文摘中的一个关键技术,直接影响到文摘的流畅程度和可读性。文本时间信息处理是影响排序算法质量的瓶颈技术,由于无法获得准确的时间信息,传统的句子排序策略均回避了这一问题,而且均无法获得稳定的高质量的排序效果。对此该文从文本时间信息处理入手,首先提出了中文文本时间信息抽取、语义计算以及时序推理算法,并在此算法基础上,借鉴传统的主成分排列的思想和句子相关度计算方法,提出了基于时间信息的句子排序算法。实验表明该算法的质量要明显好于传统的主成分排列算法和时序排列算法。 展开更多
关键词 计算机应用 中文信息处理 多文档自动文摘 句子排序 中文时间信息处理
在线阅读 下载PDF
基于条件随机场的中文时间短语识别 被引量:16
2
作者 朱莎莎 刘宗田 +1 位作者 付剑锋 朱芳 《计算机工程》 CAS CSCD 北大核心 2011年第15期164-167,共4页
传统时间短语识别方法存在中文文本时间短语边界定位不准确和长距离依赖的问题。为此,提出一种基于条件随机场(CRFs)的时间短语识别方法。采用基于机器学习的方法识别时间短语,分析中文文本中时间短语的词法、句法和上下文信息等语言学... 传统时间短语识别方法存在中文文本时间短语边界定位不准确和长距离依赖的问题。为此,提出一种基于条件随机场(CRFs)的时间短语识别方法。采用基于机器学习的方法识别时间短语,分析中文文本中时间短语的词法、句法和上下文信息等语言学特征,将时间短语分为日期型和事件型2种类型,并半自动构建3个常用词表作为外部特征。在此基础上,引入能整合不同层面特征的CRFs方法,将识别问题转化为序列标注问题。实验结果表明,该方法在日期型时间短语和事件型时间短语识别上分别取得95.70%和85.75%的F1值,识别效果较好。 展开更多
关键词 中文时间短语 时间短语识别 条件随机场 时间信息处理
在线阅读 下载PDF
基于转换的时间-事件关系映射 被引量:19
3
作者 王昀 苑春法 《中文信息学报》 CSCD 北大核心 2004年第4期23-30,共8页
近些年来 ,中文时间信息抽取和处理已经变得越来越重要。然而 ,很少有研究者关注中文文本中事件信息所对应的时间信息的识别和分析。本文的目的就是确定文本中时间信息和事件信息之间的映射关系。区别于传统的基于规则的方法 ,本文采用... 近些年来 ,中文时间信息抽取和处理已经变得越来越重要。然而 ,很少有研究者关注中文文本中事件信息所对应的时间信息的识别和分析。本文的目的就是确定文本中时间信息和事件信息之间的映射关系。区别于传统的基于规则的方法 ,本文采用了一种机器学习的方法—基于转换的错误驱动学习—来确定事件相应的时间表达 ,这种学习算法可以自动的获取和改进规则。使用训练得到的转换规则集后 ,系统的时间 -事件映射错误率减少了 9 74 % 。 展开更多
关键词 计算机应用 中文信息处理 时间信息处理 基于转换的错误驱动学习 信息抽取
在线阅读 下载PDF
时间维度下的史籍全文自动重组研究--数字人文视角下的探索 被引量:4
4
作者 张琪 王东波 +3 位作者 黄水清 李斌 孟凯 邓三鸿 《图书情报知识》 CSSCI 北大核心 2022年第1期51-60,147,共11页
[目的/意义]本文从数字人文的视角出发,试图探究一套具体的技术方法解决古汉语时间描述所存在的省略、共指、歧义、模糊等问题,使得读者可以跨越纪传体、国别体、纪事本末体等体裁壁垒,获取不同史书中关于某一时间段的所有史料。[研究设... [目的/意义]本文从数字人文的视角出发,试图探究一套具体的技术方法解决古汉语时间描述所存在的省略、共指、歧义、模糊等问题,使得读者可以跨越纪传体、国别体、纪事本末体等体裁壁垒,获取不同史书中关于某一时间段的所有史料。[研究设计/过程]在梳理古汉语时间描述类型与特征的基础上,提出一套以时间为线索自动重组史书全文的方法。该方法首先识别古汉语时间描述并进行语义解析,继而识别事件句并将事件句关联至时间描述,最后将提出的方法应用于纪传体史书《史记》和国别体史书《国语》的重组中,检验方法的有效性。[结论/发现]本研究所提出的方法能够有效实现纪传体、国别体史书以时间为线索的重组问题,在有效减少人工标注的前提下达到了较高的准确率。[创新/价值]针对古汉语时间描述存在的歧义与共指等问题,提出一套完整的以时间为线索自动重组史书全文的方法,并通过实验验证了方法的有效性。 展开更多
关键词 数字人文 史书 古汉语时间信息处理 古汉语时间表达式消歧 事件时间语义关联
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部