期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
多文档文摘中基于时间信息的句子排序策略研究
被引量:
8
1
作者
徐永东
王亚东
+2 位作者
刘杨
王伟
权光日
《中文信息学报》
CSCD
北大核心
2009年第4期27-33,共7页
文摘句排序是多文档自动文摘中的一个关键技术,直接影响到文摘的流畅程度和可读性。文本时间信息处理是影响排序算法质量的瓶颈技术,由于无法获得准确的时间信息,传统的句子排序策略均回避了这一问题,而且均无法获得稳定的高质量的排序...
文摘句排序是多文档自动文摘中的一个关键技术,直接影响到文摘的流畅程度和可读性。文本时间信息处理是影响排序算法质量的瓶颈技术,由于无法获得准确的时间信息,传统的句子排序策略均回避了这一问题,而且均无法获得稳定的高质量的排序效果。对此该文从文本时间信息处理入手,首先提出了中文文本时间信息抽取、语义计算以及时序推理算法,并在此算法基础上,借鉴传统的主成分排列的思想和句子相关度计算方法,提出了基于时间信息的句子排序算法。实验表明该算法的质量要明显好于传统的主成分排列算法和时序排列算法。
展开更多
关键词
计算机应用
中文
信息
处理
多文档自动文摘
句子排序
中文
时间信息处理
在线阅读
下载PDF
职称材料
基于条件随机场的中文时间短语识别
被引量:
16
2
作者
朱莎莎
刘宗田
+1 位作者
付剑锋
朱芳
《计算机工程》
CAS
CSCD
北大核心
2011年第15期164-167,共4页
传统时间短语识别方法存在中文文本时间短语边界定位不准确和长距离依赖的问题。为此,提出一种基于条件随机场(CRFs)的时间短语识别方法。采用基于机器学习的方法识别时间短语,分析中文文本中时间短语的词法、句法和上下文信息等语言学...
传统时间短语识别方法存在中文文本时间短语边界定位不准确和长距离依赖的问题。为此,提出一种基于条件随机场(CRFs)的时间短语识别方法。采用基于机器学习的方法识别时间短语,分析中文文本中时间短语的词法、句法和上下文信息等语言学特征,将时间短语分为日期型和事件型2种类型,并半自动构建3个常用词表作为外部特征。在此基础上,引入能整合不同层面特征的CRFs方法,将识别问题转化为序列标注问题。实验结果表明,该方法在日期型时间短语和事件型时间短语识别上分别取得95.70%和85.75%的F1值,识别效果较好。
展开更多
关键词
中文
时间
短语
时间
短语识别
条件随机场
时间信息处理
在线阅读
下载PDF
职称材料
基于转换的时间-事件关系映射
被引量:
19
3
作者
王昀
苑春法
《中文信息学报》
CSCD
北大核心
2004年第4期23-30,共8页
近些年来 ,中文时间信息抽取和处理已经变得越来越重要。然而 ,很少有研究者关注中文文本中事件信息所对应的时间信息的识别和分析。本文的目的就是确定文本中时间信息和事件信息之间的映射关系。区别于传统的基于规则的方法 ,本文采用...
近些年来 ,中文时间信息抽取和处理已经变得越来越重要。然而 ,很少有研究者关注中文文本中事件信息所对应的时间信息的识别和分析。本文的目的就是确定文本中时间信息和事件信息之间的映射关系。区别于传统的基于规则的方法 ,本文采用了一种机器学习的方法—基于转换的错误驱动学习—来确定事件相应的时间表达 ,这种学习算法可以自动的获取和改进规则。使用训练得到的转换规则集后 ,系统的时间 -事件映射错误率减少了 9 74 % 。
展开更多
关键词
计算机应用
中文
信息
处理
时间信息处理
基于转换的错误驱动学习
信息
抽取
在线阅读
下载PDF
职称材料
时间维度下的史籍全文自动重组研究--数字人文视角下的探索
被引量:
4
4
作者
张琪
王东波
+3 位作者
黄水清
李斌
孟凯
邓三鸿
《图书情报知识》
CSSCI
北大核心
2022年第1期51-60,147,共11页
[目的/意义]本文从数字人文的视角出发,试图探究一套具体的技术方法解决古汉语时间描述所存在的省略、共指、歧义、模糊等问题,使得读者可以跨越纪传体、国别体、纪事本末体等体裁壁垒,获取不同史书中关于某一时间段的所有史料。[研究设...
[目的/意义]本文从数字人文的视角出发,试图探究一套具体的技术方法解决古汉语时间描述所存在的省略、共指、歧义、模糊等问题,使得读者可以跨越纪传体、国别体、纪事本末体等体裁壁垒,获取不同史书中关于某一时间段的所有史料。[研究设计/过程]在梳理古汉语时间描述类型与特征的基础上,提出一套以时间为线索自动重组史书全文的方法。该方法首先识别古汉语时间描述并进行语义解析,继而识别事件句并将事件句关联至时间描述,最后将提出的方法应用于纪传体史书《史记》和国别体史书《国语》的重组中,检验方法的有效性。[结论/发现]本研究所提出的方法能够有效实现纪传体、国别体史书以时间为线索的重组问题,在有效减少人工标注的前提下达到了较高的准确率。[创新/价值]针对古汉语时间描述存在的歧义与共指等问题,提出一套完整的以时间为线索自动重组史书全文的方法,并通过实验验证了方法的有效性。
展开更多
关键词
数字人文
史书
古汉语
时间信息处理
古汉语
时间
表达式消歧
事件
时间
语义关联
在线阅读
下载PDF
职称材料
题名
多文档文摘中基于时间信息的句子排序策略研究
被引量:
8
1
作者
徐永东
王亚东
刘杨
王伟
权光日
机构
哈尔滨工业大学(威海)计算机科学与技术学院
出处
《中文信息学报》
CSCD
北大核心
2009年第4期27-33,共7页
基金
国家自然科学基金资助项目(60803092)
哈尔滨工业大学科技创新基金资助(IMQQ29080001)
文摘
文摘句排序是多文档自动文摘中的一个关键技术,直接影响到文摘的流畅程度和可读性。文本时间信息处理是影响排序算法质量的瓶颈技术,由于无法获得准确的时间信息,传统的句子排序策略均回避了这一问题,而且均无法获得稳定的高质量的排序效果。对此该文从文本时间信息处理入手,首先提出了中文文本时间信息抽取、语义计算以及时序推理算法,并在此算法基础上,借鉴传统的主成分排列的思想和句子相关度计算方法,提出了基于时间信息的句子排序算法。实验表明该算法的质量要明显好于传统的主成分排列算法和时序排列算法。
关键词
计算机应用
中文
信息
处理
多文档自动文摘
句子排序
中文
时间信息处理
Keywords
computer application
Chinese information processing
multi-documents automatic summarization
sen tences ordering
Chinese temporal information processing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于条件随机场的中文时间短语识别
被引量:
16
2
作者
朱莎莎
刘宗田
付剑锋
朱芳
机构
上海大学计算机工程与科学学院
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第15期164-167,共4页
基金
国家自然科学基金资助项目(60975033)
上海市重点学科建设基金资助项目(J50103)
+1 种基金
上海大学研究生创新基金资助项目(SHUCX091041
SHUCX102174)
文摘
传统时间短语识别方法存在中文文本时间短语边界定位不准确和长距离依赖的问题。为此,提出一种基于条件随机场(CRFs)的时间短语识别方法。采用基于机器学习的方法识别时间短语,分析中文文本中时间短语的词法、句法和上下文信息等语言学特征,将时间短语分为日期型和事件型2种类型,并半自动构建3个常用词表作为外部特征。在此基础上,引入能整合不同层面特征的CRFs方法,将识别问题转化为序列标注问题。实验结果表明,该方法在日期型时间短语和事件型时间短语识别上分别取得95.70%和85.75%的F1值,识别效果较好。
关键词
中文
时间
短语
时间
短语识别
条件随机场
时间信息处理
Keywords
Chinese temporal phrase
temporal phrase recognition
Conditional Random Fields(CRFs)
temporal information processing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于转换的时间-事件关系映射
被引量:
19
3
作者
王昀
苑春法
机构
智能技术与系统国家重点实验室清华大学计算机科学与技术系
出处
《中文信息学报》
CSCD
北大核心
2004年第4期23-30,共8页
基金
自然科学基金资助项目 (6 9975 0 0 8)
86 3计划资助项目 (2 0 0 1AA1 1 4 2 1 0 )
文摘
近些年来 ,中文时间信息抽取和处理已经变得越来越重要。然而 ,很少有研究者关注中文文本中事件信息所对应的时间信息的识别和分析。本文的目的就是确定文本中时间信息和事件信息之间的映射关系。区别于传统的基于规则的方法 ,本文采用了一种机器学习的方法—基于转换的错误驱动学习—来确定事件相应的时间表达 ,这种学习算法可以自动的获取和改进规则。使用训练得到的转换规则集后 ,系统的时间 -事件映射错误率减少了 9 74 % 。
关键词
计算机应用
中文
信息
处理
时间信息处理
基于转换的错误驱动学习
信息
抽取
Keywords
computer application
Chinese information processing
Temporal information processing
transformation-based error-driven learning
information extraction
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
时间维度下的史籍全文自动重组研究--数字人文视角下的探索
被引量:
4
4
作者
张琪
王东波
黄水清
李斌
孟凯
邓三鸿
机构
南京大学信息管理学院
南京农业大学信息管理学院
南京师范大学文学院
南京农业大学马克思主义学院
江苏省数据工程与知识服务重点实验室
出处
《图书情报知识》
CSSCI
北大核心
2022年第1期51-60,147,共11页
基金
国家社科基金重大项目“中国古代典籍跨语言知识库构建及应用研究”(21&ZD331)
国家自然科学基金面上项目“基于典籍引得的句法级汉英平行语料库构建及人文计算研究”(71673143)的研究成果之一。
文摘
[目的/意义]本文从数字人文的视角出发,试图探究一套具体的技术方法解决古汉语时间描述所存在的省略、共指、歧义、模糊等问题,使得读者可以跨越纪传体、国别体、纪事本末体等体裁壁垒,获取不同史书中关于某一时间段的所有史料。[研究设计/过程]在梳理古汉语时间描述类型与特征的基础上,提出一套以时间为线索自动重组史书全文的方法。该方法首先识别古汉语时间描述并进行语义解析,继而识别事件句并将事件句关联至时间描述,最后将提出的方法应用于纪传体史书《史记》和国别体史书《国语》的重组中,检验方法的有效性。[结论/发现]本研究所提出的方法能够有效实现纪传体、国别体史书以时间为线索的重组问题,在有效减少人工标注的前提下达到了较高的准确率。[创新/价值]针对古汉语时间描述存在的歧义与共指等问题,提出一套完整的以时间为线索自动重组史书全文的方法,并通过实验验证了方法的有效性。
关键词
数字人文
史书
古汉语
时间信息处理
古汉语
时间
表达式消歧
事件
时间
语义关联
Keywords
Digital humanities
Historical records
Ancient Chinese temporal expression processing
Ancient Chinese time expression disambiguation
Event-time relation extraction
分类号
G250 [文化科学—图书馆学]
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
多文档文摘中基于时间信息的句子排序策略研究
徐永东
王亚东
刘杨
王伟
权光日
《中文信息学报》
CSCD
北大核心
2009
8
在线阅读
下载PDF
职称材料
2
基于条件随机场的中文时间短语识别
朱莎莎
刘宗田
付剑锋
朱芳
《计算机工程》
CAS
CSCD
北大核心
2011
16
在线阅读
下载PDF
职称材料
3
基于转换的时间-事件关系映射
王昀
苑春法
《中文信息学报》
CSCD
北大核心
2004
19
在线阅读
下载PDF
职称材料
4
时间维度下的史籍全文自动重组研究--数字人文视角下的探索
张琪
王东波
黄水清
李斌
孟凯
邓三鸿
《图书情报知识》
CSSCI
北大核心
2022
4
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部