-
题名一种新的句子相似度度量及其在文本自动摘要中的应用
被引量:34
- 1
-
-
作者
张奇
黄萱菁
吴立德
-
机构
复旦大学计算机科学与工程系
-
出处
《中文信息学报》
CSCD
北大核心
2005年第2期93-99,共7页
-
基金
国家自然科学基金资助项目 (6 0 10 30 14 )
上海市科委重要研究项目资助 (0 35 0 0 5 0 2 8)
-
文摘
本文提出了一种新的句子相似度度量的方法并应用于文本自动摘要中。其创新处在于相似度计算不仅考虑句子中的uni gram ,还考虑了bi gram和tri gram ,通过回归方法将这几种相似度结果综合起来。实验证明这种相似度计算方法是有效的。同时本文还提出了一种新的 ,利用句子间相似度以及句子的权重的抽句式文摘算法 ,在抽取出句子的同时也去掉了冗余。DUC2 0 0 3、DUC2 0 0 4 (DocumentUnderstandingConference 2 0 0 3,2 0 0 4 )的评测结果征明了方法的有效性。我们的系统在DUC2 0 0 4的评测中列第二位。
-
关键词
计算机应用
中文信息处理
文本自动摘要
向量模型
相似度计算
-
Keywords
computer application
Chinese information processing
text summarization
vector model
similarity calculating
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名多文种融合文字书写教学知识及其自动生成方法
被引量:2
- 2
-
-
作者
李文涛
戴永
彭喻杰
谢建斌
-
机构
湘潭大学智能计算与信息处理教育部重点实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第11期218-223,231,共7页
-
基金
湖南省教育厅基金资助项目(13C914)
湖南省"十二五"重点学科建设基金资助项目
-
文摘
多文种融合文字书写教学系统的教学资源具有多语源的特点,但存在知识点数据类型多、计算结构复杂等不足。为此,依据不同文种文字书写的异性与共性规律,提出基于文字书写过程计算的知识点自动生成方法。将多文种的笔画、笔画关系、部件关系等计算元按共享、分类,给出各类计算元编码空间的计算方法,定义面向各文种通用的文字书写过程计算模型,设计并实现计算模型中各计算元编码的自动生成算法。实验结果表明,该方法能准确识别各种知识要素,笔画及各类关系的识别正确率达到98.3%,与人工编码相比,录入速率提高15%,冗码率降低23%。
-
关键词
多文种融合
文字书写教学
知识点
文字书写过程计算模型
计算元
自动编码
-
Keywords
multilingual integration
text writing teaching
knowledge point
calculation model of text writing process
computing element
automatic coding
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-