-
题名利用语料库技术的中文自动文摘系统
被引量:4
- 1
-
-
作者
姜贤塔
陈根才
-
机构
杭州大学计算机科学系
-
出处
《中文信息学报》
CSCD
北大核心
1999年第2期16-23,共8页
-
文摘
本文着重介绍利用“后邻字符树”的方法在领域语料库中生成字符树库,用于自动文摘候选句子选取时提高精度,介绍了后邻字符树的构造。
-
关键词
字符树
字频统计
语料库
自动文摘系统
中文
-
Keywords
Automatic Abstract Character tree woodfreqency count Corpus
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
G356.7
[文化科学—情报学]
-
-
题名利用字频统计及机器学习的自动文摘方法
被引量:5
- 2
-
-
作者
姜贤塔
陈根才
-
机构
杭州大学计算机科学系
-
出处
《杭州大学学报(自然科学版)》
CSCD
1997年第3期220-225,共6页
-
文摘
本文论述了用计算机对专业语料库进行单字及其后继字的统计,自动生成字频及各字后继词段信息的方法.并应用于文献自动文摘.本方法能在系统的生成和使用过程中进行自学习.以不断地完善系统.
-
关键词
自动文摘
字符树
字频统计
机器学习
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名科技文献主题词的自动标引法
被引量:2
- 3
-
-
作者
石国华
-
机构
杭州大学学报编辑部
-
出处
《杭州大学学报(自然科学版)》
CSCD
1998年第3期54-58,共5页
-
文摘
本文介绍利用后邻字符树方法对文献进行计算机自动处理,对主题词表进行重排,再结合位置信息实现科技文献主题词的自动标引.
-
关键词
主题词
自动标引
科技文献
后邻字符树算法
-
Keywords
automatic indexing
subject
Chinese charcter and its neighbours
-
分类号
G254.2
[文化科学—图书馆学]
-
-
题名StringB-tree在软件复用中的应用研究
- 4
-
-
作者
姚全珠
罗亚红
孙越
-
机构
西安理工大学计算机科学与工程学院
西安卫星测控中心回收部着陆场站
-
出处
《计算机工程与应用》
CSCD
北大核心
2004年第29期166-168,共3页
-
文摘
提出了将StringB-tree用于解决软件复用中的参数化样式匹配问题(parameterizedpatternmatching)。通过对参数化字符串做一个变换,使用StringB-tree这种特殊的数据结构可提高匹配效率。文章的重点有两部分,一个是介绍了StringB-tree这种特殊的数据结构的优点及其构建过程;另一个是讲怎样利用StringB-tree解决参数化样式匹配问题。
-
关键词
字符串平衡树参数化字符串
参数化样式匹配
P-匹配
P-出现
-
Keywords
String B-tree,P-string,parameterized pattern matching,P-match,P-occurance
-
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
-