-
题名基于多模板隐马尔可夫模型的文本信息抽取算法
被引量:9
- 1
-
-
作者
钟敏娟
郝谦
刘云中
-
机构
江西财经大学信息管理学院
江西科技师范学院数学与计算机科学系
深圳中兴通讯公司CDMA事业部
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第2期203-205,共3页
-
文摘
针对训练数据来源的多样化,提出了基于多模板隐马尔可夫模型的文本信息抽取算法。该算法利用形式的聚类方法将训练数据聚成几个类,每个类代表一个模板,在聚类的基础上利用隐马尔可夫模型进行文本的信息抽取。实验结果表明,新算法具有较高的精确度和召回率。
-
关键词
信息抽取
隐马尔可夫模型
多模板
聚类
-
Keywords
Information extraction
Hidden Markov model
Multiple templates
Clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于超链接和标记文本的信息检索算法
被引量:7
- 2
-
-
作者
钟敏娟
林亚平
陈治平
-
机构
江西科技师范学院数学与计算机科学系
湖南大学计算机与通信学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2004年第7期1344-1347,共4页
-
基金
国家自然科学基金 (60 2 72 0 5 1)资助
-
文摘
在 HITS超链接主题查找算法的基础上提出了一种检索改进算法 .该算法首先通过网页之间的链接关系计算出每一网页的出度值和入度值 ,并将查询条件与超链接上的标记文本或网页全文内容进行相似度匹配 ,得出每一网页的权值 ,综合权值与出度或入度值 ,将检索结果进行排序输出 .实验结果表明 ,与 HITS、TF* IDF算法相比 。
-
关键词
HITS
网页入度
网页出度
标记文本
-
Keywords
HITS algorithm
authority
hub
anchor
-
分类号
TP319
[自动化与计算机技术—计算机软件与理论]
-
-
题名CDSE:一个面向领域的智能搜索引擎
- 3
-
-
作者
钟敏娟
凌传繁
白耀辉
郭攀
-
机构
江西财经大学信息管理学院
江西财经大学电子学院
江西科技师范学院数学与计算机科学系
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第24期206-208,共3页
-
基金
江西省教育厅科技基金资助项目(赣教计字[2005]326
赣教计字[2005]327)
-
文摘
介绍了一个面向领域的智能搜索引擎CDSE(Computer Document Search Engine)的设计和实现。CDSE结合文本分类和关键词组抽取检索用户需要的信息。利用了多个算法,综合运用了统计学方法、数据挖掘技术和Agent技术,较好地解决了现有搜索引擎普遍存在的搜索精度差、相关文档列序较后的问题。
-
关键词
钳能搜索引擎
关键词组抽取
数据挖掘
AGENT
-
Keywords
Intelligent search engine
Key phrase extraction
Data mining
Agent
-
分类号
TP319
[自动化与计算机技术—计算机软件与理论]
-
-
题名业务流程再造是电力企业提升国际竞争力的战略模式
- 4
-
-
作者
童倩云
杨林
-
机构
江西科技师范学院数学与计算机科学系
南京大学商学院
-
出处
《商业研究》
北大核心
2006年第10期82-85,共4页
-
文摘
迄今为止,关于业务流程再造的理论研究及其实践应用主要集中于盈利性企业。然而,伴随着我国加入WTO,国内电力市场的竞争程度必将日趋激烈。为了尽快提升自身国际竞争力,以更好地迎接日益激烈的电力市场竞争,国内电力企业必须积极地对自身进行有效地改革。
-
关键词
国际竞争力
业务流程再造
电力企业
-
分类号
F270
[经济管理—企业管理]
-
-
题名农村教育资源流失问题与对策
- 5
-
-
作者
何金莲
-
机构
江西科技师范学院数学与计算机科学系
-
出处
《农业考古》
北大核心
2006年第6期404-406,共3页
-
文摘
本文主要讨论了随着我国农村城市化的进程以及贯彻统筹城乡发展思想的过程中,如何应对发展农村教育时所遇到农村教育资源的显性与隐性流失的突出问题与对策。
-
关键词
农村
教育资源
流失
-
分类号
S
[农业科学]
-