-
题名一个基于语义分析的倾向性文档过滤系统
被引量:7
- 1
-
-
作者
江宝林
刘永丹
金峰
葛家翔
胡运发
-
机构
复旦大学计算机与信息技术系
-
出处
《计算机应用与软件》
CSCD
北大核心
2005年第1期10-11,139,共3页
-
基金
本课题得到国家自然科学基金资助(60 1 730 2 7)。
-
文摘
目前的过滤系统大都是基于关键词的 ,这类系统适用于主题性过滤 ,而对倾向性过滤效果不好。本文提出一种适用于倾向性文档过滤的系统 ,通过语义分析 ,有效地识别和过滤倾向性文本信息。
-
关键词
倾向性
主题性
文档过滤
关键词
语义分析
文本信息
适用
过滤系统
识别
-
Keywords
Text filtering Semantic analysis Semantic pattern Case grammar
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名XML文档过滤算法YFilter的一种改进技术
被引量:1
- 2
-
-
作者
苏明柿
张守志
-
机构
复旦大学计算机与信息技术系
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2005年第21期63-65,共3页
-
基金
国家自然科学基金资助项目(69933010)
-
文摘
采用索引技术,对输入的XML文档建立一个双索引结构来改进YFilter算法,优化XML文档过滤性能。藉助索引结构,该算法超前搜索元素结点在文档中的结构信息,预先排除不能保证得到任何匹配结果的元素结点,以避免大量不必要的查询处理。实验结果显示,当输入的XML文档较大时,该算法有较好的过滤性能。
-
关键词
XML
文档过滤
索引结构
-
Keywords
XML
Document filtering
Index structure
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于词频统计的个性化信息过滤技术
被引量:12
- 3
-
-
作者
张国印
陈先
皮鹏
-
机构
哈尔滨工程大学计算机科学与技术学院
-
出处
《哈尔滨工程大学学报》
EI
CAS
CSCD
2003年第1期63-67,共5页
-
基金
黑龙江省青年基金资助项目(Q00C037).
-
文摘
对Internet信息进行过滤,筛选出与用户兴趣最相符的文档,是智能搜索引擎要解决的一个重要问题.本文在介绍搜索引擎基本原理的基础上,提出了一种文档学习和用户个性词典构建的实现方法,其中包括内码转换、分词、摘词处理、用户个性词典的构建及词条权值调整等环节.然后提出了一种基于词频统计的个性化文档过滤算法,该算法对传统的向量空间模型法做了改进,使之能够更好地计算文档与用户个性词典之间的相关度,根据用户的兴趣爱好对文档进行相关度的过滤、排序,并给出了实验数据.实验结果表明该方法较好地解决了智能搜索引擎中Internet信息过滤、排序的问题.
-
关键词
搜索引擎
文档过滤
向量空间模型法
词频统计
个性词典
-
Keywords
intelligent search engine
document filtration
vector space model
term-frequency
users' personal dictionary
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名基于文档信息空间模型的词元权重调整
- 4
-
-
作者
吴科
石冰
-
机构
山东大学计算机科学与技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2004年第9期191-193,共3页
-
基金
山东省科技厅资助项目
-
文摘
在web文档信息检索中,文档分类、文档过滤的质量一直是影响用户查询结果的关键。这篇论文将通过分析一些典型的权重函数的构造,提出一个基于文档信息空间的权重函数来计算调整文档中词元的权重,使文档的分类和过滤效率更高。
-
关键词
信息检索
文档分类
文档过滤
权重函数
-
Keywords
information retrieval,text categorization,text filtering,weighting function
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名智能信息检索中个性化模式的表示形式研究
被引量:9
- 5
-
-
作者
田萱
孟祥光
刘希玉
-
机构
山东师范大学信息管理学院
首都师范大学教育技术系
-
出处
《情报学报》
CSSCI
北大核心
2004年第1期21-26,共6页
-
文摘
智能信息检索中,个性化模式的描述和更新决定了文档过滤的效率。本文根据Huffman树的特点,提出基于Huffman树形式组织用户个性化模式并给出其相应的文档过滤算法。与其他他同的个性化模式过滤算法的性能比较而言,其具有占用空间少,过滤速度快的优点。
-
关键词
智能信息检索
个性化检索
文档过滤
HUFFMAN树
数据结构
-
分类号
G354.4
[文化科学—情报学]
-
-
题名DTD上的YFilter数据流查询优化算法
- 6
-
-
作者
蔡俊仁
俞建家
-
机构
福州大学数学与计算机科学学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2012年第2期811-814,共4页
-
文摘
为了提高YFilter的查询处理效率,在已有的研究工作和YFilter的过滤技术上,定义了唯一父亲约束的完整性约束,并结合DTD的结构和约束信息优化XPath表达式,这种优化算法是在系统运行前进行的预处理,所以有效地降低了YFilter系统的查询时间和空间复杂度。实验结果表明,优化后查询表达式之间相同的前缀增加了,减少了有限自动机的状态数目,并且有效地加快了YFilter的查询速度。
-
关键词
XML文档流
XML路径语言
文档过滤
查询优化
文档类型定义
-
Keywords
XML document stream
XPath
document filtering
query optimization
document type definition
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-