-
题名Web信息抽取技术研究进展
被引量:19
- 1
-
-
作者
陈少飞
郝亚南
李天柱
徐林昊
杨文柱
-
机构
河北大学数学与计算机学院
-
出处
《河北大学学报(自然科学版)》
CAS
2003年第1期106-112,共7页
-
文摘
Web信息抽取技术是当今的一个研究热点。目前出现了基于不同原理的多种信息抽取技术,它们具有不同的性能。本文根据信息抽取的原理,对现有的信息抽取技术进行了分类,结合典型的系统,在语义的附加方式、模式的定义方式、规则的表现形式、语义项的定位方式、对象的定位方式等几方面进行了分析和比较,在此基础上提出了待研究的问题。
-
关键词
WEB信息抽取技术
研究进展
HTML
XML
语义
抽取模式
抽取原理
WEB查询
抽取规则
-
Keywords
HTML
XML
semantics
rule
information extraction
-
分类号
TP393.092
[自动化与计算机技术—计算机应用技术]
-
-
题名信息抽取技术及其在数字图书馆中的应用前景分析
被引量:1
- 2
-
-
作者
刘爽
-
机构
伊春市图书馆
-
出处
《现代情报》
北大核心
2006年第11期75-76,共2页
-
文摘
文中论述了信息抽取技术的概念与特点,类型与方法以及在现代数字图书馆中的应用分析。
-
关键词
信息抽取技术
数字图书馆
应用分析
-
Keywords
information extracts technology
digital library
application analysis
-
分类号
G250.76
[文化科学—图书馆学]
-
-
题名基于RSS技术的移动化农业信息服务系统研究
被引量:1
- 3
-
-
作者
王政嘉
李征
王健
-
机构
河北农业大学
中国地质大学长城学院
-
出处
《河北农业科学》
2012年第1期99-102,106,共5页
-
基金
2012年度教育部人文社会科学研究规划基金项目(12YJAZH138)
-
文摘
作者根据农村互联网发展的现状,依托RSS为核心技术,同时结合移动互联网技术、页面信息抽取技术、个性化用户模型等技术,设计了支持移动设备的个性化农业信息服务系统,力求可以通过移动设备完整、及时、低成本地将农业信息传送给农户。
-
关键词
简单消息聚合
农业信息服务系统
信息聚合
信息抽取技术
个性化服务
-
Keywords
RSS
Agricultural information service system
Information syndication
Information extraction technology
Personalized service
-
分类号
G202
[文化科学—传播学]
-
-
题名WEB主题检索的性能优化设计
被引量:1
- 4
-
-
作者
田学东
李树成
-
机构
河北大学数学与计算机学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第4期183-185,188,共4页
-
基金
河北省自然科学基金资助项目(编号:F2004000132)
-
文摘
Web主题检索是信息检索领域一个将采集技术与过滤方法结合的新兴方向,也是信息处理领域的研究热点。针对现有主题检索系统在Web页面文本的主题相关性判断和Spider搜索策略方面存在的问题,引入两个性能优化方案,即利用信息抽取技术,提出了一种基于模式集的主题相关性判断方法来提高主题判断准确度;针对pagerank在主题检索中存在的不足,引入基于增强学习的页面评估算法,提出了Web环境优先的搜索策略。最后根据实验结果评估两个算法的性能。
-
关键词
信息抽取技术
信息抽取模式
模式匹配
WEB环境
增强学习
-
Keywords
information extraction,extraction pattern,pattern matching,WEB Environment,reinforcement learning
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-