期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
7
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于正则表达式的专利信息提取方法研究
被引量:
15
1
作者
邱清盈
郑国民
+1 位作者
冯培恩
武建伟
《中国机械工程》
EI
CAS
CSCD
北大核心
2007年第19期2326-2329,共4页
针对图像格式专利文献难以进行全文检索和深入分析利用的问题,根据专利文献的结构特点,通过集成光学字符识别工具和建立具有容错性的专利信息提取正则表达式,提出了专利文献的数字化和信息提取方法。开发了相应的软件系统,实现了专利信...
针对图像格式专利文献难以进行全文检索和深入分析利用的问题,根据专利文献的结构特点,通过集成光学字符识别工具和建立具有容错性的专利信息提取正则表达式,提出了专利文献的数字化和信息提取方法。开发了相应的软件系统,实现了专利信息的批量提取,为后续高效率地对专利文献进行自动分析和知识挖掘提供了数据基础。
展开更多
关键词
专利分析
信息提取
正则表达式
设计知识
在线阅读
下载PDF
职称材料
ReDE:一个基于正则表达式的生物数据抽取方法
被引量:
8
2
作者
邓绪斌
朱扬勇
《计算机研究与发展》
EI
CSCD
北大核心
2005年第12期2184-2191,共8页
从异构生物数据源抽取数据,建立查询分析平台是目前研究的热点,而抽取过程会涉及大量相互依赖的元数据,充分利用这种依赖关系可降低维护工作量·基于正则表达式(RE)提出了ReDE抽取方法:通过围绕RE组建立分析树,设计了基于RE的关系...
从异构生物数据源抽取数据,建立查询分析平台是目前研究的热点,而抽取过程会涉及大量相互依赖的元数据,充分利用这种依赖关系可降低维护工作量·基于正则表达式(RE)提出了ReDE抽取方法:通过围绕RE组建立分析树,设计了基于RE的关系数据库模式生成算法和通用抽取与组装算法,其特点是:RE是惟一的元数据,易于管理和维护·该方法奠定了生物数据库辅助设计工具和高自动化抽取工具的基础,已用于构建国内第1个整合的生物信息在线数据仓库·
展开更多
关键词
生物数据源
数据抽取
元数据
正则表达式
抽取算法
在线阅读
下载PDF
职称材料
基于单元识别的网页信息抽取方法
被引量:
1
3
作者
柳永念
钟诚
焦小焦
《广西大学学报(自然科学版)》
CAS
CSCD
北大核心
2011年第5期787-791,共5页
建立基于链的父亲结构树描述和存储网页信息,采用Htmlparse和基于正则表达式的描述方法,设计、实现了一种高效的基于单元识别的网页信息抽取算法。分析与实验结果表明,文中给出的网页信息抽取方法能提高检索的查准率和查全率。
关键词
单元识别
信息抽取
父亲结构树
HTMLPARSER
正则表达式
在线阅读
下载PDF
职称材料
基于C#正则表达式的农业文献管理系统的研究与应用
被引量:
1
4
作者
杨波
张立娜
《安徽农业科学》
CAS
2012年第5期2988-2990,共3页
利用PDFBOX和正则表达式批量提取已下载到本地的PDF格式农业文献的元数据,建立农业文献信息关系型数据库,根据需要建立农业文献管理系统,提高农业文献利用效率和科研效率。在C#环境下,对PDFBOX进行封装,利用数据流的写入功能将PDF格式...
利用PDFBOX和正则表达式批量提取已下载到本地的PDF格式农业文献的元数据,建立农业文献信息关系型数据库,根据需要建立农业文献管理系统,提高农业文献利用效率和科研效率。在C#环境下,对PDFBOX进行封装,利用数据流的写入功能将PDF格式的农业文献的二进制内容以简体中文输出,再利用正则表达式设计规则模型批量提取相关元数据。
展开更多
关键词
PDF
PDFBOX
正则表达式
元数据
提取
在线阅读
下载PDF
职称材料
基于HTML解析器的Web信息提取技术
被引量:
1
5
作者
王琳琳
《郑州轻工业学院学报(自然科学版)》
CAS
2008年第6期100-102,106,共4页
提出一种使用开源的HTML解析器包和正则表达式来提取W eb网页信息的方法.该方法能够解析HTML文件的组成结构,并从中提取主体文本以供处理.实验表明,该方法的抽取准确率可达到95%以上,具有简单、准确的特点.
关键词
WEB信息提取
正则表达式
HTML解析器
主题信息
在线阅读
下载PDF
职称材料
基于多种规则的课程元数据自动抽取
被引量:
7
6
作者
杨宇
张铭
周宝曜
《计算机科学》
CSCD
北大核心
2008年第3期94-96,共3页
在线课程组织和管理系统就是为了使学习更加便利而提供的一个教育资源的集成平台。作为系统中重要环节的元数据抽取模块,需要对半结构化网页能够达到较好的抽取精确性,并具有处理结构松散文档的能力。本文设计并实现了一种按照指定规则...
在线课程组织和管理系统就是为了使学习更加便利而提供的一个教育资源的集成平台。作为系统中重要环节的元数据抽取模块,需要对半结构化网页能够达到较好的抽取精确性,并具有处理结构松散文档的能力。本文设计并实现了一种按照指定规则自动抽取的元数据方法。该方法能够按照多优先级规则匹配网页元数据,并按照两步抽取的方法进行精细化处理。针对不同的问题域使用不同规则抽取,不需对程序进行特定修改。实验证明,这种方法能够很好地处理半结构化网页,F测度达到85%以上,具有较好的实用价值。
展开更多
关键词
元数据抽取
正则表达式
信息精化
在线阅读
下载PDF
职称材料
基于GRETA正则表达式的机器人解释器的研究
被引量:
7
7
作者
何嘉健
李伟光
《组合机床与自动化加工技术》
北大核心
2012年第1期17-19,24,共4页
为了解决传统解释器编译过程复杂,效率低的问题,提出了一种基于GRETA正则表达式的工业机器人解释器的实现方法。利用GRETA正则表达式建立字符匹配表和语法规则后,该解释器即可方便地对指令代码进行解释处理,包括:词法分析、语法分析、...
为了解决传统解释器编译过程复杂,效率低的问题,提出了一种基于GRETA正则表达式的工业机器人解释器的实现方法。利用GRETA正则表达式建立字符匹配表和语法规则后,该解释器即可方便地对指令代码进行解释处理,包括:词法分析、语法分析、语义分析和信息提取。实验表明,该解释器可实现对机器人指令集的正确解释和信息提取,并为机器人控制的开放性和高效性奠定基础。
展开更多
关键词
解释器
GRETA正则表达式
词法分析
语法分析
语义分析
信息提取
在线阅读
下载PDF
职称材料
题名
基于正则表达式的专利信息提取方法研究
被引量:
15
1
作者
邱清盈
郑国民
冯培恩
武建伟
机构
浙江大学CAD&CG国家重点实验室
出处
《中国机械工程》
EI
CAS
CSCD
北大核心
2007年第19期2326-2329,共4页
基金
国家自然科学基金资助项目(50675197
50335040)
浙江省重大科技攻关项目(2004C11015)
文摘
针对图像格式专利文献难以进行全文检索和深入分析利用的问题,根据专利文献的结构特点,通过集成光学字符识别工具和建立具有容错性的专利信息提取正则表达式,提出了专利文献的数字化和信息提取方法。开发了相应的软件系统,实现了专利信息的批量提取,为后续高效率地对专利文献进行自动分析和知识挖掘提供了数据基础。
关键词
专利分析
信息提取
正则表达式
设计知识
Keywords
patent analysis
information
extraction
regular expression
design knowledge
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
ReDE:一个基于正则表达式的生物数据抽取方法
被引量:
8
2
作者
邓绪斌
朱扬勇
机构
浙江财经学院信息学院
复旦大学计算机与信息技术系
出处
《计算机研究与发展》
EI
CSCD
北大核心
2005年第12期2184-2191,共8页
基金
国家"八六三"高技术研究发展计划基金项目(2002AA231011)
上海市重大科技基金项目(02DJ14013)
文摘
从异构生物数据源抽取数据,建立查询分析平台是目前研究的热点,而抽取过程会涉及大量相互依赖的元数据,充分利用这种依赖关系可降低维护工作量·基于正则表达式(RE)提出了ReDE抽取方法:通过围绕RE组建立分析树,设计了基于RE的关系数据库模式生成算法和通用抽取与组装算法,其特点是:RE是惟一的元数据,易于管理和维护·该方法奠定了生物数据库辅助设计工具和高自动化抽取工具的基础,已用于构建国内第1个整合的生物信息在线数据仓库·
关键词
生物数据源
数据抽取
元数据
正则表达式
抽取算法
Keywords
biological data source
data
extraction
metadata
regular expression
extraction
algorithm
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于单元识别的网页信息抽取方法
被引量:
1
3
作者
柳永念
钟诚
焦小焦
机构
广西大学计算机与电子信息学院
出处
《广西大学学报(自然科学版)》
CAS
CSCD
北大核心
2011年第5期787-791,共5页
基金
广西科学研究与技术开发计划(桂科能1140008-3B)
广西高校优秀人才资助计划(RC2007004)
广西教育厅科研基金(200708LX360)
文摘
建立基于链的父亲结构树描述和存储网页信息,采用Htmlparse和基于正则表达式的描述方法,设计、实现了一种高效的基于单元识别的网页信息抽取算法。分析与实验结果表明,文中给出的网页信息抽取方法能提高检索的查准率和查全率。
关键词
单元识别
信息抽取
父亲结构树
HTMLPARSER
正则表达式
Keywords
unit identification
information
extraction
father structure tree
Htmlparser
regular expression
s
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于C#正则表达式的农业文献管理系统的研究与应用
被引量:
1
4
作者
杨波
张立娜
机构
吉林财经大学信息经济学院
吉林农业大学
出处
《安徽农业科学》
CAS
2012年第5期2988-2990,共3页
文摘
利用PDFBOX和正则表达式批量提取已下载到本地的PDF格式农业文献的元数据,建立农业文献信息关系型数据库,根据需要建立农业文献管理系统,提高农业文献利用效率和科研效率。在C#环境下,对PDFBOX进行封装,利用数据流的写入功能将PDF格式的农业文献的二进制内容以简体中文输出,再利用正则表达式设计规则模型批量提取相关元数据。
关键词
PDF
PDFBOX
正则表达式
元数据
提取
Keywords
PDF
PDFBOX
regular expression
metadata
extraction
分类号
S126 [农业科学—农业基础科学]
在线阅读
下载PDF
职称材料
题名
基于HTML解析器的Web信息提取技术
被引量:
1
5
作者
王琳琳
机构
枣庄学院计算机科学系
出处
《郑州轻工业学院学报(自然科学版)》
CAS
2008年第6期100-102,106,共4页
文摘
提出一种使用开源的HTML解析器包和正则表达式来提取W eb网页信息的方法.该方法能够解析HTML文件的组成结构,并从中提取主体文本以供处理.实验表明,该方法的抽取准确率可达到95%以上,具有简单、准确的特点.
关键词
WEB信息提取
正则表达式
HTML解析器
主题信息
Keywords
Web
information
extraction
regular expression
HTML Parser package
topic
information
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于多种规则的课程元数据自动抽取
被引量:
7
6
作者
杨宇
张铭
周宝曜
机构
北京大学信息科学技术学院计算机科学与技术系
惠普中国实验室
出处
《计算机科学》
CSCD
北大核心
2008年第3期94-96,共3页
基金
国家自然科学基金“网络计算环境综合试验平台”(编号90412010)
惠普大学合作基金“在线课程的组织与管理”项目
+1 种基金
国家自然科学基金(编号60573166)
广东省网络重点实验室基金的支持
文摘
在线课程组织和管理系统就是为了使学习更加便利而提供的一个教育资源的集成平台。作为系统中重要环节的元数据抽取模块,需要对半结构化网页能够达到较好的抽取精确性,并具有处理结构松散文档的能力。本文设计并实现了一种按照指定规则自动抽取的元数据方法。该方法能够按照多优先级规则匹配网页元数据,并按照两步抽取的方法进行精细化处理。针对不同的问题域使用不同规则抽取,不需对程序进行特定修改。实验证明,这种方法能够很好地处理半结构化网页,F测度达到85%以上,具有较好的实用价值。
关键词
元数据抽取
正则表达式
信息精化
Keywords
metadata extraction
,
regular expression
,
information refinement
分类号
TP391.2 [自动化与计算机技术—计算机应用技术]
G423 [文化科学—课程与教学论]
在线阅读
下载PDF
职称材料
题名
基于GRETA正则表达式的机器人解释器的研究
被引量:
7
7
作者
何嘉健
李伟光
机构
华南理工大学机械与汽车工程学院
出处
《组合机床与自动化加工技术》
北大核心
2012年第1期17-19,24,共4页
文摘
为了解决传统解释器编译过程复杂,效率低的问题,提出了一种基于GRETA正则表达式的工业机器人解释器的实现方法。利用GRETA正则表达式建立字符匹配表和语法规则后,该解释器即可方便地对指令代码进行解释处理,包括:词法分析、语法分析、语义分析和信息提取。实验表明,该解释器可实现对机器人指令集的正确解释和信息提取,并为机器人控制的开放性和高效性奠定基础。
关键词
解释器
GRETA正则表达式
词法分析
语法分析
语义分析
信息提取
Keywords
interpreter
GRETA
regular expression
lexical analysis
syntax analysis
semantic analysis
information
extraction
分类号
TH122 [机械工程—机械设计及理论]
TP242 [自动化与计算机技术—检测技术与自动化装置]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于正则表达式的专利信息提取方法研究
邱清盈
郑国民
冯培恩
武建伟
《中国机械工程》
EI
CAS
CSCD
北大核心
2007
15
在线阅读
下载PDF
职称材料
2
ReDE:一个基于正则表达式的生物数据抽取方法
邓绪斌
朱扬勇
《计算机研究与发展》
EI
CSCD
北大核心
2005
8
在线阅读
下载PDF
职称材料
3
基于单元识别的网页信息抽取方法
柳永念
钟诚
焦小焦
《广西大学学报(自然科学版)》
CAS
CSCD
北大核心
2011
1
在线阅读
下载PDF
职称材料
4
基于C#正则表达式的农业文献管理系统的研究与应用
杨波
张立娜
《安徽农业科学》
CAS
2012
1
在线阅读
下载PDF
职称材料
5
基于HTML解析器的Web信息提取技术
王琳琳
《郑州轻工业学院学报(自然科学版)》
CAS
2008
1
在线阅读
下载PDF
职称材料
6
基于多种规则的课程元数据自动抽取
杨宇
张铭
周宝曜
《计算机科学》
CSCD
北大核心
2008
7
在线阅读
下载PDF
职称材料
7
基于GRETA正则表达式的机器人解释器的研究
何嘉健
李伟光
《组合机床与自动化加工技术》
北大核心
2012
7
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部