检索结果-维普期刊中文期刊服务平台

基于正则表达式的专利信息提取方法研究被引量：15: 1; 作者邱清盈郑国民 +1 位作者冯培恩武建伟《中国机械工程》 EI CAS CSCD 北大核心 2007年第19期2326-2329,共4页; 针对图像格式专利文献难以进行全文检索和深入分析利用的问题,根据专利文献的结构特点,通过集成光学字符识别工具和建立具有容错性的专利信息提取正则表达式,提出了专利文献的数字化和信息提取方法。开发了相应的软件系统,实现了专利信... 展开更多; 关键词专利分析信息提取正则表达式设计知识; 在线阅读下载PDF 职称材料

ReDE:一个基于正则表达式的生物数据抽取方法被引量：8: 2; 作者邓绪斌朱扬勇《计算机研究与发展》 EI CSCD 北大核心 2005年第12期2184-2191,共8页; 从异构生物数据源抽取数据,建立查询分析平台是目前研究的热点,而抽取过程会涉及大量相互依赖的元数据,充分利用这种依赖关系可降低维护工作量·基于正则表达式(RE)提出了ReDE抽取方法:通过围绕RE组建立分析树,设计了基于RE的关系... 展开更多; 关键词生物数据源数据抽取元数据正则表达式抽取算法; 在线阅读下载PDF 职称材料

基于单元识别的网页信息抽取方法被引量：1: 3; 作者柳永念钟诚焦小焦《广西大学学报（自然科学版）》 CAS CSCD 北大核心 2011年第5期787-791,共5页; 建立基于链的父亲结构树描述和存储网页信息,采用Htmlparse和基于正则表达式的描述方法,设计、实现了一种高效的基于单元识别的网页信息抽取算法。分析与实验结果表明,文中给出的网页信息抽取方法能提高检索的查准率和查全率。; 关键词单元识别信息抽取父亲结构树 HTMLPARSER 正则表达式; 在线阅读下载PDF 职称材料

基于C#正则表达式的农业文献管理系统的研究与应用被引量：1: 4; 作者杨波张立娜《安徽农业科学》 CAS 2012年第5期2988-2990,共3页; 利用PDFBOX和正则表达式批量提取已下载到本地的PDF格式农业文献的元数据,建立农业文献信息关系型数据库,根据需要建立农业文献管理系统,提高农业文献利用效率和科研效率。在C#环境下,对PDFBOX进行封装,利用数据流的写入功能将PDF格式... 展开更多; 关键词 PDF PDFBOX 正则表达式元数据提取; 在线阅读下载PDF 职称材料

基于HTML解析器的Web信息提取技术被引量：1: 5; 作者王琳琳《郑州轻工业学院学报（自然科学版）》 CAS 2008年第6期100-102,106,共4页; 提出一种使用开源的HTML解析器包和正则表达式来提取W eb网页信息的方法.该方法能够解析HTML文件的组成结构,并从中提取主体文本以供处理.实验表明,该方法的抽取准确率可达到95%以上,具有简单、准确的特点.; 关键词 WEB信息提取正则表达式 HTML解析器主题信息; 在线阅读下载PDF 职称材料

基于多种规则的课程元数据自动抽取被引量：7: 6; 作者杨宇张铭周宝曜《计算机科学》 CSCD 北大核心 2008年第3期94-96,共3页; 在线课程组织和管理系统就是为了使学习更加便利而提供的一个教育资源的集成平台。作为系统中重要环节的元数据抽取模块,需要对半结构化网页能够达到较好的抽取精确性,并具有处理结构松散文档的能力。本文设计并实现了一种按照指定规则... 展开更多; 关键词元数据抽取正则表达式信息精化; 在线阅读下载PDF 职称材料

基于GRETA正则表达式的机器人解释器的研究被引量：7: 7; 作者何嘉健李伟光《组合机床与自动化加工技术》北大核心 2012年第1期17-19,24,共4页; 为了解决传统解释器编译过程复杂,效率低的问题,提出了一种基于GRETA正则表达式的工业机器人解释器的实现方法。利用GRETA正则表达式建立字符匹配表和语法规则后,该解释器即可方便地对指令代码进行解释处理,包括:词法分析、语法分析、... 展开更多; 关键词解释器 GRETA正则表达式词法分析语法分析语义分析信息提取; 在线阅读下载PDF 职称材料

题名基于正则表达式的专利信息提取方法研究被引量：15: 1; 作者邱清盈郑国民冯培恩武建伟; 机构浙江大学CAD&CG国家重点实验室; 出处《中国机械工程》 EI CAS CSCD 北大核心 2007年第19期2326-2329,共4页; 基金国家自然科学基金资助项目(50675197 50335040) 浙江省重大科技攻关项目(2004C11015); 文摘针对图像格式专利文献难以进行全文检索和深入分析利用的问题,根据专利文献的结构特点,通过集成光学字符识别工具和建立具有容错性的专利信息提取正则表达式,提出了专利文献的数字化和信息提取方法。开发了相应的软件系统,实现了专利信息的批量提取,为后续高效率地对专利文献进行自动分析和知识挖掘提供了数据基础。; 关键词专利分析信息提取正则表达式设计知识; Keywords patent analysis information extraction regular expression design knowledge; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名ReDE:一个基于正则表达式的生物数据抽取方法被引量：8: 2; 作者邓绪斌朱扬勇; 机构浙江财经学院信息学院复旦大学计算机与信息技术系; 出处《计算机研究与发展》 EI CSCD 北大核心 2005年第12期2184-2191,共8页; 基金国家"八六三"高技术研究发展计划基金项目(2002AA231011) 上海市重大科技基金项目(02DJ14013); 文摘从异构生物数据源抽取数据,建立查询分析平台是目前研究的热点,而抽取过程会涉及大量相互依赖的元数据,充分利用这种依赖关系可降低维护工作量·基于正则表达式(RE)提出了ReDE抽取方法:通过围绕RE组建立分析树,设计了基于RE的关系数据库模式生成算法和通用抽取与组装算法,其特点是:RE是惟一的元数据,易于管理和维护·该方法奠定了生物数据库辅助设计工具和高自动化抽取工具的基础,已用于构建国内第1个整合的生物信息在线数据仓库·; 关键词生物数据源数据抽取元数据正则表达式抽取算法; Keywords biological data source data extraction metadata regular expression extraction algorithm; 分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名基于单元识别的网页信息抽取方法被引量：1: 3; 作者柳永念钟诚焦小焦; 机构广西大学计算机与电子信息学院; 出处《广西大学学报（自然科学版）》 CAS CSCD 北大核心 2011年第5期787-791,共5页; 基金广西科学研究与技术开发计划(桂科能1140008-3B) 广西高校优秀人才资助计划(RC2007004) 广西教育厅科研基金(200708LX360); 文摘建立基于链的父亲结构树描述和存储网页信息,采用Htmlparse和基于正则表达式的描述方法,设计、实现了一种高效的基于单元识别的网页信息抽取算法。分析与实验结果表明,文中给出的网页信息抽取方法能提高检索的查准率和查全率。; 关键词单元识别信息抽取父亲结构树 HTMLPARSER 正则表达式; Keywords unit identification information extraction father structure tree Htmlparser regular expressions; 分类号 TP391.1 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于C#正则表达式的农业文献管理系统的研究与应用被引量：1: 4; 作者杨波张立娜; 机构吉林财经大学信息经济学院吉林农业大学; 出处《安徽农业科学》 CAS 2012年第5期2988-2990,共3页; 文摘利用PDFBOX和正则表达式批量提取已下载到本地的PDF格式农业文献的元数据,建立农业文献信息关系型数据库,根据需要建立农业文献管理系统,提高农业文献利用效率和科研效率。在C#环境下,对PDFBOX进行封装,利用数据流的写入功能将PDF格式的农业文献的二进制内容以简体中文输出,再利用正则表达式设计规则模型批量提取相关元数据。; 关键词 PDF PDFBOX 正则表达式元数据提取; Keywords PDF PDFBOX regular expression metadata extraction; 分类号 S126 [农业科学—农业基础科学]; 在线阅读下载PDF 职称材料

题名基于HTML解析器的Web信息提取技术被引量：1: 5; 作者王琳琳; 机构枣庄学院计算机科学系; 出处《郑州轻工业学院学报（自然科学版）》 CAS 2008年第6期100-102,106,共4页; 文摘提出一种使用开源的HTML解析器包和正则表达式来提取W eb网页信息的方法.该方法能够解析HTML文件的组成结构,并从中提取主体文本以供处理.实验表明,该方法的抽取准确率可达到95%以上,具有简单、准确的特点.; 关键词 WEB信息提取正则表达式 HTML解析器主题信息; Keywords Web information extraction regular expression HTML Parser package topic information; 分类号 TP391.1 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于多种规则的课程元数据自动抽取被引量：7: 6; 作者杨宇张铭周宝曜; 机构北京大学信息科学技术学院计算机科学与技术系惠普中国实验室; 出处《计算机科学》 CSCD 北大核心 2008年第3期94-96,共3页; 基金国家自然科学基金“网络计算环境综合试验平台”(编号90412010) 惠普大学合作基金“在线课程的组织与管理”项目 +1 种基金广东省网络重点实验室基金的支持; 文摘在线课程组织和管理系统就是为了使学习更加便利而提供的一个教育资源的集成平台。作为系统中重要环节的元数据抽取模块,需要对半结构化网页能够达到较好的抽取精确性,并具有处理结构松散文档的能力。本文设计并实现了一种按照指定规则自动抽取的元数据方法。该方法能够按照多优先级规则匹配网页元数据,并按照两步抽取的方法进行精细化处理。针对不同的问题域使用不同规则抽取,不需对程序进行特定修改。实验证明,这种方法能够很好地处理半结构化网页,F测度达到85%以上,具有较好的实用价值。; 关键词元数据抽取正则表达式信息精化; Keywords metadata extraction, regular expression, information refinement; 分类号 TP391.2 [自动化与计算机技术—计算机应用技术] G423 [文化科学—课程与教学论]; 在线阅读下载PDF 职称材料

题名基于GRETA正则表达式的机器人解释器的研究被引量：7: 7; 作者何嘉健李伟光; 机构华南理工大学机械与汽车工程学院; 出处《组合机床与自动化加工技术》北大核心 2012年第1期17-19,24,共4页; 文摘为了解决传统解释器编译过程复杂,效率低的问题,提出了一种基于GRETA正则表达式的工业机器人解释器的实现方法。利用GRETA正则表达式建立字符匹配表和语法规则后,该解释器即可方便地对指令代码进行解释处理,包括:词法分析、语法分析、语义分析和信息提取。实验表明,该解释器可实现对机器人指令集的正确解释和信息提取,并为机器人控制的开放性和高效性奠定基础。; 关键词解释器 GRETA正则表达式词法分析语法分析语义分析信息提取; Keywords interpreter GRETA regular expression lexical analysis syntax analysis semantic analysis information extraction; 分类号 TH122 [机械工程—机械设计及理论] TP242 [自动化与计算机技术—检测技术与自动化装置]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于正则表达式的专利信息提取方法研究	邱清盈郑国民冯培恩武建伟	《中国机械工程》 EI CAS CSCD 北大核心	2007	15	在线阅读下载PDF 职称材料
2	ReDE:一个基于正则表达式的生物数据抽取方法	邓绪斌朱扬勇	《计算机研究与发展》 EI CSCD 北大核心	2005	8	在线阅读下载PDF 职称材料
3	基于单元识别的网页信息抽取方法	柳永念钟诚焦小焦	《广西大学学报（自然科学版）》 CAS CSCD 北大核心	2011	1	在线阅读下载PDF 职称材料
4	基于C#正则表达式的农业文献管理系统的研究与应用	杨波张立娜	《安徽农业科学》 CAS	2012	1	在线阅读下载PDF 职称材料
5	基于HTML解析器的Web信息提取技术	王琳琳	《郑州轻工业学院学报（自然科学版）》 CAS	2008	1	在线阅读下载PDF 职称材料
6	基于多种规则的课程元数据自动抽取	杨宇张铭周宝曜	《计算机科学》 CSCD 北大核心	2008	7	在线阅读下载PDF 职称材料
7	基于GRETA正则表达式的机器人解释器的研究	何嘉健李伟光	《组合机床与自动化加工技术》北大核心	2012	7	在线阅读下载PDF 职称材料