检索结果-维普期刊中文期刊服务平台

基于支持向量机的中文文本自动分类研究被引量：25: 1; 作者都云琪肖诗斌《计算机工程》 CAS CSCD 北大核心 2002年第11期137-138,F003,共3页; 根据文本数据学习的特点，采用线性支持向量机（LSVM）学习算法，实现了一个中文文本自动分类系统，并对该系统进行了针对大规模真实文本的试验测试。结果发现，系统的招回率较低，而准确率较高，该文对此结果进行了分析，并提出了一种... 展开更多; 关键词支持向量机中文文本自动分类招回率准确率学习算法中文信息处理; 在线阅读下载PDF 职称材料

办公信息例程网模型及其集成: 2; 作者孙莺苏东庄吴忠明《计算机学报》 EI CSCD 北大核心 1991年第5期340-351,共12页; 本文提出了一种新型的信息例程网模型(IP-Net)的元素符号定义及数学描述.并从分析中得出IP-Net集成是高效益的结论.从而进一步讨论了集成IP-Net模型,给出了各个办公例程之间同步需求的总体表示.实现了集成算法与优化算法,结果是成功的.; 关键词办公自动化信息例程网集成模型; 在线阅读下载PDF 职称材料

跨语言相似文档检索被引量：4: 3; 作者王洪俊施水才 +1 位作者俞士汶肖诗斌《中文信息学报》 CSCD 北大核心 2007年第1期30-37,共8页; 检索一篇文档在其他语言中的译文对于双语平行语料库的建立是一件很有意义的工作。本文提出一种改进的跨语言相似文档检索算法,该算法使用双语词典或统计翻译模型作为双语知识库,查找两篇文档的共同翻译词对,把翻译词对的权重作为一种... 展开更多; 关键词计算机应用中文信息处理跨语言相似文档检索文档相似度双语文档对齐; 在线阅读下载PDF 职称材料

词义演化的计算方法被引量：4: 4; 作者王洪俊施水才 +1 位作者俞士汶吕学强《广西师范大学学报（自然科学版）》 CAS 北大核心 2006年第4期183-186,共4页; 从大规模真实文本中挖掘词义关系是自然语言学习的一项艰巨任务。词义不是静态、一成不变的,随着时代的发展,词义也在不断变迁。如何从错综复杂的词义变迁中,挖掘词义演化的基本规律,准确发现词义的各种变化,并给出量化的分析和建立数... 展开更多; 关键词词义演化词义计算动态语料库; 在线阅读下载PDF 职称材料

一种结合超链接分析的搜索引擎排序方法被引量：10: 5; 作者吴明礼施水才《计算机工程》 CAS CSCD 北大核心 2004年第15期143-145,共3页; 为了提高搜索引擎的检索性能,文章设计了一种搜索引擎的综合排序方法。它采用改进的布尔检索模式、中文分词、超链接分析以及索引链接文本等技术,主要具有以下特点:对经典布尔型检索模式所作的改进使得文档相关度不再是严格的0或1;超链... 展开更多; 关键词搜索引擎排序布尔模式链接分析; 在线阅读下载PDF 职称材料

一种基于Native XML的全文检索引擎被引量：6: 6; 作者王弘蔚肖诗斌《情报学报》 CSSCI 北大核心 2003年第5期550-556,共7页; 随着XML的日益流行,基于XML的全文检索应用需求也迅速扩大.在这些应用中,native-XML数据库是发展方向.虽然商业化的native-XML数据库已经出现,但其全文检索的性能还不尽人意.本文提出一种方法:在传统的倒排索引的框架下,对XML的标记建... 展开更多; 关键词 NATIVE-XML数据库全文检索倒排索引全文数据库检索引擎; 在线阅读下载PDF 职称材料

题名基于支持向量机的中文文本自动分类研究被引量：25: 1; 作者都云琪肖诗斌; 机构西安电子科技大学计算机学院北京信息工程学院中文信息处理研究中心; 出处《计算机工程》 CAS CSCD 北大核心 2002年第11期137-138,F003,共3页; 文摘根据文本数据学习的特点，采用线性支持向量机（LSVM）学习算法，实现了一个中文文本自动分类系统，并对该系统进行了针对大规模真实文本的试验测试。结果发现，系统的招回率较低，而准确率较高，该文对此结果进行了分析，并提出了一种采用训练中拒识样本信息对分类器输出进行改进的方法，试验表明，该方法有效地提高了系统的性能，取得了令人满意的结果。; 关键词支持向量机中文文本自动分类招回率准确率学习算法中文信息处理; Keywords Text categorizaiton；Linear support vector machine(LSVM)；Recall；Precision; 分类号 TP391.12 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名办公信息例程网模型及其集成: 2; 作者孙莺苏东庄吴忠明; 机构北京信息工程学院中文信息处理研究中心; 出处《计算机学报》 EI CSCD 北大核心 1991年第5期340-351,共12页; 文摘本文提出了一种新型的信息例程网模型(IP-Net)的元素符号定义及数学描述.并从分析中得出IP-Net集成是高效益的结论.从而进一步讨论了集成IP-Net模型,给出了各个办公例程之间同步需求的总体表示.实现了集成算法与优化算法,结果是成功的.; 关键词办公自动化信息例程网集成模型; Keywords Model, procedure, integration office automation.; 分类号 TP29 [自动化与计算机技术—检测技术与自动化装置]; 在线阅读下载PDF 职称材料

题名跨语言相似文档检索被引量：4: 3; 作者王洪俊施水才俞士汶肖诗斌; 机构北京大学计算语言研究所北京信息工程学院中文信息处理研究中心; 出处《中文信息学报》 CSCD 北大核心 2007年第1期30-37,共8页; 基金国家973项目(2004CB318102) 863项目(2001AA114210 +3 种基金 2002AA117010) 北京市教委重大项目(KZ200310772013); 文摘检索一篇文档在其他语言中的译文对于双语平行语料库的建立是一件很有意义的工作。本文提出一种改进的跨语言相似文档检索算法,该算法使用双语词典或统计翻译模型作为双语知识库,查找两篇文档的共同翻译词对,把翻译词对的权重作为一种特征来进行相似度计算,用Dice方法的改进算法计算双语文档的相似度。在实验中,统计检索文档的译文排在检索结果前N位的总次数来评价算法的性能,并使用了两个噪音数据集来评价算法的有效性。实验表明,在噪音数据干扰比较大的情况下,译文排在检索结果前5位的译文结果接近90%。实验证明,翻译词对的权重对于相似度计算有很大帮助,本算法可以有效地发现一种语言书写的文档在另一种语言中的译稿。; 关键词计算机应用中文信息处理跨语言相似文档检索文档相似度双语文档对齐; Keywords computer application Chinese information processing crossqanguage similar document retrieval document similarity bilingual document alignment; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名词义演化的计算方法被引量：4: 4; 作者王洪俊施水才俞士汶吕学强; 机构北京大学计算语言学研究所北京信息工程学院中文信息处理研究中心北京信息工程学院中文信息处理研究中心; 出处《广西师范大学学报（自然科学版）》 CAS 北大核心 2006年第4期183-186,共4页; 基金国家"973"计划基金资助项目(2004CB318102) "863"计划基金资助项目(2001AA114210 +4 种基金 2002AA117010) KM200610772008); 文摘从大规模真实文本中挖掘词义关系是自然语言学习的一项艰巨任务。词义不是静态、一成不变的,随着时代的发展,词义也在不断变迁。如何从错综复杂的词义变迁中,挖掘词义演化的基本规律,准确发现词义的各种变化,并给出量化的分析和建立数学模型,是一个急待解决的问题。根据词语的上下文搭配词分布情况来定义该词的词义,提出一种基于动态语料库的词义演化计算方法统计词义在23年《人民日报》中的分布信息,计算词义在各个时段的变化值,构造词义的演化曲线,并提出一种基于X2分析的方法来挖掘词语的搭配词与时间之间的相关关系。; 关键词词义演化词义计算动态语料库; Keywords word sense evolution word sense computation monitor corpus; 分类号 TP391.1 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名一种结合超链接分析的搜索引擎排序方法被引量：10: 5; 作者吴明礼施水才; 机构北京信息工程学院中文信息处理研究中心; 出处《计算机工程》 CAS CSCD 北大核心 2004年第15期143-145,共3页; 文摘为了提高搜索引擎的检索性能,文章设计了一种搜索引擎的综合排序方法。它采用改进的布尔检索模式、中文分词、超链接分析以及索引链接文本等技术,主要具有以下特点:对经典布尔型检索模式所作的改进使得文档相关度不再是严格的0或1;超链接分析通过互联网的链接结构计算出每个网络文档的质量;通过中文分词和索引链接文本可以更加准确地获得一个网络文档的信息内涵。将3者结合可以充分利用各自优势而弥补不足。; 关键词搜索引擎排序布尔模式链接分析; Keywords Search engine Ranking Boolean model Link analysis; 分类号 TP182 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名一种基于Native XML的全文检索引擎被引量：6: 6; 作者王弘蔚肖诗斌; 机构北京信息工程学院中文信息处理研究中心; 出处《情报学报》 CSSCI 北大核心 2003年第5期550-556,共7页; 文摘随着XML的日益流行,基于XML的全文检索应用需求也迅速扩大.在这些应用中,native-XML数据库是发展方向.虽然商业化的native-XML数据库已经出现,但其全文检索的性能还不尽人意.本文提出一种方法:在传统的倒排索引的框架下,对XML的标记建立索引,使得一个全文数据库能够以Native的方式存储、索引、检索和输出XML文档,成为一个真正意义上的native-XML全文数据库,既有传统全文数据库的优越性能,又能满足基于native-XML的应用需求.; 关键词 NATIVE-XML数据库全文检索倒排索引全文数据库检索引擎; 分类号 G354.45 [文化科学—情报学] TP311.13 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于支持向量机的中文文本自动分类研究	都云琪肖诗斌	《计算机工程》 CAS CSCD 北大核心	2002	25	在线阅读下载PDF 职称材料
2	办公信息例程网模型及其集成	孙莺苏东庄吴忠明	《计算机学报》 EI CSCD 北大核心	1991	0	在线阅读下载PDF 职称材料
3	跨语言相似文档检索	王洪俊施水才俞士汶肖诗斌	《中文信息学报》 CSCD 北大核心	2007	4	在线阅读下载PDF 职称材料
4	词义演化的计算方法	王洪俊施水才俞士汶吕学强	《广西师范大学学报（自然科学版）》 CAS 北大核心	2006	4	在线阅读下载PDF 职称材料
5	一种结合超链接分析的搜索引擎排序方法	吴明礼施水才	《计算机工程》 CAS CSCD 北大核心	2004	10	在线阅读下载PDF 职称材料
6	一种基于Native XML的全文检索引擎	王弘蔚肖诗斌	《情报学报》 CSSCI 北大核心	2003	6	在线阅读下载PDF 职称材料