期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于N层向量空间模型的信息检索算法 被引量:17
1
作者 陈治平 林亚平 童调生 《计算机研究与发展》 EI CSCD 北大核心 2002年第10期1233-1237,共5页
N层向量空间模型是在传统向量空间模型的基础上提出的一种新的信息检索算法模型 ,这种模型将一篇文档从逻辑上划分为 N个相对独立的文本段 ,然后按照文本段的内容建立文本特征向量以及文本权值向量 .在此模型的基础上 ,更为精确地定义... N层向量空间模型是在传统向量空间模型的基础上提出的一种新的信息检索算法模型 ,这种模型将一篇文档从逻辑上划分为 N个相对独立的文本段 ,然后按照文本段的内容建立文本特征向量以及文本权值向量 .在此模型的基础上 ,更为精确地定义了特征值向量和相似度的计算方法 ,使之能比较好地适应文档集合的动态扩充 .理论分析和实验结果表明 。 展开更多
关键词 N层向量空间模型 信息检索算法 搜索引擎 查准率 查全率 信息资源 WWW
在线阅读 下载PDF
结合同义词的Web搜索匹配算法初探 被引量:2
2
作者 潘景昌 许中卫 《安徽大学学报(自然科学版)》 CAS 2003年第3期26-29,共4页
对结合同义词的中文全文信息检索算法进行了探讨,在已有的基于字串匹配算法的基础上,加入了同义词数据库的搜索,使得搜索更加全面和合理,更加符合人们的思维方式。本文对语义判定模块在搜索引擎机构中的定位及语义字典的构造进行了讨论... 对结合同义词的中文全文信息检索算法进行了探讨,在已有的基于字串匹配算法的基础上,加入了同义词数据库的搜索,使得搜索更加全面和合理,更加符合人们的思维方式。本文对语义判定模块在搜索引擎机构中的定位及语义字典的构造进行了讨论,同时给出了具有语义匹配的中文全文信息搜索的流程。 展开更多
关键词 中文全文信息检索算法 Web搜索匹配算法 字串匹配算法 同义词数据库 语义判定模块 搜索引擎 语义匹配
在线阅读 下载PDF
基于内容的图象检索系统的设计与实现 被引量:3
3
作者 程敏 叶秀清 《计算机工程与科学》 CSCD 2004年第1期51-54,共4页
依据当前对图象查询的要求,本文设计了一套完整的基于内容的图象信息检索系统,该系统较以往的各种系统,功能更加全面。对基于内容的图象信息检索算法作了研究。重点阐述了对颜色、边缘、纹理等全局特征的提取与匹配算法。实验结果表明,... 依据当前对图象查询的要求,本文设计了一套完整的基于内容的图象信息检索系统,该系统较以往的各种系统,功能更加全面。对基于内容的图象信息检索算法作了研究。重点阐述了对颜色、边缘、纹理等全局特征的提取与匹配算法。实验结果表明,该系统能有效、快速地检索大规模的图象数据库,具有一定的应用价值。 展开更多
关键词 图象检索系统 设计 多媒体 数据库系统 图象数据库 图象处理 图象查询 图象信息检索算法
在线阅读 下载PDF
基于LS-SO算法的情感文本分类方法 被引量:9
4
作者 姚艳秋 郑雅雯 吕妍欣 《吉林大学学报(理学版)》 CAS 北大核心 2019年第2期375-379,共5页
首先,基于点互信息与信息检索(PMI-IR)算法,提出一种Laplace平滑情感判定(LS-SO)算法,对情感词典与表情符号情感词典进行自动扩充,得到了具有一定规模、高质量的情感词典,包括基础情感词典、目标情感词典、网络用语情感词典、表情符号... 首先,基于点互信息与信息检索(PMI-IR)算法,提出一种Laplace平滑情感判定(LS-SO)算法,对情感词典与表情符号情感词典进行自动扩充,得到了具有一定规模、高质量的情感词典,包括基础情感词典、目标情感词典、网络用语情感词典、表情符号情感词典、否定词词典、疑问词词典、程度副词词典和连词词典.其次,通过细化文本语义分析规则计算文本情感值.实验结果验证了该方法的有效性. 展开更多
关键词 情感文本分类 情感词典 点互信息信息检索(PMI-IR)算法 Laplace平滑情感判定(LS-SO)算法
在线阅读 下载PDF
《华南理工大学学报(自然科学版)》第32卷总目次2004年
5
《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第12期Z001-Z018,共18页
关键词 自然科学版 华南理工大学学报 PING 英文 复合材料 信息检索算法 王明文 目次
在线阅读 下载PDF
Relevance-based content extraction of HTML documents
6
作者 吴麒 陈兴蜀 +1 位作者 朱锴 王春晖 《Journal of Central South University》 SCIE EI CAS 2012年第7期1921-1926,共6页
Content extraction of HTML pages is the basis of the web page clustering and information retrieval,so it is necessary to eliminate cluttered information and very important to extract content of pages accurately.A nove... Content extraction of HTML pages is the basis of the web page clustering and information retrieval,so it is necessary to eliminate cluttered information and very important to extract content of pages accurately.A novel and accurate solution for extracting content of HTML pages was proposed.First of all,the HTML page is parsed into DOM object and the IDs of all leaf nodes are generated.Secondly,the score of each leaf node is calculated and the score is adjusted according to the relationship with neighbors.Finally,the information blocks are found according to the definition,and a universal classification algorithm is used to identify the content blocks.The experimental results show that the algorithm can extract content effectively and accurately,and the recall rate and precision are 96.5% and 93.8%,respectively. 展开更多
关键词 content extraction DOM NODE RELEVANCE information block
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部