检索结果-维普期刊中文期刊服务平台

最大化独立有效分类信息率的属性选择: 1; 作者柳叶代建华陈姣龙《计算机科学与探索》 CSCD 北大核心 2022年第11期2619-2627,共9页; 粗糙集中的属性选择有着十分重要的应用价值。现有的属性选择方法大多忽视了衡量待选属性所提供的分类信息和冗余信息,以及新增待选属性时已选属性所保留的分类信息三者之间的关联。因此,首先利用传统互信息,定义了有效分类信息率的属... 展开更多; 关键词粗糙集理论属性选择独立有效分类信息率互信息; 在线阅读下载PDF 职称材料

基于图文有效信息量的网页正文定位被引量：2: 2; 作者梁正友欧杰俞闽敏《计算机工程》 CAS CSCD 北大核心 2011年第23期276-278,共3页; 在现有的网页抽取技术中,正文定位方法仅考虑网页文本信息,当正文图片信息较多、文本信息偏少时,容易出现偏差,且定位准确率较低。针对该问题,从信息论角度出发,结合网页中的文本信息图片信息,设计一种对网页中图片信息量和有效信息量... 展开更多; 关键词正文定位最小正文子树有效信息率网页图文; 在线阅读下载PDF 职称材料

基于网页格式信息量的博客文章和评论抽取模型被引量：15: 3; 作者曹冬林廖祥文 +1 位作者许洪波白硕《软件学报》 EI CSCD 北大核心 2009年第5期1282-1291,共10页; 从信息论的角度出发,提出了一个基于网页格式信息量的博客文章和评论抽取模型.首先,结合网页视觉上的位置信息和文本的有效信息来定位网页正文.其次,利用博客网页中的格式信息作为信息单元并计算每个信息块所包含的格式信息量,通过计算... 展开更多; 关键词博客信息抽取最小正文子树有效信息率网页格式信息视觉信息切分位置信息量; 在线阅读下载PDF 职称材料