期刊文献+
共找到54篇文章
< 1 2 3 >
每页显示 20 50 100
基于情感特征向量空间模型的中文商品评论倾向分类算法 被引量:2
1
作者 董祥和 《计算机应用与软件》 CSCD 2016年第8期319-322,328,共5页
为了能够快速有效地将中文商品评论识别为好评或差评,提出一种算法。针对不同类别的商品,预先根据其评论语料构建领域情感词典,评论文本与情感词典集匹配提取情感特征,构建情感特征向量空间模型SF-VSM(Sentiment Feature Vector Space M... 为了能够快速有效地将中文商品评论识别为好评或差评,提出一种算法。针对不同类别的商品,预先根据其评论语料构建领域情感词典,评论文本与情感词典集匹配提取情感特征,构建情感特征向量空间模型SF-VSM(Sentiment Feature Vector Space Model),解决传统的特征向量空间模型维数较高及特征选择误差问题。然后基于该模型结合改进的多项式朴素贝叶斯方法对评论进行情感倾向分类。实验结果表明,相比分别基于原始特征和基于χ2特征选取的朴素贝叶斯分类算法,该算法分类精度较高且分类速度快。 展开更多
关键词 中文商品评论 情感倾向 情感词典 情感特征向量空间模型 朴素贝叶斯分类
在线阅读 下载PDF
基于向量空间模型的文本过滤系统 被引量:92
2
作者 黄萱菁 夏迎炬 吴立德 《软件学报》 EI CSCD 北大核心 2003年第3期435-442,共8页
文本过滤是指从大量的文本数据流中寻找满足特定用户需求的文本的过程.首先从任务、测试主题、语料库和评测指标等方面介绍了文本检索领域最权威的国际评测会议——文本检索会议(TREC)及其中的文本过滤项目,然后详细地描述了基于向量空... 文本过滤是指从大量的文本数据流中寻找满足特定用户需求的文本的过程.首先从任务、测试主题、语料库和评测指标等方面介绍了文本检索领域最权威的国际评测会议——文本检索会议(TREC)及其中的文本过滤项目,然后详细地描述了基于向量空间模型的文本过滤系统.该系统由训练和自适应过滤两个阶段组成.在训练阶段,通过特征抽取和伪反馈建立初始的过滤模板,并设置初始阈值;在过滤阶段,则根据用户的反馈信息自适应地调整模板和阈值.该系统参加了2000年举行的第9次文本检索会议的评测,取得了很好的成绩,在来自多个国家的15个系统中名列前茅,其中自适应过滤和批过滤的平均准确率分别为26.5%和31.7%. 展开更多
关键词 向量空间模型 文本过滤系统 机器学习 文本分类
在线阅读 下载PDF
基于向量空间模型的专题文献过滤算法研究 被引量:3
3
作者 焦玉英 刘伟成 孙吉红 《情报学报》 CSSCI 北大核心 2005年第5期562-566,共5页
本文从理论上探讨了向量空间模型及其改进模型在专题文献过滤中的相关算法.概念扩充模型解决了词的同义现象,提高了召回率;潜在语义分析模型通过统计方法,提取并量化这些潜在的语义结构,进而消除同义词、多义词的影响,提高文本表示的准... 本文从理论上探讨了向量空间模型及其改进模型在专题文献过滤中的相关算法.概念扩充模型解决了词的同义现象,提高了召回率;潜在语义分析模型通过统计方法,提取并量化这些潜在的语义结构,进而消除同义词、多义词的影响,提高文本表示的准确性,从而使专题研究中文献过滤的召回率和准确率都有显著提高. 展开更多
关键词 向量空间模型 专题文献 过滤算法 潜语义 文献检索
在线阅读 下载PDF
基于向量空间模型的实时内容过滤 被引量:2
4
作者 何静 刘海燕 《计算机工程》 CAS CSCD 北大核心 2004年第15期26-27,85,共3页
内容过滤是网络安全领域的一个新课题,目前对内容过滤技术的研究集中于对关键词的检查和分析,过滤精度较低。该文建立了一个基于向量空间模型的内容过滤模型,它提高了过滤精度,并且能在过滤精度与实时性之间较好地达成平衡。
关键词 网络安全 内容过滤 向量空间模型 过滤模板 分词算法
在线阅读 下载PDF
一个基于向量空间模型的OUTLOOK垃圾邮件过滤器
5
作者 陈亮 刘宗田 《计算机应用与软件》 CSCD 北大核心 2005年第12期7-9,共3页
邮件过滤是指从大量的邮件中过滤掉含有无用信息的垃圾邮件,以帮助用户得到所需的有用邮件。本文将介绍一个基于向量空间模型的OUTLOOK邮件过滤器的设计与实现,它包含了邮件过滤和训练两个子系统,其过滤方法还对传统的向量空间模型法做... 邮件过滤是指从大量的邮件中过滤掉含有无用信息的垃圾邮件,以帮助用户得到所需的有用邮件。本文将介绍一个基于向量空间模型的OUTLOOK邮件过滤器的设计与实现,它包含了邮件过滤和训练两个子系统,其过滤方法还对传统的向量空间模型法做了改进,使之更适合于垃圾邮件过滤。 展开更多
关键词 电子邮件 邮件过滤 向量空间模型 垃圾邮件
在线阅读 下载PDF
基于向量空间模型的信息安全过滤系统 被引量:15
6
作者 曹毅 贺卫红 《计算机工程与设计》 CSCD 北大核心 2006年第2期224-227,共4页
信息过滤是指通过监控信息源以找到满足用户需求的信息的过程。详细地论述了基于向量空间模型的信息过滤系统,系统由训练和自适应过滤两个阶段组成,在训练阶段,通过主题处理和特征抽取建立初始的过滤模板,设置初始阈值;在过滤阶段,则根... 信息过滤是指通过监控信息源以找到满足用户需求的信息的过程。详细地论述了基于向量空间模型的信息过滤系统,系统由训练和自适应过滤两个阶段组成,在训练阶段,通过主题处理和特征抽取建立初始的过滤模板,设置初始阈值;在过滤阶段,则根据用户的反馈信息自适应地调整模板和阈值,最后给出了评估方法和实验结果。 展开更多
关键词 信息处理 信息过滤 信息安全 文本分类 向量空间模型
在线阅读 下载PDF
基于向量空间模型的Web中文信息过滤系统 被引量:6
7
作者 胡恬 夏迎炬 +1 位作者 黄萱菁 吴立德 《计算机工程》 CAS CSCD 北大核心 2003年第z1期25-26,39,共3页
提出了一种基于VSM的自适应的Web信息过滤系统的设计及实现方法.与传统的信息过滤系统相比,Web上的信息过滤系统具有许多全新的特征.页面为半结构化的文档、页面上的噪声信息比较多,用户提交的正例比较少.这些特性成为影响过滤性能的主... 提出了一种基于VSM的自适应的Web信息过滤系统的设计及实现方法.与传统的信息过滤系统相比,Web上的信息过滤系统具有许多全新的特征.页面为半结构化的文档、页面上的噪声信息比较多,用户提交的正例比较少.这些特性成为影响过滤性能的主要因素.针对Web的上述特性设计的Fudanfilter2002过滤系统,具有使用方便、过滤时间短、精度高等特点. 展开更多
关键词 信息过滤 向量空间模型 自适应
在线阅读 下载PDF
知识溢出与区域经济增长中存在“制度过滤”吗?——基于空间面板杜宾模型的实证分析 被引量:4
8
作者 戴一鑫 郑玉 姜青克 《现代经济探讨》 CSSCI 北大核心 2018年第11期15-23,共9页
该文采用空间面板杜宾模型从本地和空间两个维度实证检验了知识效应对区域增长的影响,结果表明:制度环境对经济增长具有一定程度的促进作用,但其作用更多体现为对本地知识效应和空间知识溢出的中介作用;虽然本地知识的增长效应大于空... 该文采用空间面板杜宾模型从本地和空间两个维度实证检验了知识效应对区域增长的影响,结果表明:制度环境对经济增长具有一定程度的促进作用,但其作用更多体现为对本地知识效应和空间知识溢出的中介作用;虽然本地知识的增长效应大于空间知识溢出的增长效应,但制度过滤影响空间知识溢出效应的边际损失度反而小于本地知识;而且制度环境对知识增长效应的过滤作用按照东、中、西部的顺序依次增强.研究结论强调了制度建设的重要作用,尤其是通过R&D投入和R&D基础设施来促进经济增长仍然需要以制度完善为前提.因此,各地在扩大本地“知识池”和改善知识质量的同时,落后地区应重点改善区域制度环境以获取知识空间溢出的增长效应,而发达地区应加强区域自主创新能力,提高知识创造和转化的能力. 展开更多
关键词 知识溢出 经济增长 制度过滤 空间杜宾模型
在线阅读 下载PDF
基于用户空间位置评分云模型的Web服务协同过滤推荐算法 被引量:4
9
作者 王瑞祥 魏乐 +2 位作者 段燕飞 咬登国 张航 《计算机应用研究》 CSCD 北大核心 2021年第10期2981-2987,共7页
Web服务作为无形的产品,不具备真实环境下的空间地理位置坐标,针对服务推荐中无法衡量用户群体与Web服务之间的距离位置关系,造成用户相似度计算失衡,导致推荐不准确等问题,提出了基于用户空间位置评分云模型的Web服务协同过滤推荐算法... Web服务作为无形的产品,不具备真实环境下的空间地理位置坐标,针对服务推荐中无法衡量用户群体与Web服务之间的距离位置关系,造成用户相似度计算失衡,导致推荐不准确等问题,提出了基于用户空间位置评分云模型的Web服务协同过滤推荐算法。首先基于用户群体的行为数据量化Web服务的热度区域,通过空间位置量化评分描述用户对于Web服务的兴趣偏好;其次利用云模型来描述每个用户空间行为评分的整体特征,设计了云模型间相似贴近度的计算方法,基于该方法提出了一种用户差异程度系数评估算法,并作为调控系数优化了皮尔森相似度量;最后通过协同过滤找出用户感兴趣的Web服务。实验结果表明该算法使得用户行为偏好的区域划分更加精确,在推荐准确率上明显提高,为基于位置的Web服务推荐提供新颖的方案。 展开更多
关键词 WEB服务 空间位置坐标 模型 皮尔森相关系数 协同过滤推荐
在线阅读 下载PDF
中国省际人口迁移空间特征与影响因素分析 被引量:6
10
作者 李诗韵 梅志雄 +1 位作者 张锐豪 赵书芳 《华南师范大学学报(自然科学版)》 CAS 北大核心 2017年第3期84-91,共8页
采用全国第六次人口普查的省际人口迁移及相关社会经济等数据,首先分析省际迁移人口的空间分布特征,然后利用全局Moran's I指数考察了省际人口迁移流中的网络自相关性,再构建基于网络自相关的特征向量空间过滤模型对省际人口迁移的... 采用全国第六次人口普查的省际人口迁移及相关社会经济等数据,首先分析省际迁移人口的空间分布特征,然后利用全局Moran's I指数考察了省际人口迁移流中的网络自相关性,再构建基于网络自相关的特征向量空间过滤模型对省际人口迁移的动力机制进行分析,并与引力模型的回归结果进行对比验证,揭示网络自相关影响下省际人口迁移的动力机制.结果表明:(1)省际迁入及净迁入人口主要集中在我国三大经济圈,省际迁出人口主要分布于我国中南部;省际总迁移人口积聚于三大经济圈及中南部地区.(2)省际人口迁入、迁出流存在网络自相关,对人口迁移动力建模时应考虑网络自相关因素.文中加入了网络自相关因素后的特征向量空间过滤模型的拟合水平整体优于引力模型,较成功地揭示了人口迁移流中的网络自相关效应,减少了对其他变量的有偏估计.(3)非网络自相关变量中,人口总量、经济及距离因素对人口迁移活动的影响较大. 展开更多
关键词 人口迁移流 网络自相关 特征向量空间过滤模型
在线阅读 下载PDF
关于信息过滤模型的探讨 被引量:18
11
作者 张晓冬 张书杰 +1 位作者 邢俊丽 李俊玉 《计算机工程与应用》 CSCD 北大核心 2002年第5期99-100,236,共3页
信息过滤技术已是当今信息技术研究的热点。该文主要是针对信息过滤模型的研究,介绍了布尔模型、向量空间模型和潜在语义索引三种信息过滤模型。并就其概念、方法和意义进行了分析和讨论。
关键词 信息过滤模型 布尔模型 向量空间模型 潜在语义索引模型 奇异值分解 信息处理 计算机
在线阅读 下载PDF
一种新的电子邮件过滤系统模型的设计 被引量:14
12
作者 蔡立军 施荣华 《计算机工程》 CAS CSCD 北大核心 2003年第16期167-169,共3页
大量垃圾邮件的出现给用户收发E-mail带来了极大的困扰。该文在朴素贝叶斯算法的基础上,利用最小风险贝叶斯算法修正过滤器,设计出了一种新的电子邮件过滤系统模型。重点讨论了实现该系统所需处理的几个关键问题,最后给出了实验结果。
关键词 邮件过滤 最小风险贝叶斯 向量空间模型 特征抽取 遗传算法
在线阅读 下载PDF
网络文本信息过滤的意义及其模型初探 被引量:4
13
作者 明均仁 张帆 《图书与情报》 CSSCI 2007年第4期37-42,共6页
网络文本信息过滤可根据用户的需求,通过过滤机制主动选择所需的信息,有效解决网络信息迷航的问题。文章就网络文本信息过滤的用户建模和用户匹配技术进行了初步探讨,并在阐述信息过滤一般应用模型的基础上提出网络文本信息过滤模型,分... 网络文本信息过滤可根据用户的需求,通过过滤机制主动选择所需的信息,有效解决网络信息迷航的问题。文章就网络文本信息过滤的用户建模和用户匹配技术进行了初步探讨,并在阐述信息过滤一般应用模型的基础上提出网络文本信息过滤模型,分析网络文本信息过滤模型的应用特征及其组件,并着重讨论了布尔逻辑模型、概率模型和向量空间模型的基本原理与方法,最后就模型中两大技术应用存在的问题总结并提出了一些改进意见。 展开更多
关键词 文本过滤 布尔模型 向量空间模型 概率模型 用户模型 相关反馈
在线阅读 下载PDF
一种空间数据文件的强制访问控制模型及其实现 被引量:4
14
作者 毛健 朱长青 王玉海 《地理与地理信息科学》 CSCD 北大核心 2014年第3期6-10,20,共6页
随着网络技术的飞速发展,空间数据的共享越来越便利,致使空间数据安全问题日益突出。作为空间数据共享的源头,空间数据生产部门亦提高了空间数据的共享门槛。为了解决空间数据的安全问题,促进即时共享,该文提出了一种面向空间数据文件... 随着网络技术的飞速发展,空间数据的共享越来越便利,致使空间数据安全问题日益突出。作为空间数据共享的源头,空间数据生产部门亦提高了空间数据的共享门槛。为了解决空间数据的安全问题,促进即时共享,该文提出了一种面向空间数据文件的强制访问控制模型,并基于该模型实现了一套原型系统。该系统具有较高的安全性,并达到了空间数据文件使用可控性的目的,为降低空间数据的共享门槛提供一条有效的解决途径。 展开更多
关键词 空间数据安全 访问控制模型 文件过滤驱动
在线阅读 下载PDF
基于词共现模型的垃圾邮件过滤方法研究 被引量:4
15
作者 张燕平 史科 +1 位作者 徐庆鹏 谢飞 《中文信息学报》 CSCD 北大核心 2009年第6期61-66,71,共7页
垃圾邮件过滤就是对邮件做出是垃圾或非垃圾的判断。传统的表示邮件的方法是在向量空间模型基础上通过信息增益等特征选择方法提取一部分词来表示邮件内容,存在语义信息不足的问题。该文提出一种将传统方法和词共现模型结合起来表示邮... 垃圾邮件过滤就是对邮件做出是垃圾或非垃圾的判断。传统的表示邮件的方法是在向量空间模型基础上通过信息增益等特征选择方法提取一部分词来表示邮件内容,存在语义信息不足的问题。该文提出一种将传统方法和词共现模型结合起来表示邮件特征的新方法,再采用交叉覆盖算法对邮件进行分类得到邮件分类器。实验表明,该文提出的邮件过滤算法与传统方法相比提高了过滤性能,词共现选择的维度要比传统方法选择的维度更具有代表性。 展开更多
关键词 计算机应用 中文信息处理 向量空间模型 垃圾邮件过滤 词共现模型 交叉覆盖算法
在线阅读 下载PDF
面向协同过滤的真实偏好高斯混合模型 被引量:7
16
作者 张亮 李敏强 《系统工程学报》 CSCD 北大核心 2007年第6期613-619,共7页
针对协同过滤问题,提出了一种基于高斯混合的概率模型,称为真实偏好高斯混合模型.用户对项目的评分由三个因素决定:用户对项目主题和内容的真实偏好,用户的评分习惯,以及项目的公众评价.引入了两个隐含变量,分别用于描述用户类和项目类... 针对协同过滤问题,提出了一种基于高斯混合的概率模型,称为真实偏好高斯混合模型.用户对项目的评分由三个因素决定:用户对项目主题和内容的真实偏好,用户的评分习惯,以及项目的公众评价.引入了两个隐含变量,分别用于描述用户类和项目类,用户和项目依概率可以同时属于多个类.模型包括离线建模过程和在线预测过程,在线预测可以在常数时间内完成.实验表明新模型的预测结果明显优于其他几种协同过滤算法. 展开更多
关键词 协同过滤 期望-最大化算法 潜在空间模型
在线阅读 下载PDF
改进的向量质心模型在实时信息检索中的应用研究 被引量:2
17
作者 刘绍翰 王箭 黄志球 《计算机应用与软件》 CSCD 2011年第10期62-64,76,共4页
将相关反馈技术应用于信息检索中可以学习和明确用户的信息需求,并对检索结果进行信息过滤,是提高信息检索效果的有效手段之一。除了准确率和召回率之外,过滤算法的适应性、速度也直接影响用户使用信息检索系统的体验。采用向量空间模... 将相关反馈技术应用于信息检索中可以学习和明确用户的信息需求,并对检索结果进行信息过滤,是提高信息检索效果的有效手段之一。除了准确率和召回率之外,过滤算法的适应性、速度也直接影响用户使用信息检索系统的体验。采用向量空间模型表示文档的内容预处理工作少,计算简单,适用于实时信息检索。结合偏差最小的基本原理,将改进的反馈文档向量的质心应用于信息重排。以重排的应用场景,在TREC Filtering Task数据集上进行仿真,并与基于关键词检索和类质心的检索方式进行了试验比较。 展开更多
关键词 信息检索 信息过滤 相关反馈 质心分类器 向量空间模型
在线阅读 下载PDF
信息过滤模型的研究 被引量:2
18
作者 耿长欣 刘培玉 《计算机工程与应用》 CSCD 北大核心 2004年第7期93-94,共2页
信息过滤技术是当前研究的热点。该文简单地介绍了信息过滤中常用的三种模型:向量空间模型、布尔逻辑模型和概率推理模型;给出了一种基于模糊集合的过滤模型,通过筛选出关键词,为相关领域建立模糊集合;并阐述了如何确定该模糊集合中的... 信息过滤技术是当前研究的热点。该文简单地介绍了信息过滤中常用的三种模型:向量空间模型、布尔逻辑模型和概率推理模型;给出了一种基于模糊集合的过滤模型,通过筛选出关键词,为相关领域建立模糊集合;并阐述了如何确定该模糊集合中的隶属函数。 展开更多
关键词 信息过滤 向量空间模型 布尔逻辑模型 概率推理模型 模糊集 隶属函数
在线阅读 下载PDF
基于文本内容分析的微博广告过滤模型研究 被引量:2
19
作者 高俊波 梅波 《计算机工程》 CAS CSCD 2014年第5期17-20,共4页
针对新浪、腾讯等微博平台出现大量广告的问题,提出一个微博广告过滤模型。通过对数据的预处理,将采集到的微博原始数据转换成干净且计算机易处理的数据。在预处理阶段,根据微博文本的特点,对停用词表进行改进,以提高查准率,然后基于支... 针对新浪、腾讯等微博平台出现大量广告的问题,提出一个微博广告过滤模型。通过对数据的预处理,将采集到的微博原始数据转换成干净且计算机易处理的数据。在预处理阶段,根据微博文本的特点,对停用词表进行改进,以提高查准率,然后基于支持向量机构建一个训练分类器对数据进行训练,经过不断的学习和反馈,取得较好的分类效果。实验结果表明,该模型进行广告过滤时准确率超过90%,效果优于基于关键字的方法。 展开更多
关键词 微博 文本处理 向量空间模型 支持向量 文本分类 广告过滤
在线阅读 下载PDF
一种基于学习向量量化网络的垃圾邮件过滤方法 被引量:1
20
作者 詹川 卢显良 +1 位作者 周旭 侯孟书 《计算机科学》 CSCD 北大核心 2005年第3期66-68,87,共4页
伴随着电子邮件的广泛使用,垃圾邮件泛滥成灾,严重影响了人们正常的学习、工作和生活。本文针对目前的垃圾邮件主要是由多种商业或政治性类别的垃圾邮件组成的特点,利用学习向量量化网络能把多个子类合并成一个复杂大类的特性,构建了一... 伴随着电子邮件的广泛使用,垃圾邮件泛滥成灾,严重影响了人们正常的学习、工作和生活。本文针对目前的垃圾邮件主要是由多种商业或政治性类别的垃圾邮件组成的特点,利用学习向量量化网络能把多个子类合并成一个复杂大类的特性,构建了一个反垃圾邮件的LVQ神经网络模型,我们对该LVQ网络模型进行了与其他算法的对比试验,试验表明它比基于贝叶斯公式算法和基于神经网络BP算法的过滤器有更好的性能。 展开更多
关键词 学习向量量化网络 垃圾邮件 过滤方法 互信息 向量空间模型
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部