期刊文献+
共找到225篇文章
< 1 2 12 >
每页显示 20 50 100
基于把关人行为的微博虚假信息及早检测方法 被引量:19
1
作者 谢柏林 蒋盛益 +2 位作者 周咏梅 谢逸 李霞 《计算机学报》 EI CSCD 北大核心 2016年第4期730-744,共15页
目前微博已成为人们获取信息和发布信息的一个重要平台,然而微博也正成为虚假信息滋生和泛滥的温床.现有的方法主要基于分类算法来识别虚假信息,这些方法不能及早发现微博上流行的虚假信息.为了减少虚假信息对公众的影响,使微博在人们... 目前微博已成为人们获取信息和发布信息的一个重要平台,然而微博也正成为虚假信息滋生和泛滥的温床.现有的方法主要基于分类算法来识别虚假信息,这些方法不能及早发现微博上流行的虚假信息.为了减少虚假信息对公众的影响,使微博在人们的生产和生活中发挥更积极的作用,文中提出一种基于把关人行为的微博虚假信息及早检测方法.该方法利用模型状态持续时间概率为Gamma分布的隐半马尔可夫模型来刻画信息转发者和评论者对流行的真实信息的把关行为,基于此来及早识别微博上流行的虚假信息.该方法分为模型训练和虚假信息检测两个阶段,在虚假信息检测阶段,计算每条信息在传播过程中产生的观测序列相对于模型的平均对数似然概率,实时更新每条信息的可信度,从而及早发现虚假信息,降低虚假信息的危害.使用采集的新浪微博数据集和Twitter数据集对文中的方法进行了测试,实验结果表明了该方法的有效性. 展开更多
关键词 微博 虚假信息 把关人 隐半马尔可夫模型 社会媒体 社交网络 数据挖掘
在线阅读 下载PDF
基于聚类和信息熵的特征选择算法 被引量:4
2
作者 李霞 蒋盛益 郭艾侠 《郑州大学学报(理学版)》 CAS 北大核心 2009年第1期77-80,共4页
针对分类属性数据,基于信息熵,提出一种度量特征重要程度的定义,结合聚类分析,提出一种无指导的特征选择方法.该方法时间复杂度与数据集的大小和特征个数近似成线性关系,适合于大规模数据集中的特征选择.实验结果表明,该方法具有较好的... 针对分类属性数据,基于信息熵,提出一种度量特征重要程度的定义,结合聚类分析,提出一种无指导的特征选择方法.该方法时间复杂度与数据集的大小和特征个数近似成线性关系,适合于大规模数据集中的特征选择.实验结果表明,该方法具有较好的性能,提出的特征选择方法有效实用. 展开更多
关键词 聚类 信息熵 特征选择 大规模数据集
在线阅读 下载PDF
适用于中国外语学习者的英文作文全自动集成评分算法 被引量:9
3
作者 李霞 刘建达 《中文信息学报》 CSCD 北大核心 2013年第5期100-106,共7页
中国英语学习者人数众多,迫切需要针对中国学生特点的、有效适用于大规模英文作文数据的全自动评分算法,以解决中国现有英语教学和大规模英语考试中英文作文批改量大和难度大的瓶颈问题。该文提出了一种能够有效识别中国英语学习者写作... 中国英语学习者人数众多,迫切需要针对中国学生特点的、有效适用于大规模英文作文数据的全自动评分算法,以解决中国现有英语教学和大规模英语考试中英文作文批改量大和难度大的瓶颈问题。该文提出了一种能够有效识别中国英语学习者写作特点并能自动识别特征维数的特征选择方法,并在此基础上提出了适用于不平衡分布数据的集成分类评分算法。对来自中国英语学习者语料库中大学英语四、六级不同主题下的1 115篇作文的分类结果显示,该文提出的算法比传统的分类评分算法在类内及类间平均分类准确度、召回率及F度量值上均有较大幅度的提升。 展开更多
关键词 作文自动评分 不平衡数据分类 多项式朴素贝叶斯
在线阅读 下载PDF
以信息化手段建设和管理实验室 被引量:44
4
作者 漆建军 《实验技术与管理》 CAS 2006年第1期99-101,共3页
根据现今高校发展的新形势与要求提出了实验搴建设的新思路,着重探讨了高校实验室建设与管理的信息化在具体实践中的操作模式,围绕实验室硬件设施信息化、开设实验内容信息化、管理模式信息化等3个方面进行系统阐述。
关键词 信息化 实验室建设 实验室管理
在线阅读 下载PDF
知识库中知识的信息表示及其上的粗动力系统 被引量:1
5
作者 张倩生 《高校应用数学学报(A辑)》 CSCD 北大核心 2004年第3期369-375,共7页
粗集理论对知识进行了形式化定义,它为处理不确定,不完整的海量数据知识提供了一套严密的数据分析处理工具.但粗集概念及运算的代数意义表示往往不易被人理解.本文针对于此,在知识库中提出了知识的信息熵问题,证明了知识的某些信息表示... 粗集理论对知识进行了形式化定义,它为处理不确定,不完整的海量数据知识提供了一套严密的数据分析处理工具.但粗集概念及运算的代数意义表示往往不易被人理解.本文针对于此,在知识库中提出了知识的信息熵问题,证明了知识的某些信息表示与其代数表示是等价的,最后还讨论了知识库上的粗动力系统的一些性质. 展开更多
关键词 知识库 粗集 信息概率空间 信息熵 粗动力系统
在线阅读 下载PDF
基于数据融合和相关度反馈的信息检索方法 被引量:1
6
作者 王非 《计算机应用》 CSCD 北大核心 2008年第9期2321-2323,2327,共4页
数据融合和基于相关度反馈的查询扩展是两种有效的检索过程优化技术。前者通过集成多个检索结果提高检索性能,后者执行多次查询,依据前次结果修改/扩展用户查询,以求更好地反映用户信息需求。在混合数据融合和查询扩展技术的基础上提出... 数据融合和基于相关度反馈的查询扩展是两种有效的检索过程优化技术。前者通过集成多个检索结果提高检索性能,后者执行多次查询,依据前次结果修改/扩展用户查询,以求更好地反映用户信息需求。在混合数据融合和查询扩展技术的基础上提出一种检索过程优化方法——HQD方法,由相关度反馈结果生成多个替代查询,检索这些替代查询后采用求和余弦方法生成最终检索结果。HQD方法能有效提高检索性能。 展开更多
关键词 相关度反馈 数据融合 检索过程优化
在线阅读 下载PDF
信息检索交互模型研究
7
作者 王非 何绍华 《图书情报知识》 CSSCI 北大核心 2007年第5期84-87,共4页
为了增强检索效率,信息检索系统必须对用户的信息搜寻活动提供更有效的支持,为达到这一目的,需要更好地理解用户同信息系统间交互的本质。信息检索交互模型能帮助分析、理解这些交互以及如何实现相应的支持。
关键词 信息搜寻活动 信息检索交互 交互模型
在线阅读 下载PDF
《管理信息系统》双语教学的经验与体会
8
作者 简小庆 《教育理论与实践》 CSSCI 北大核心 2007年第S1期165-166,共2页
开展双语教学采用外国教材是关键,教师是主导,如果教师的兴奋点和学生的兴奋点不一致,或者教师的困惑与学生的困惑不一致,应当及时疏通解决。在学生中培养小组长,为学生树立学习标兵,是解决教学中问题的一个较实用的方法。
关键词 双语教学 师资建设 教材建设 环境建设 学生自身建设
全文增补中
一种基于朴素贝叶斯的微博情感分类 被引量:44
9
作者 林江豪 阳爱民 +2 位作者 周咏梅 陈锦 蔡泽键 《计算机工程与科学》 CSCD 北大核心 2012年第9期160-165,共6页
本文基于二次情感特征提取算法,利用句法依存关系进行一次文本情感特征提取,在此基础上,利用情感词典,进行二次情感特征提取。构建朴素贝叶斯分类器,对采集的热门话题微博和酒店评论进行文本情感倾向性分类。主要比较了表情符号、标点符... 本文基于二次情感特征提取算法,利用句法依存关系进行一次文本情感特征提取,在此基础上,利用情感词典,进行二次情感特征提取。构建朴素贝叶斯分类器,对采集的热门话题微博和酒店评论进行文本情感倾向性分类。主要比较了表情符号、标点符号,基于情感词典的特征提取和基于二次情感特征提取方法,在不同的组合下的分类性能,寻找更佳的微博文本情感分类预处理方法。并与酒店评论情感分类结果对比、分析,发现影响微博情感分类性能的原因。实验结果表明,二次特征提取方法在分类上取得更高的F1。实验最佳的分类预处理方式是"表情符号+标点符号+二次情感特征提取+BOOL值"。同时发现,朴素贝叶斯在酒店评论情感分类取得更高的分类性能,主要是微博评价对象多样化造成的。 展开更多
关键词 微博 文本情感分类 二次情感特征提取 朴素贝叶斯
在线阅读 下载PDF
微博用户关系挖掘研究综述 被引量:27
10
作者 王连喜 蒋盛益 +1 位作者 庞观松 吴美玲 《情报杂志》 CSSCI 北大核心 2012年第12期91-97,57,共8页
Web2.0的广泛应用和新型社会化网络媒体的盛行,促使网络服务从以数据为主导开始转变为以用户或用户关系为核心。微博作为当下最流行的社会化网络服务媒体,其用户关系挖掘研究正是在这一背景下迅速兴起的一个新兴研究课题,并且逐渐受到... Web2.0的广泛应用和新型社会化网络媒体的盛行,促使网络服务从以数据为主导开始转变为以用户或用户关系为核心。微博作为当下最流行的社会化网络服务媒体,其用户关系挖掘研究正是在这一背景下迅速兴起的一个新兴研究课题,并且逐渐受到人们越来越多的重视。首先依据微博用户的特点对微博用户关系挖掘的概念进行了阐释;然后,以微博用户关系挖掘的两个重要研究内容为主线,分别对微博用户社群分析和关键用户识别做细致的介绍和分析;最后总结了对微博用户关系挖掘的研究内容,并对未来的研究方向进行了展望。 展开更多
关键词 微博 用户社群分析 用户关系 关键用户识别 个性化推荐
在线阅读 下载PDF
适用于大规模文本处理的动态密度聚类算法 被引量:10
11
作者 李霞 蒋盛益 +1 位作者 张倩生 朱靖 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第1期133-139,共7页
针对传统的基于密度的聚类算法对海量数据处理时,存在参数输入复杂及时间复杂度高的问题,给出新的密度定义方法,并在此基础上提出一种只需一个简单输入参数就能动态识别密度不均匀聚类簇的聚类算法,同时将其扩充为可以处理海量数据的两... 针对传统的基于密度的聚类算法对海量数据处理时,存在参数输入复杂及时间复杂度高的问题,给出新的密度定义方法,并在此基础上提出一种只需一个简单输入参数就能动态识别密度不均匀聚类簇的聚类算法,同时将其扩充为可以处理海量数据的两阶段动态密度聚类算法。在人造数据集、大规模数据集以及中英文文本语料数据集上的实验表明,所提出的算法具有输入参数简单和聚类效率高的特点,可以应用于海量文本数据的聚类处理。 展开更多
关键词 文本挖掘 聚类 海量数据 动态密度
在线阅读 下载PDF
音乐情感自动分析研究 被引量:8
12
作者 蒋盛益 李霞 +1 位作者 李碧 王连喜 《计算机工程与设计》 CSCD 北大核心 2010年第18期4112-4115,共4页
音乐情感自动分析在音乐检索和音乐推荐等方面具有广泛的应用。对3种音乐情感模型进行了对比分析,介绍了音乐情感分类方法,并指出已有研究存在的不足。音乐分割与摘要是高效音乐浏览与推荐的基础,在对音乐分割与摘要方法进行分析的基础... 音乐情感自动分析在音乐检索和音乐推荐等方面具有广泛的应用。对3种音乐情感模型进行了对比分析,介绍了音乐情感分类方法,并指出已有研究存在的不足。音乐分割与摘要是高效音乐浏览与推荐的基础,在对音乐分割与摘要方法进行分析的基础上,指出了定长分割策略的不足;借助音乐相似性与情感可视化实现音乐推荐,对音乐相似性度量与可视化方法进行了概述。最后,展望了对音乐情感自动分析的研究方向。 展开更多
关键词 音乐情感 情感识别 情感模型 音乐摘要 音乐检索 音乐推荐
在线阅读 下载PDF
中文文本情感词典构建方法 被引量:37
13
作者 阳爱民 林江豪 周咏梅 《计算机科学与探索》 CSCD 2013年第11期1033-1039,共7页
互联网海量文本的情感分析是当前的一个研究热点。介绍了一种中文文本情感词典构建方法,该方法选用若干个情感种子词,利用搜索引擎返回的共现数,通过改进的PMI(pointwise mutual information)算法计算情感词的情感权值。将构建的情感词... 互联网海量文本的情感分析是当前的一个研究热点。介绍了一种中文文本情感词典构建方法,该方法选用若干个情感种子词,利用搜索引擎返回的共现数,通过改进的PMI(pointwise mutual information)算法计算情感词的情感权值。将构建的情感词典应用到文本情感分类实验中,在不同的语料环境下,对比基于情感词典和朴素贝叶斯分类器下的文本情感分类效果,实验结果表明,构建的情感词典,可有效用于情感特征选择和直接用于情感分类,并且分类性能稳定。 展开更多
关键词 情感词典 情感分类 PMI算法 朴素贝叶斯
在线阅读 下载PDF
基于网络和标签的混合推荐算法 被引量:10
14
作者 张新猛 蒋盛益 +1 位作者 李霞 张倩生 《计算机工程与应用》 CSCD 北大核心 2015年第1期119-124,共6页
基于网络结构的推荐算法利用用户与项目间的结构关系进行推荐,忽略了用户偏好,而项目的标签隐含了项目的内容及用户的偏好,提出一种基于网络结构和标签的混合推荐方法。算法根据用户选择项目的标签统计信息,分别采用TF-IDF和用户对标签... 基于网络结构的推荐算法利用用户与项目间的结构关系进行推荐,忽略了用户偏好,而项目的标签隐含了项目的内容及用户的偏好,提出一种基于网络结构和标签的混合推荐方法。算法根据用户选择项目的标签统计信息,分别采用TF-IDF和用户对标签的支持度两种方法构建用户偏好模型,与基于网络的推荐模型进行线性组合推荐。通过在基准数据集Movie Lens上测试证明,该算法在推荐结果命中率、个性化程度、多样性等方面均优于基于网络的推荐算法。 展开更多
关键词 个性化推荐 标签 TF-IDF 基于网络的推荐
在线阅读 下载PDF
虚拟现实技术在儿童室内火灾逃生教育中的应用研究 被引量:15
15
作者 胡春花 陈晓梅 陈仕鸿 《系统仿真学报》 CAS CSCD 北大核心 2016年第4期934-939,共6页
虚拟现实在儿童火灾逃生教育中的研究具有重要意义。现有的儿童火灾逃生教育大多采用观看图书和录像的方式,缺乏生动性和交互性。针对儿童的心理特点,使用3Ds Max建立虚拟火灾场景和虚拟角色模型,基于Virtools平台进行设计,开发出一套... 虚拟现实在儿童火灾逃生教育中的研究具有重要意义。现有的儿童火灾逃生教育大多采用观看图书和录像的方式,缺乏生动性和交互性。针对儿童的心理特点,使用3Ds Max建立虚拟火灾场景和虚拟角色模型,基于Virtools平台进行设计,开发出一套集人机交互、声音、烟雾和动画演示于一体的、具有游戏式风格的儿童室内火灾逃生教育系统,用户通过键盘或鼠标控制虚拟角色在虚拟火灾场景中逃生,从听觉、视觉和虚拟行为上体验火灾逃生的情景。实验结果表明,该系统能让儿童更有兴致、更牢固地学习火灾逃生知识,收到良好的火灾逃生教育效果。 展开更多
关键词 火灾逃生 虚拟现实 3Ds MAX VIRTOOLS
在线阅读 下载PDF
基于改进的C4.5算法的网络流量分类方法 被引量:19
16
作者 周剑峰 阳爱民 刘吉财 《计算机工程与应用》 CSCD 2012年第5期71-74,共4页
在基于C4.5算法的网络流量分类方法中,网络流量数据量的海量性及其特征的多样性使得决策树的构建速度、分类速度成为评价网络流量分类器的重要标准。在原C4.5算法的基础上提出一种改进的信息熵的计算方法,通过减少计算函数的复杂度,提... 在基于C4.5算法的网络流量分类方法中,网络流量数据量的海量性及其特征的多样性使得决策树的构建速度、分类速度成为评价网络流量分类器的重要标准。在原C4.5算法的基础上提出一种改进的信息熵的计算方法,通过减少计算函数的复杂度,提高决策树的构建速度。实验表明,基于改进后算法的分类器在达到原有分类准确率的同时,极大地缩短了决策树的构成时间。 展开更多
关键词 网络流量分类 C4.5算法 信息熵 信息增益率 决策树
在线阅读 下载PDF
一种新闻评论情感词典的构建方法 被引量:22
17
作者 周咏梅 阳爱民 杨佳能 《计算机科学》 CSCD 北大核心 2014年第8期67-69,80,共4页
情感词典研究是文本情感分析领域的一个重要内容;基于情感词典的文本情感分析方法是一种非常有效的方法。互联网上的新闻评论包含评论人的情感,对其情感进行自动分析研究是非常有意义的。借鉴图排序模型的原理,提出一种新闻评论情感词... 情感词典研究是文本情感分析领域的一个重要内容;基于情感词典的文本情感分析方法是一种非常有效的方法。互联网上的新闻评论包含评论人的情感,对其情感进行自动分析研究是非常有意义的。借鉴图排序模型的原理,提出一种新闻评论情感词典构建方法,该方法首先通过新闻评论语料和基础情感词典获得评论情感词集和种子词,然后根据提出的基于PageRank算法的方法判定评论情感词集的极性并计算其强度,进而构建新闻评论情感词典。实验从情感词判定的准确性和基于构建的情感词典的分类性能两个方面验证了所提方法的有效性。 展开更多
关键词 情感词典 图排序 PAGERANK算法 新闻评论
在线阅读 下载PDF
基于聚类的特征选择方法 被引量:18
18
作者 蒋盛益 郑琪 张倩生 《电子学报》 EI CAS CSCD 北大核心 2008年第B12期157-160,共4页
本文提出了一种度量特征区分度的定义,进而提出一种基于聚类的特征选择方法CBFS.该方法时间复杂度与数据集的大小和特征个数成近似线性关系,适合于大规模数据集中的特征选择;该方法对数据类型没有限制,适用于混合类型数据.在UCI数据集... 本文提出了一种度量特征区分度的定义,进而提出一种基于聚类的特征选择方法CBFS.该方法时间复杂度与数据集的大小和特征个数成近似线性关系,适合于大规模数据集中的特征选择;该方法对数据类型没有限制,适用于混合类型数据.在UCI数据集上的实验结果表明,与文献中的方法相比,本文方法具有较好的性能,说明提出的特征选择方法是有效和实用的. 展开更多
关键词 聚类 特征区分度 特征选择
在线阅读 下载PDF
结合词向量和聚类算法的新闻评论话题演进分析 被引量:16
19
作者 林江豪 周咏梅 +1 位作者 阳爱民 王伟 《计算机工程与科学》 CSCD 北大核心 2016年第11期2368-2374,共7页
话题演进分析主要是挖掘话题内容随着时间流的演进情况。话题的内容可用关键词来表示。利用word2vec对75万篇新闻和微博文本进行训练,得到词向量模型。将文本流处理后输入模型,获得时间序列下所有词汇的词向量,利用K-means对词向量进行... 话题演进分析主要是挖掘话题内容随着时间流的演进情况。话题的内容可用关键词来表示。利用word2vec对75万篇新闻和微博文本进行训练,得到词向量模型。将文本流处理后输入模型,获得时间序列下所有词汇的词向量,利用K-means对词向量进行聚类,从而实现话题关键词的抽取。实验对比了基于PLSA和LDA主题模型下的话题抽取效果,发现本文的话题分析效果优于主题模型的方法。同时,采集足够大量、内容足够丰富的语料,可训练得到泛化能力比较强的模型,有利于实时话题演进分析研究工作。 展开更多
关键词 话题演进 word2vec PLSA LDA
在线阅读 下载PDF
台风灾情评估及方法综述 被引量:27
20
作者 魏章进 隋广军 唐丹玲 《灾害学》 CSCD 北大核心 2012年第4期107-113,共7页
台风是一种导致严重灾害的天气系统,其灾害评估是减灾防灾的决策基础;国内外台风灾情评估基本区分为统计指标综合法和统计模拟法。归纳了6种主要的统计指标综合方法,总结了统计模拟评估法的基本步骤,在此基础比较了台风灾情评估方法的... 台风是一种导致严重灾害的天气系统,其灾害评估是减灾防灾的决策基础;国内外台风灾情评估基本区分为统计指标综合法和统计模拟法。归纳了6种主要的统计指标综合方法,总结了统计模拟评估法的基本步骤,在此基础比较了台风灾情评估方法的不同特点。从评估的模型、指标选择以及评估结果等几个方面评述了指标评估方法中以及统计模拟法存在的问题。最后,对灾情评估发展趋势的5个方面进行展望,并指出:国内统计模拟方法的评估较少开展,应与指标评估方法相结合,积极开展统计模拟方法的灾情评估;选择不同的行业,针对行业具体特点,建立敏感行业的灾情评估模型;加强高新技术,特别是卫星遥感技术在台风灾害评估中的应用;同时要加强评估决策支持系统研究。 展开更多
关键词 台风灾害 灾情评估 进展 方法综述
在线阅读 下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部