期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
一种基于大数据技术的舆情监控系统 被引量:10
1
作者 曹彬 顾怡立 +1 位作者 谢珍真 陈震 《信息网络安全》 2014年第12期32-36,共5页
随着互联网的普及,社交网络已经成为人们生活中至关重要的一部分。这种新媒体时代的潮流促进了信息的流动和传播,同时也带来了海量的媒体内容与用户数据。社交媒体分析是舆情监控系统的主要内容,舆情数据的分析、处理与监控是新媒体时... 随着互联网的普及,社交网络已经成为人们生活中至关重要的一部分。这种新媒体时代的潮流促进了信息的流动和传播,同时也带来了海量的媒体内容与用户数据。社交媒体分析是舆情监控系统的主要内容,舆情数据的分析、处理与监控是新媒体时代带来的新的技术问题之一。近年来的大数据处理计算技术提供了处理海量数据的成熟解决方案。大数据处理平台有很多种,其中Hadoop具有成熟的社区,其架构稳定且易于使用。在文本分类方面,LDA统计模型方法给文本分类问题带来了新的处理办法。因此,文章提出了一个基于成熟开源架构的舆情监控系统,系统基于Hadoop平台,以Nutch作为爬虫,使用Solr实现核心的索引查找功能。整个平台在海量数据处理方面展现了较高的分析处理效率,在应对海量数据带来的问题的同时还提供了智能的分析与统计功能。 展开更多
关键词 舆情监控 爬虫 搜索 LDA算法 社交媒体
在线阅读 下载PDF
一个基于Java的DSM系统──JAD
2
作者 房至一 朱维平 +2 位作者 程墨 魏华 张震 《吉林大学自然科学学报》 CAS CSCD 北大核心 2001年第4期34-36,共3页
介绍一种在 Java虚拟机上开发的 ,适于多种分布式环境的分布式共享存储 ( DSM)系统 .该系统可以隐蔽计算机体系结构的差异性 。
关键词 异构型分布式共享存储器 JAVA虚拟机 共享对象
在线阅读 下载PDF
改进加密算法实现的性能 被引量:9
3
作者 张猛 杨可新 鞠九滨 《软件学报》 EI CSCD 北大核心 2001年第6期878-883,共6页
介绍了在实现加密算法时改进性能的方法 。
关键词 加密算法 加密学 密钥 轮函数 性能
在线阅读 下载PDF
用于图像内容认证的半脆弱水印新算法 被引量:6
4
作者 王友卫 刘元宁 朱晓冬 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2013年第6期969-976,共8页
为了提升数字图像内容认证的准确性,提出一种新颖的半脆弱水印算法.引入相关块组的概念,并将相关块组进一步划分为子块组,轮流使用每个子块组内特定块生成水印,最终将水印嵌入到子块组内的其他块中.算法根据图像内容自适应选取量化步长... 为了提升数字图像内容认证的准确性,提出一种新颖的半脆弱水印算法.引入相关块组的概念,并将相关块组进一步划分为子块组,轮流使用每个子块组内特定块生成水印,最终将水印嵌入到子块组内的其他块中.算法根据图像内容自适应选取量化步长,结合Slant变换高能量集中性及直流量化原理完成水印嵌入过程,认证过程中使用新的噪声过滤策略并通过投票方式确定篡改发生位置.实验表明:该算法能有效地提高含水印图像的质量及防止水印信息的未授权提取,在应对裁剪、替换等常规处理时定位精度提升明显.算法抵抗偶然攻击的能力强,新噪声策略有效地改善了针对篡改区域的识别效果. 展开更多
关键词 Slant变换 半脆弱水印 图像认证 噪声过滤
在线阅读 下载PDF
基于用户兴趣集的在线垃圾邮件快速识别新方法 被引量:2
5
作者 王友卫 刘元宁 +1 位作者 凤丽洲 朱晓冬 《电子学报》 EI CAS CSCD 北大核心 2015年第10期1963-1970,共8页
为在不显著降低垃圾邮件识别精度的同时有效提高邮件识别速度,提出了一种在线垃圾邮件快速识别新方法.首先引入用户正、负兴趣集的概念,结合用户兴趣集及支持向量机对邮件进行分类;然后根据主动学习理论,结合训练集样本密度及改进角度... 为在不显著降低垃圾邮件识别精度的同时有效提高邮件识别速度,提出了一种在线垃圾邮件快速识别新方法.首先引入用户正、负兴趣集的概念,结合用户兴趣集及支持向量机对邮件进行分类;然后根据主动学习理论,结合训练集样本密度及改进角度差异方法寻找分类最不确定的样本并推荐给用户进行类别标注;最后将标注后样本及分类最确定性样本加入训练集,并使用样本价值评价新函数淘汰冗余样本以生成新的训练集.实验表明,本文方法的用户标注负担小,垃圾邮件识别精度高、速度快,具有较高的在线应用价值. 展开更多
关键词 垃圾邮件 用户兴趣集 支持向量机 主动学习 在线应用
在线阅读 下载PDF
基于广义朴素贝叶斯分类器的空值处理方法 被引量:3
6
作者 王辉 王双成 +1 位作者 周颜军 张剑飞 《东北师大学报(自然科学版)》 CAS CSCD 北大核心 2004年第1期34-38,共5页
 给出了基于广义朴素贝叶斯分类器的空值处理方法,该方法利用广义朴素贝叶斯分类器的较强预测能力及灵活的效率选择方式,有效地解决了数据中的空值处理问题.利用模拟数据进行了对比实验,结果显示,其预测准确性明显提高.
关键词 广义朴素贝叶斯分类器 空值处理 分类能力
在线阅读 下载PDF
使用二级索引的中文分词词典 被引量:10
7
作者 张庆扬 柴胜 《计算机工程与应用》 CSCD 北大核心 2009年第19期139-141,共3页
中文分词是中文信息处理的基础,在诸如搜索引擎,自动翻译等多个领域都有着非常重要的地位。中文分词词典是中文机械式分词算法的基础,它将告诉算法什么是词,由于在算法执行过程中需要反复利用分词词典的内容进行字符串匹配,所以中文分... 中文分词是中文信息处理的基础,在诸如搜索引擎,自动翻译等多个领域都有着非常重要的地位。中文分词词典是中文机械式分词算法的基础,它将告诉算法什么是词,由于在算法执行过程中需要反复利用分词词典的内容进行字符串匹配,所以中文分词词典的存储结构从很大程度上决定将采用什么匹配算法以及匹配算法的好坏。在研究现存分词词典及匹配算法的基础上,吸取前人的经验经过改进,为词典加上了多级索引,并由此提出了一种新的中文分词词典存储机制——基于二级索引的中文分词词典,并在该词典的基础上提出了基于正向匹配的改进型匹配算法,大大降低了匹配过程的时间复杂度。从而提高了整个中文分词算法的分词速度。 展开更多
关键词 中文分词 二级索引 正向最大匹配
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部