This paper focuses on the problem of automatic image classification (AIC) by proposing a framework based on latent semantic analysis (LSA) and image region pairs. The novel framework employs relative spatial arran...This paper focuses on the problem of automatic image classification (AIC) by proposing a framework based on latent semantic analysis (LSA) and image region pairs. The novel framework employs relative spatial arrangements for region pairs as the primary feature to capture semantics. The significance of this paper is twofold. Firstly, to the best our knowledge, this is the first study of the influence of region pairs as well as their relative spatial information in latent semantic analysis as applied to automatic image classification. Secondly, our proposed method for using the relative spatial information of region pairs show great promise in improving image semantic classi- fication compared with the classical latent semantic analysis method and 2D string representation algorithm.展开更多
加密型勒索软件通过加密用户文件来勒索赎金.现有的基于第一条加密应用编程接口(Application Programming Interface,API)的早期检测方法无法在勒索软件执行加密行为前将其检出.由于不同家族的勒索软件开始执行其加密行为的时刻各不相同...加密型勒索软件通过加密用户文件来勒索赎金.现有的基于第一条加密应用编程接口(Application Programming Interface,API)的早期检测方法无法在勒索软件执行加密行为前将其检出.由于不同家族的勒索软件开始执行其加密行为的时刻各不相同,现有的基于固定时间阈值的早期检测方法仅能将少量勒索软件在其执行加密行为前准确检出.为进一步提升勒索软件检测的及时性,本文在分析多款勒索软件运行初期调用动态链接库(Dynamic Link Library,DLL)和API行为的基础上,提出了一个表征软件从开始运行到首次调用加密相关DLL之间的时间段的概念——运行初始阶段(Initial Phase of Operation,IPO),并提出了一个以软件在IPO内产生的API序列为检测对象的勒索软件早期检测方法,即基于API潜在语义的勒索软件早期检测方法(Ransomware Early Detection Method based on API Latent Semantics,REDMALS).REDMALS采集IPO内的API序列后,采用TF-IDF(Term Frequency-Inverse Document Frequency)算法以及潜在语义分析(Latent Semantic Analysis,LSA)算法对采集的API序列生成特征向量及提取潜在的语义结构,再运用机器学习算法构建检测模型用于勒索软件检测.实验结果显示运用随机森林算法的REDMALS在构建的变种测试集和未知测试集上可分别获得97.7%、96.0%的准确率,且两个测试集中83%和76%的勒索软件样本可在其执行加密行为前被检出.展开更多
日益丰富的门户个性化服务为兴趣建模提出了在描述以及扩展方面更高的要求.提出一种基于潜在兴趣语义描述的门户个性化兴趣模型(PIM-LISD,Personalization Inter-estModel based on Latent Interest Semantic Description),遵循有限混...日益丰富的门户个性化服务为兴趣建模提出了在描述以及扩展方面更高的要求.提出一种基于潜在兴趣语义描述的门户个性化兴趣模型(PIM-LISD,Personalization Inter-estModel based on Latent Interest Semantic Description),遵循有限混合模型理论,融入了隐式获取的门户个性化兴趣语义以及潜在兴趣语义关联描述.通过合理选取不同先验分布来适配潜在兴趣语义的后验分布,完善了模型的可解释性和自适应能力,并在建模过程中利用优化的期望最大化(TEM,Tempered Expectation Maxim ization)算法进行参数估计.实验表明该方法不仅有效节省建模开销,而且能够提升预测精度,从而验证了其正确性和有效性.展开更多
文摘提出了一种基于WordNet本体标注和概率潜在语义分析(PLSA,ProbabilisticLatent Semantic Analysis)的语义Web服务发现方法OntoPLSA.首先使用WordNet本体标注Web服务的操作名、参数以及用户请求,以经过标注后的输出参数集合为词汇集,服务描述文档集合为文档集,组成词汇-文档矩阵,以该矩阵为输入,使用PLSA方法对服务集进行分类,并将用户请求带入PLSA模型,确定其所属的类;然后在类中以标注后的输出参数为键,含有这个输出的服务的列表为键值,建立一个映射表,查找与用户请求的输出相似的映射表键,进而找出对应的键值,即服务列表;最后根据QoS(Quality of Service)和用户请求中的输入参数确定满足条件的服务结果集合.在415个Web服务组成的数据集上的测试结果表明,性能较其他方法有优势,召回率和R准确率也得到了改善.
文摘This paper focuses on the problem of automatic image classification (AIC) by proposing a framework based on latent semantic analysis (LSA) and image region pairs. The novel framework employs relative spatial arrangements for region pairs as the primary feature to capture semantics. The significance of this paper is twofold. Firstly, to the best our knowledge, this is the first study of the influence of region pairs as well as their relative spatial information in latent semantic analysis as applied to automatic image classification. Secondly, our proposed method for using the relative spatial information of region pairs show great promise in improving image semantic classi- fication compared with the classical latent semantic analysis method and 2D string representation algorithm.
文摘加密型勒索软件通过加密用户文件来勒索赎金.现有的基于第一条加密应用编程接口(Application Programming Interface,API)的早期检测方法无法在勒索软件执行加密行为前将其检出.由于不同家族的勒索软件开始执行其加密行为的时刻各不相同,现有的基于固定时间阈值的早期检测方法仅能将少量勒索软件在其执行加密行为前准确检出.为进一步提升勒索软件检测的及时性,本文在分析多款勒索软件运行初期调用动态链接库(Dynamic Link Library,DLL)和API行为的基础上,提出了一个表征软件从开始运行到首次调用加密相关DLL之间的时间段的概念——运行初始阶段(Initial Phase of Operation,IPO),并提出了一个以软件在IPO内产生的API序列为检测对象的勒索软件早期检测方法,即基于API潜在语义的勒索软件早期检测方法(Ransomware Early Detection Method based on API Latent Semantics,REDMALS).REDMALS采集IPO内的API序列后,采用TF-IDF(Term Frequency-Inverse Document Frequency)算法以及潜在语义分析(Latent Semantic Analysis,LSA)算法对采集的API序列生成特征向量及提取潜在的语义结构,再运用机器学习算法构建检测模型用于勒索软件检测.实验结果显示运用随机森林算法的REDMALS在构建的变种测试集和未知测试集上可分别获得97.7%、96.0%的准确率,且两个测试集中83%和76%的勒索软件样本可在其执行加密行为前被检出.