期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
改进的基于内容的文件类型识别算法
1
作者 曹鼎 罗军勇 《计算机工程与设计》 CSCD 北大核心 2011年第12期4246-4250,共5页
在现有基于内容的文件类型识别算法基础上,针对统计特征提取方面存在的问题,采用定长和变长窗口对文件二进制内容进行划分,提取文件的统计特征,并提出将特征选择应用于文件类型识别,结合特征的广度和稳定度设计出一种特征选择评估函数... 在现有基于内容的文件类型识别算法基础上,针对统计特征提取方面存在的问题,采用定长和变长窗口对文件二进制内容进行划分,提取文件的统计特征,并提出将特征选择应用于文件类型识别,结合特征的广度和稳定度设计出一种特征选择评估函数选择标志特征,从而建立文件类型模型,以此为标准识别文件类型。该算法不依靠特定文件类型的结构和关键标识,适用范围更为广泛。实验结果表明,该算法能有效提高文件类型的识别查准率和查全率。 展开更多
关键词 文件类型识别 元组频率分布 文件二进制内容 余弦相似度 文件类型模型 特征选择
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部