期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
面向网络舆情分析系统的本体应用 被引量:2
1
作者 李勇 刘战东 《西安石油大学学报(自然科学版)》 CAS 北大核心 2014年第1期94-97,10,共4页
针对现有网络舆情分析系统缺乏语义信息,可能导致分析结果不精确的问题,研究了本体技术在构建网络舆情分析系统中的应用,提出基于本体的网络舆情分析系统结构,并对系统实现中采用的本体技术包括网络舆情本体库的构建、网络文本语义标注... 针对现有网络舆情分析系统缺乏语义信息,可能导致分析结果不精确的问题,研究了本体技术在构建网络舆情分析系统中的应用,提出基于本体的网络舆情分析系统结构,并对系统实现中采用的本体技术包括网络舆情本体库的构建、网络文本语义标注、基于语义相似度的敏感话题发现和构建查询词的概念空间等进行了研究。通过本体建立舆情分析概念的共享空间,可以有效地挖掘网络内容的语义信息,提高舆情分析的准确率。 展开更多
关键词 网络舆情分析 本体技术 概念空间 语义计算
在线阅读 下载PDF
不平衡数据的集成分类算法综述 被引量:75
2
作者 李勇 刘战东 张海军 《计算机应用研究》 CSCD 北大核心 2014年第5期1287-1291,共5页
集成学习是通过集成多个基分类器共同决策的机器学习技术,通过不同的样本集训练有差异的基分类器,得到的集成分类器可以有效地提高学习效果。在基分类器的训练过程中,可以通过代价敏感技术和数据采样实现不平衡数据的处理。由于集成学... 集成学习是通过集成多个基分类器共同决策的机器学习技术,通过不同的样本集训练有差异的基分类器,得到的集成分类器可以有效地提高学习效果。在基分类器的训练过程中,可以通过代价敏感技术和数据采样实现不平衡数据的处理。由于集成学习在不平衡数据分类的优势,针对不平衡数据的集成分类算法得到广泛研究。详细分析了不平衡数据集成分类算法的研究现状,比较了现有算法的差异和各自存在的优点及问题,提出和分析了有待进一步研究的问题。 展开更多
关键词 不平衡数据 集成学习 分类 代价敏感 数据采样
在线阅读 下载PDF
数据驱动的软件缺陷预测研究综述 被引量:18
3
作者 李勇 黄志球 +1 位作者 王勇 房丙午 《电子学报》 EI CAS CSCD 北大核心 2017年第4期982-988,共7页
数据驱动的软件缺陷预测是提高软件测试效率、保证软件可靠性的重要途径之一,近几年已成为实证软件工程的研究热点.首先介绍了数据驱动软件缺陷预测的研究背景;然后总结了已有软件缺陷数据属性度量方法的特点,并按照软件开发中缺陷预测... 数据驱动的软件缺陷预测是提高软件测试效率、保证软件可靠性的重要途径之一,近几年已成为实证软件工程的研究热点.首先介绍了数据驱动软件缺陷预测的研究背景;然后总结了已有软件缺陷数据属性度量方法的特点,并按照软件开发中缺陷预测的使用场景,以数据来源为主线从基于版本内数据、跨版本数据和跨项目数据实现缺陷预测三个方面对近10年(2005~2015)已有的研究工作进行分类归纳和比较;最后对该领域未来的研究趋势进行了展望. 展开更多
关键词 软件缺陷预测 数据驱动 软件度量 机器学习
在线阅读 下载PDF
代价敏感分类的软件缺陷预测方法 被引量:15
4
作者 李勇 黄志球 +1 位作者 房丙午 王勇 《计算机科学与探索》 CSCD 2014年第12期1442-1451,共10页
软件缺陷预测是提高软件测试效率,保证软件可靠性的重要途径。考虑到软件缺陷预测模型对软件模块错误分类代价的不同,提出了代价敏感分类的软件缺陷预测模型构建方法。针对代码属性度量数据,采用Bagging方式有放回地多次随机抽取训练样... 软件缺陷预测是提高软件测试效率,保证软件可靠性的重要途径。考虑到软件缺陷预测模型对软件模块错误分类代价的不同,提出了代价敏感分类的软件缺陷预测模型构建方法。针对代码属性度量数据,采用Bagging方式有放回地多次随机抽取训练样本来构建代价敏感分类的决策树基分类器,然后通过投票的方式集成后进行软件模块的缺陷预测,并给出模型构建过程中代价因子最优值的判定选择方法。使用公开的NASA软件缺陷预测数据集进行仿真实验,结果表明该方法在保证缺陷预测率的前提下,误报率明显降低,综合评价指标AUC和F值均优于现有方法。 展开更多
关键词 软件缺陷预测 代价敏感分类 最优代价因子 决策树 集成算法
在线阅读 下载PDF
结合欠抽样与集成的软件缺陷预测 被引量:7
5
作者 李勇 《计算机应用》 CSCD 北大核心 2014年第8期2291-2294,2310,共5页
软件缺陷预测是提高测试效率、保证软件可靠性的重要途径。为了提高软件缺陷预测的准确率,提出一种结合欠抽样与决策树分类器集成的软件缺陷预测模型。考虑到软件缺陷数据的类不平衡特性,首先,通过数据的不平衡率确定抽样度,执行欠抽样... 软件缺陷预测是提高测试效率、保证软件可靠性的重要途径。为了提高软件缺陷预测的准确率,提出一种结合欠抽样与决策树分类器集成的软件缺陷预测模型。考虑到软件缺陷数据的类不平衡特性,首先,通过数据的不平衡率确定抽样度,执行欠抽样实现数据的重新平衡;然后,采用Bagging随机抽样原理训练若干个决策树子分类器;最后,按照少数服从多数的原则生成预测模型。使用公开的NASA软件缺陷预测数据集进行了仿真实验。实验结果表明,与3种基准方法对比,所提模型在保证预报率的前提下,误报率(PF)降低了10%以上,综合评价指标均有显著提升。该模型的缺陷预测误报率较低,而且具有较高的预测准确率与稳定性。 展开更多
关键词 软件缺陷预测 类不平衡数据 欠抽样 决策树 集成算法
在线阅读 下载PDF
教学资源概念查询扩展研究 被引量:2
6
作者 张兰芳 年梅 《计算机工程与应用》 CSCD 2014年第13期127-132,共6页
查询扩展是在原查询词的基础上加入与用户查询词相关的词或者词组,组成新的、更准确的查询序列,使扩展后的查询序列能更清晰地表达用户的查询请求,克服自然语言的"二义性"。基于《计算机网络》概念语义网络能更加有效地找出... 查询扩展是在原查询词的基础上加入与用户查询词相关的词或者词组,组成新的、更准确的查询序列,使扩展后的查询序列能更清晰地表达用户的查询请求,克服自然语言的"二义性"。基于《计算机网络》概念语义网络能更加有效地找出计算机网络领域内查询词的概念词及扩展概念词,并向上拓展将各个查询词的原始语义关系联接起来,解决了查询词之间缺乏联系的问题,为扩展检索的实现奠定基础。描述了概念语义网络的生成方法、关联概念树的抽取方法和查询扩展检索的计算机实现流程,为教学资源领域的在线学习提供了技术支持。 展开更多
关键词 查询扩展 检索 概念语义网络 《计算机网络》
在线阅读 下载PDF
一种基于投票的不平衡数据分类集成算法 被引量:3
7
作者 李勇 《科学技术与工程》 北大核心 2014年第21期275-279,共5页
不平衡数据分类是机器学习的研究热点之一。传统的机器学习分类算法通常假定用于训练的数据集是平衡的,不能直接应用于不平衡数据分类。利用朴素贝叶斯和决策树对数据不平衡的敏感度不同,提出一种基于投票的不平衡数据分类集成算法。基... 不平衡数据分类是机器学习的研究热点之一。传统的机器学习分类算法通常假定用于训练的数据集是平衡的,不能直接应用于不平衡数据分类。利用朴素贝叶斯和决策树对数据不平衡的敏感度不同,提出一种基于投票的不平衡数据分类集成算法。基分类器选择NB和C4.5,通过投票平均方法进行分类决策;并选择公开的不平衡数据集进行实验验证。实验结果表明,该算法能有效提高不平衡数据的分类性能,特别是对正类(少数类)的误报率较低,具有良好的鲁棒性。 展开更多
关键词 不平衡数据分类 朴素贝叶斯 决策树 投票表决
在线阅读 下载PDF
现代维吾尔语人名汉字音译转写关键技术研究 被引量:1
8
作者 阿力木.木拉提 艾孜尔古丽 玉素甫.艾白都拉 《计算机工程与应用》 CSCD 2014年第9期209-213,共5页
改革开放后,新疆与国内以及国际交往越来越频繁。新疆少数民族人名汉字音译转写缺少统一标准,维吾尔人名汉字音译转写时,在户口上是一种写法,在身份证上另一种写法,在护照上更不一样的用字写法,机票、汇款单等又是一种写法。为解决这些... 改革开放后,新疆与国内以及国际交往越来越频繁。新疆少数民族人名汉字音译转写缺少统一标准,维吾尔人名汉字音译转写时,在户口上是一种写法,在身份证上另一种写法,在护照上更不一样的用字写法,机票、汇款单等又是一种写法。为解决这些问题,前人作了研究并取得了一定成果以及使用维吾尔人名汉语音译撰写系统来规范维吾尔人名汉语音译。但是这些成果正确率只有52%。利用规则和维吾尔人名特征相结合的方法,提高系统自动维吾尔人名汉语音译正确率30%。介绍该领域研究进展,通论维吾尔音节切分与维吾尔人名特征相结合方法。陈述基于字形的DOM音译框架解决的问题,介绍基于音节切分的维吾尔人名汉字音译转写的实现方法,给出了实验结果与分析。 展开更多
关键词 维吾尔语 音节切分 维吾尔人名汉字音译转写 自动翻译
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部