期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
8
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向网络舆情分析系统的本体应用
被引量:
2
1
作者
李勇
刘战东
《西安石油大学学报(自然科学版)》
CAS
北大核心
2014年第1期94-97,10,共4页
针对现有网络舆情分析系统缺乏语义信息,可能导致分析结果不精确的问题,研究了本体技术在构建网络舆情分析系统中的应用,提出基于本体的网络舆情分析系统结构,并对系统实现中采用的本体技术包括网络舆情本体库的构建、网络文本语义标注...
针对现有网络舆情分析系统缺乏语义信息,可能导致分析结果不精确的问题,研究了本体技术在构建网络舆情分析系统中的应用,提出基于本体的网络舆情分析系统结构,并对系统实现中采用的本体技术包括网络舆情本体库的构建、网络文本语义标注、基于语义相似度的敏感话题发现和构建查询词的概念空间等进行了研究。通过本体建立舆情分析概念的共享空间,可以有效地挖掘网络内容的语义信息,提高舆情分析的准确率。
展开更多
关键词
网络舆情分析
本体技术
概念空间
语义计算
在线阅读
下载PDF
职称材料
不平衡数据的集成分类算法综述
被引量:
75
2
作者
李勇
刘战东
张海军
《计算机应用研究》
CSCD
北大核心
2014年第5期1287-1291,共5页
集成学习是通过集成多个基分类器共同决策的机器学习技术,通过不同的样本集训练有差异的基分类器,得到的集成分类器可以有效地提高学习效果。在基分类器的训练过程中,可以通过代价敏感技术和数据采样实现不平衡数据的处理。由于集成学...
集成学习是通过集成多个基分类器共同决策的机器学习技术,通过不同的样本集训练有差异的基分类器,得到的集成分类器可以有效地提高学习效果。在基分类器的训练过程中,可以通过代价敏感技术和数据采样实现不平衡数据的处理。由于集成学习在不平衡数据分类的优势,针对不平衡数据的集成分类算法得到广泛研究。详细分析了不平衡数据集成分类算法的研究现状,比较了现有算法的差异和各自存在的优点及问题,提出和分析了有待进一步研究的问题。
展开更多
关键词
不平衡数据
集成学习
分类
代价敏感
数据采样
在线阅读
下载PDF
职称材料
数据驱动的软件缺陷预测研究综述
被引量:
18
3
作者
李勇
黄志球
+1 位作者
王勇
房丙午
《电子学报》
EI
CAS
CSCD
北大核心
2017年第4期982-988,共7页
数据驱动的软件缺陷预测是提高软件测试效率、保证软件可靠性的重要途径之一,近几年已成为实证软件工程的研究热点.首先介绍了数据驱动软件缺陷预测的研究背景;然后总结了已有软件缺陷数据属性度量方法的特点,并按照软件开发中缺陷预测...
数据驱动的软件缺陷预测是提高软件测试效率、保证软件可靠性的重要途径之一,近几年已成为实证软件工程的研究热点.首先介绍了数据驱动软件缺陷预测的研究背景;然后总结了已有软件缺陷数据属性度量方法的特点,并按照软件开发中缺陷预测的使用场景,以数据来源为主线从基于版本内数据、跨版本数据和跨项目数据实现缺陷预测三个方面对近10年(2005~2015)已有的研究工作进行分类归纳和比较;最后对该领域未来的研究趋势进行了展望.
展开更多
关键词
软件缺陷预测
数据驱动
软件度量
机器学习
在线阅读
下载PDF
职称材料
代价敏感分类的软件缺陷预测方法
被引量:
15
4
作者
李勇
黄志球
+1 位作者
房丙午
王勇
《计算机科学与探索》
CSCD
2014年第12期1442-1451,共10页
软件缺陷预测是提高软件测试效率,保证软件可靠性的重要途径。考虑到软件缺陷预测模型对软件模块错误分类代价的不同,提出了代价敏感分类的软件缺陷预测模型构建方法。针对代码属性度量数据,采用Bagging方式有放回地多次随机抽取训练样...
软件缺陷预测是提高软件测试效率,保证软件可靠性的重要途径。考虑到软件缺陷预测模型对软件模块错误分类代价的不同,提出了代价敏感分类的软件缺陷预测模型构建方法。针对代码属性度量数据,采用Bagging方式有放回地多次随机抽取训练样本来构建代价敏感分类的决策树基分类器,然后通过投票的方式集成后进行软件模块的缺陷预测,并给出模型构建过程中代价因子最优值的判定选择方法。使用公开的NASA软件缺陷预测数据集进行仿真实验,结果表明该方法在保证缺陷预测率的前提下,误报率明显降低,综合评价指标AUC和F值均优于现有方法。
展开更多
关键词
软件缺陷预测
代价敏感分类
最优代价因子
决策树
集成算法
在线阅读
下载PDF
职称材料
结合欠抽样与集成的软件缺陷预测
被引量:
7
5
作者
李勇
《计算机应用》
CSCD
北大核心
2014年第8期2291-2294,2310,共5页
软件缺陷预测是提高测试效率、保证软件可靠性的重要途径。为了提高软件缺陷预测的准确率,提出一种结合欠抽样与决策树分类器集成的软件缺陷预测模型。考虑到软件缺陷数据的类不平衡特性,首先,通过数据的不平衡率确定抽样度,执行欠抽样...
软件缺陷预测是提高测试效率、保证软件可靠性的重要途径。为了提高软件缺陷预测的准确率,提出一种结合欠抽样与决策树分类器集成的软件缺陷预测模型。考虑到软件缺陷数据的类不平衡特性,首先,通过数据的不平衡率确定抽样度,执行欠抽样实现数据的重新平衡;然后,采用Bagging随机抽样原理训练若干个决策树子分类器;最后,按照少数服从多数的原则生成预测模型。使用公开的NASA软件缺陷预测数据集进行了仿真实验。实验结果表明,与3种基准方法对比,所提模型在保证预报率的前提下,误报率(PF)降低了10%以上,综合评价指标均有显著提升。该模型的缺陷预测误报率较低,而且具有较高的预测准确率与稳定性。
展开更多
关键词
软件缺陷预测
类不平衡数据
欠抽样
决策树
集成算法
在线阅读
下载PDF
职称材料
教学资源概念查询扩展研究
被引量:
2
6
作者
张兰芳
年梅
《计算机工程与应用》
CSCD
2014年第13期127-132,共6页
查询扩展是在原查询词的基础上加入与用户查询词相关的词或者词组,组成新的、更准确的查询序列,使扩展后的查询序列能更清晰地表达用户的查询请求,克服自然语言的"二义性"。基于《计算机网络》概念语义网络能更加有效地找出...
查询扩展是在原查询词的基础上加入与用户查询词相关的词或者词组,组成新的、更准确的查询序列,使扩展后的查询序列能更清晰地表达用户的查询请求,克服自然语言的"二义性"。基于《计算机网络》概念语义网络能更加有效地找出计算机网络领域内查询词的概念词及扩展概念词,并向上拓展将各个查询词的原始语义关系联接起来,解决了查询词之间缺乏联系的问题,为扩展检索的实现奠定基础。描述了概念语义网络的生成方法、关联概念树的抽取方法和查询扩展检索的计算机实现流程,为教学资源领域的在线学习提供了技术支持。
展开更多
关键词
查询扩展
检索
概念语义网络
《计算机网络》
在线阅读
下载PDF
职称材料
一种基于投票的不平衡数据分类集成算法
被引量:
3
7
作者
李勇
《科学技术与工程》
北大核心
2014年第21期275-279,共5页
不平衡数据分类是机器学习的研究热点之一。传统的机器学习分类算法通常假定用于训练的数据集是平衡的,不能直接应用于不平衡数据分类。利用朴素贝叶斯和决策树对数据不平衡的敏感度不同,提出一种基于投票的不平衡数据分类集成算法。基...
不平衡数据分类是机器学习的研究热点之一。传统的机器学习分类算法通常假定用于训练的数据集是平衡的,不能直接应用于不平衡数据分类。利用朴素贝叶斯和决策树对数据不平衡的敏感度不同,提出一种基于投票的不平衡数据分类集成算法。基分类器选择NB和C4.5,通过投票平均方法进行分类决策;并选择公开的不平衡数据集进行实验验证。实验结果表明,该算法能有效提高不平衡数据的分类性能,特别是对正类(少数类)的误报率较低,具有良好的鲁棒性。
展开更多
关键词
不平衡数据分类
朴素贝叶斯
决策树
投票表决
在线阅读
下载PDF
职称材料
现代维吾尔语人名汉字音译转写关键技术研究
被引量:
1
8
作者
阿力木.木拉提
艾孜尔古丽
玉素甫.艾白都拉
《计算机工程与应用》
CSCD
2014年第9期209-213,共5页
改革开放后,新疆与国内以及国际交往越来越频繁。新疆少数民族人名汉字音译转写缺少统一标准,维吾尔人名汉字音译转写时,在户口上是一种写法,在身份证上另一种写法,在护照上更不一样的用字写法,机票、汇款单等又是一种写法。为解决这些...
改革开放后,新疆与国内以及国际交往越来越频繁。新疆少数民族人名汉字音译转写缺少统一标准,维吾尔人名汉字音译转写时,在户口上是一种写法,在身份证上另一种写法,在护照上更不一样的用字写法,机票、汇款单等又是一种写法。为解决这些问题,前人作了研究并取得了一定成果以及使用维吾尔人名汉语音译撰写系统来规范维吾尔人名汉语音译。但是这些成果正确率只有52%。利用规则和维吾尔人名特征相结合的方法,提高系统自动维吾尔人名汉语音译正确率30%。介绍该领域研究进展,通论维吾尔音节切分与维吾尔人名特征相结合方法。陈述基于字形的DOM音译框架解决的问题,介绍基于音节切分的维吾尔人名汉字音译转写的实现方法,给出了实验结果与分析。
展开更多
关键词
维吾尔语
音节切分
维吾尔人名汉字音译转写
自动翻译
在线阅读
下载PDF
职称材料
题名
面向网络舆情分析系统的本体应用
被引量:
2
1
作者
李勇
刘战东
机构
新疆师范大学网络信息安全与舆情分析重点实验室
出处
《西安石油大学学报(自然科学版)》
CAS
北大核心
2014年第1期94-97,10,共4页
基金
教育部人文社会科学研究青年基金项目(编号:11YJC870014)
新疆自治区高校科研计划项目(编号:XJEDU2012S28)
新疆师范大学重点实验室基金项目(编号:WLYQ2012108)
文摘
针对现有网络舆情分析系统缺乏语义信息,可能导致分析结果不精确的问题,研究了本体技术在构建网络舆情分析系统中的应用,提出基于本体的网络舆情分析系统结构,并对系统实现中采用的本体技术包括网络舆情本体库的构建、网络文本语义标注、基于语义相似度的敏感话题发现和构建查询词的概念空间等进行了研究。通过本体建立舆情分析概念的共享空间,可以有效地挖掘网络内容的语义信息,提高舆情分析的准确率。
关键词
网络舆情分析
本体技术
概念空间
语义计算
Keywords
online public opinion analysis system
ontology technology
conceptual space
semantic computing
分类号
TP182 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
不平衡数据的集成分类算法综述
被引量:
75
2
作者
李勇
刘战东
张海军
机构
新疆师范大学网络信息安全与舆情分析重点实验室
南京航空航天
大学
计算机科学与技术学院
出处
《计算机应用研究》
CSCD
北大核心
2014年第5期1287-1291,共5页
基金
新疆自治区高校科研计划资助项目(XJEDU2012S28)
国家教育部人文社会科学研究青年基金资助项目(11YJC870014)
+1 种基金
新疆师范大学重点实验室基金资助项目(WLYQ2012108)
国家自然科学基金资助项目(61163045)
文摘
集成学习是通过集成多个基分类器共同决策的机器学习技术,通过不同的样本集训练有差异的基分类器,得到的集成分类器可以有效地提高学习效果。在基分类器的训练过程中,可以通过代价敏感技术和数据采样实现不平衡数据的处理。由于集成学习在不平衡数据分类的优势,针对不平衡数据的集成分类算法得到广泛研究。详细分析了不平衡数据集成分类算法的研究现状,比较了现有算法的差异和各自存在的优点及问题,提出和分析了有待进一步研究的问题。
关键词
不平衡数据
集成学习
分类
代价敏感
数据采样
Keywords
imbalanced data
ensemble learning
classification
cost-sensitive
data sampling
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
数据驱动的软件缺陷预测研究综述
被引量:
18
3
作者
李勇
黄志球
王勇
房丙午
机构
南京航空航天
大学
计算机科学与技术学院
新疆师范大学网络信息安全与舆情分析重点实验室
出处
《电子学报》
EI
CAS
CSCD
北大核心
2017年第4期982-988,共7页
基金
国家自然科学基金(No.61562087
No.61272083)
+1 种基金
江苏省普通高校研究生科研创新计划(No.CXLX13-160)
中央高校基本科研业务费专项项目
文摘
数据驱动的软件缺陷预测是提高软件测试效率、保证软件可靠性的重要途径之一,近几年已成为实证软件工程的研究热点.首先介绍了数据驱动软件缺陷预测的研究背景;然后总结了已有软件缺陷数据属性度量方法的特点,并按照软件开发中缺陷预测的使用场景,以数据来源为主线从基于版本内数据、跨版本数据和跨项目数据实现缺陷预测三个方面对近10年(2005~2015)已有的研究工作进行分类归纳和比较;最后对该领域未来的研究趋势进行了展望.
关键词
软件缺陷预测
数据驱动
软件度量
机器学习
Keywords
software defects prediction
data driven
software metrics
machine learning
分类号
TP311.5 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
代价敏感分类的软件缺陷预测方法
被引量:
15
4
作者
李勇
黄志球
房丙午
王勇
机构
南京航空航天
大学
计算机科学与技术学院
新疆师范大学网络信息安全与舆情分析重点实验室
出处
《计算机科学与探索》
CSCD
2014年第12期1442-1451,共10页
基金
国家自然科学基金
教育部人文社会科学研究青年基金项目
+1 种基金
江苏省普通高校研究生科研创新计划资助项目
中央高校基本科研业务费专项资金~~
文摘
软件缺陷预测是提高软件测试效率,保证软件可靠性的重要途径。考虑到软件缺陷预测模型对软件模块错误分类代价的不同,提出了代价敏感分类的软件缺陷预测模型构建方法。针对代码属性度量数据,采用Bagging方式有放回地多次随机抽取训练样本来构建代价敏感分类的决策树基分类器,然后通过投票的方式集成后进行软件模块的缺陷预测,并给出模型构建过程中代价因子最优值的判定选择方法。使用公开的NASA软件缺陷预测数据集进行仿真实验,结果表明该方法在保证缺陷预测率的前提下,误报率明显降低,综合评价指标AUC和F值均优于现有方法。
关键词
软件缺陷预测
代价敏感分类
最优代价因子
决策树
集成算法
Keywords
software defects prediction
cost-sensitive classification
optimal cost-factor
decision tree
ensemble algorithm
分类号
TP311.5 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
结合欠抽样与集成的软件缺陷预测
被引量:
7
5
作者
李勇
机构
南京航空航天
大学
计算机科学与技术学院
新疆师范大学网络信息安全与舆情分析重点实验室
出处
《计算机应用》
CSCD
北大核心
2014年第8期2291-2294,2310,共5页
基金
新疆维吾尔自治区高校科研计划项目(XJEDU2012S28)
教育部人文社会科学研究青年基金资助项目(11YJC870014)
+1 种基金
国家自然科学基金资助项目(61262065)
新疆师范大学重点实验室基金资助项目(WLYQ2012108)
文摘
软件缺陷预测是提高测试效率、保证软件可靠性的重要途径。为了提高软件缺陷预测的准确率,提出一种结合欠抽样与决策树分类器集成的软件缺陷预测模型。考虑到软件缺陷数据的类不平衡特性,首先,通过数据的不平衡率确定抽样度,执行欠抽样实现数据的重新平衡;然后,采用Bagging随机抽样原理训练若干个决策树子分类器;最后,按照少数服从多数的原则生成预测模型。使用公开的NASA软件缺陷预测数据集进行了仿真实验。实验结果表明,与3种基准方法对比,所提模型在保证预报率的前提下,误报率(PF)降低了10%以上,综合评价指标均有显著提升。该模型的缺陷预测误报率较低,而且具有较高的预测准确率与稳定性。
关键词
软件缺陷预测
类不平衡数据
欠抽样
决策树
集成算法
Keywords
software defect prediction
class imbalanced data
under-sampling
decision tree
ensemble algorithm
分类号
TP311.5 [自动化与计算机技术—计算机软件与理论]
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
教学资源概念查询扩展研究
被引量:
2
6
作者
张兰芳
年梅
机构
新疆师范大学网络信息安全与舆情分析重点实验室
出处
《计算机工程与应用》
CSCD
2014年第13期127-132,共6页
基金
国家自然科学基金(No.61163064)
新疆师范大学研究生科技创新项目基金(No.20131204)
新疆师范大学网络信息安全与舆情分析实验室资助(2013年)
文摘
查询扩展是在原查询词的基础上加入与用户查询词相关的词或者词组,组成新的、更准确的查询序列,使扩展后的查询序列能更清晰地表达用户的查询请求,克服自然语言的"二义性"。基于《计算机网络》概念语义网络能更加有效地找出计算机网络领域内查询词的概念词及扩展概念词,并向上拓展将各个查询词的原始语义关系联接起来,解决了查询词之间缺乏联系的问题,为扩展检索的实现奠定基础。描述了概念语义网络的生成方法、关联概念树的抽取方法和查询扩展检索的计算机实现流程,为教学资源领域的在线学习提供了技术支持。
关键词
查询扩展
检索
概念语义网络
《计算机网络》
Keywords
query expansion
retrieval
concept semantic networks
Computer Network
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
一种基于投票的不平衡数据分类集成算法
被引量:
3
7
作者
李勇
机构
新疆师范大学网络信息安全与舆情分析重点实验室
出处
《科学技术与工程》
北大核心
2014年第21期275-279,共5页
基金
新疆自治区高校科研计划项目(XJEDU2012S28)
国家教育部人文社会科学研究青年基金项目(11YJC870014)
新疆师范大学重点实验室基金项目(WLYQ2012108)资助
文摘
不平衡数据分类是机器学习的研究热点之一。传统的机器学习分类算法通常假定用于训练的数据集是平衡的,不能直接应用于不平衡数据分类。利用朴素贝叶斯和决策树对数据不平衡的敏感度不同,提出一种基于投票的不平衡数据分类集成算法。基分类器选择NB和C4.5,通过投票平均方法进行分类决策;并选择公开的不平衡数据集进行实验验证。实验结果表明,该算法能有效提高不平衡数据的分类性能,特别是对正类(少数类)的误报率较低,具有良好的鲁棒性。
关键词
不平衡数据分类
朴素贝叶斯
决策树
投票表决
Keywords
SMD LED visual positioning system rectangle fitting least square method
分类号
TP391.75 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
现代维吾尔语人名汉字音译转写关键技术研究
被引量:
1
8
作者
阿力木.木拉提
艾孜尔古丽
玉素甫.艾白都拉
机构
新疆师范大学网络信息安全与舆情分析重点实验室
出处
《计算机工程与应用》
CSCD
2014年第9期209-213,共5页
基金
国家自然科学基金重点项目(No.61132009)
国家自然科学基金(No.61262066
+5 种基金
No.61063036)
国家语委科研规划项目(No.YB115-38
No.YB125-45)
新疆师范大学研究生创新基金项目(No.20121206)
新疆师范大学重点实验室开放课题(No.WLYQ2012201
No.WLYQ2012204)
文摘
改革开放后,新疆与国内以及国际交往越来越频繁。新疆少数民族人名汉字音译转写缺少统一标准,维吾尔人名汉字音译转写时,在户口上是一种写法,在身份证上另一种写法,在护照上更不一样的用字写法,机票、汇款单等又是一种写法。为解决这些问题,前人作了研究并取得了一定成果以及使用维吾尔人名汉语音译撰写系统来规范维吾尔人名汉语音译。但是这些成果正确率只有52%。利用规则和维吾尔人名特征相结合的方法,提高系统自动维吾尔人名汉语音译正确率30%。介绍该领域研究进展,通论维吾尔音节切分与维吾尔人名特征相结合方法。陈述基于字形的DOM音译框架解决的问题,介绍基于音节切分的维吾尔人名汉字音译转写的实现方法,给出了实验结果与分析。
关键词
维吾尔语
音节切分
维吾尔人名汉字音译转写
自动翻译
Keywords
Uyghur
syllable segmentation
Uyghur name transliteration to Chinese characters
automatic translation
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向网络舆情分析系统的本体应用
李勇
刘战东
《西安石油大学学报(自然科学版)》
CAS
北大核心
2014
2
在线阅读
下载PDF
职称材料
2
不平衡数据的集成分类算法综述
李勇
刘战东
张海军
《计算机应用研究》
CSCD
北大核心
2014
75
在线阅读
下载PDF
职称材料
3
数据驱动的软件缺陷预测研究综述
李勇
黄志球
王勇
房丙午
《电子学报》
EI
CAS
CSCD
北大核心
2017
18
在线阅读
下载PDF
职称材料
4
代价敏感分类的软件缺陷预测方法
李勇
黄志球
房丙午
王勇
《计算机科学与探索》
CSCD
2014
15
在线阅读
下载PDF
职称材料
5
结合欠抽样与集成的软件缺陷预测
李勇
《计算机应用》
CSCD
北大核心
2014
7
在线阅读
下载PDF
职称材料
6
教学资源概念查询扩展研究
张兰芳
年梅
《计算机工程与应用》
CSCD
2014
2
在线阅读
下载PDF
职称材料
7
一种基于投票的不平衡数据分类集成算法
李勇
《科学技术与工程》
北大核心
2014
3
在线阅读
下载PDF
职称材料
8
现代维吾尔语人名汉字音译转写关键技术研究
阿力木.木拉提
艾孜尔古丽
玉素甫.艾白都拉
《计算机工程与应用》
CSCD
2014
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部