期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
统计机器学习中参数可辨识性研究及其关键问题 被引量:3
1
作者 冉智勇 胡包钢 《自动化学报》 EI CSCD 北大核心 2017年第10期1677-1686,共10页
参数可辨识性研究在统计机器学习中具有重要的理论意义和应用价值.参数可辨识性是关于模型参数能否被惟一确定的性质.在包含物理参数的学习模型中,可辨识性不仅是物理参数获得正确估计的前提条件,更重要的是,它反映了学习机器中由参数... 参数可辨识性研究在统计机器学习中具有重要的理论意义和应用价值.参数可辨识性是关于模型参数能否被惟一确定的性质.在包含物理参数的学习模型中,可辨识性不仅是物理参数获得正确估计的前提条件,更重要的是,它反映了学习机器中由参数决定的物理特征.为扩展到未来类人智能机器研究的考察视角,我们将学习模型纳入"知识与数据共同驱动模型"的框架中讨论.在此框架下,我们提出两个关键问题.第一是参数可辨识性准则问题.该问题考察与可辨识性密切相关的各种判断准则,其中知识驱动子模型与数据驱动子模型的耦合方式为参数可辨识性问题提供了新的研究空间.第二是参数可辨识性与机器学习理论和应用相关联的研究.该研究包括可辨识性对参数估计、模型选择、学习算法、学习动态过程、奇异学习理论、贝叶斯推断等内容的深刻影响. 展开更多
关键词 可辨识性 统计机器学习 参数估计 奇异学习理论 贝叶斯推断
在线阅读 下载PDF
机器学习研究 被引量:78
2
作者 王珏 石纯一 《广西师范大学学报(自然科学版)》 CAS 2003年第2期1-15,共15页
由于Internet的使用,不分时间与地域地获得信息已成为现实,但是,如何有效利用这些信息,并使用这些信息提高生产率成为迫切需要解决的问题.机器学习是解决这类问题的有效方法之一.在此将对目前机器学习研究的主要趋势、理论与技术以及存... 由于Internet的使用,不分时间与地域地获得信息已成为现实,但是,如何有效利用这些信息,并使用这些信息提高生产率成为迫切需要解决的问题.机器学习是解决这类问题的有效方法之一.在此将对目前机器学习研究的主要趋势、理论与技术以及存在的问题,根据作者的研究经验进行综述,以便引起研究者的注意. 展开更多
关键词 人工智能 机器学习 统计机器学习 符号机器学习 增强机器学习 信息使用
在线阅读 下载PDF
基于机器学习的多语言文本抽取系统实现 被引量:5
3
作者 曾军 周国富 《计算机应用与软件》 2017年第4期87-92,156,共7页
基于统计机器学习的信息抽取方法正日益成为研究的热点,在研究与应用方面虽然也产生了一些实用的基于机器学习的文本信息抽取框架与系统,但大多面临着交互性弱、可扩展性低、语言移植能力差等缺陷。为此,研究并提出一种通用可行的支持... 基于统计机器学习的信息抽取方法正日益成为研究的热点,在研究与应用方面虽然也产生了一些实用的基于机器学习的文本信息抽取框架与系统,但大多面临着交互性弱、可扩展性低、语言移植能力差等缺陷。为此,研究并提出一种通用可行的支持多语言的信息抽取框架,并基于该框架实现了一个原型系统。原型系统集成了最大熵、支持向量机两种机器学习算法,使用这两种算法对中英文文本的实验验证了系统的实用性。 展开更多
关键词 统计机器学习 信息抽取 多语言 最大熵模型 支持向量机
在线阅读 下载PDF
基于深度学习的领域知识对齐模型研究:知识网络视角 被引量:6
4
作者 余传明 李浩男 安璐 《情报学报》 CSSCI CSCD 北大核心 2020年第5期521-533,共13页
随着大数据的迅速发展,知识网络在不同语言、不同领域和不同模态等情境下呈现高度多样性和复杂性,如何对齐与整合多源情境下的异构知识网络,成为研究者所面临的严峻挑战。本文在知识网络深度表示学习的基础上,提出一种由知识网络构建、... 随着大数据的迅速发展,知识网络在不同语言、不同领域和不同模态等情境下呈现高度多样性和复杂性,如何对齐与整合多源情境下的异构知识网络,成为研究者所面临的严峻挑战。本文在知识网络深度表示学习的基础上,提出一种由知识网络构建、跨语言网络表示学习和统计机器学习三个模块构成的知识网络对齐(knowledge network alignment,KNA)模型。为验证模型的有效性,在中英文双语知识网络数据集上开展实证研究,借助于网络表示学习算法将异构知识网络表征到同一空间,利用已知的对齐链接来训练统计机器学习模型,并通过模型来预测未知的节点对齐链接。KNA模型在跨语言共词网络对齐任务中取得Precision@1值为0.7731,高于基线方法 (0.6806),验证了KNA模型在跨语言知识网络对齐上的有效性。研究结果对于改进知识网络的节点对齐效果,促进多源情境下的异构知识网络融合具有重要意义。 展开更多
关键词 领域知识对齐 知识网络 深度学习 网络表示学习 统计机器学习
在线阅读 下载PDF
基于加速骨干二元粒子群优化的样本规约方法
5
作者 罗少甫 刘河 《统计与决策》 CSSCI 北大核心 2024年第22期59-64,共6页
样本规约方法是统计机器学习中的杰出数据预处理范式,能从有标记训练集中移除冗余样本和噪声,从而提升分类统计算法的性能。虽然学者们提出了大量基于进化算法的样本规约方法,并证明了其有效性,但是现有基于进化算法的样本规约方法依赖... 样本规约方法是统计机器学习中的杰出数据预处理范式,能从有标记训练集中移除冗余样本和噪声,从而提升分类统计算法的性能。虽然学者们提出了大量基于进化算法的样本规约方法,并证明了其有效性,但是现有基于进化算法的样本规约方法依赖太多参数。而且随着有标记训练集中的样本数量增加,现有基于进化算法的样本规约方法的搜索效率较低且时间成本较高。为了克服上述问题,文章提出一种基于加速骨干二元粒子群优化的样本规约方法(SRM-HBPSO)。在SRM-HBPSO中,首先,设计了一种结合搜索空间约简策略的加速骨干二元粒子群优化算法(HBPSO);其次,用HBPSO优化有标记训练集,从而得到一个被优化的约简子集;最后,SRM-HBPSO在被优化的约简子集上训练给定的分类统计算法,从而改进其性能。经仿真实验证明,就改进随机森林分类统计算法的平均分类正确率和提升平均样本约简率而言,在来自金融、医疗、图像等领域的10个真实基准数据集上,SRM-HBPSO优于5个先进的样本规约算法。 展开更多
关键词 统计机器学习 分类统计算法 样本规约 随机森林 搜索空间约简策略
在线阅读 下载PDF
融合句法结构变换与词汇语义特征的文本蕴涵识别 被引量:5
6
作者 张志昌 姚东任 +2 位作者 刘霞 陈松毅 鲁小勇 《计算机工程》 CAS CSCD 北大核心 2015年第9期199-204,共6页
传统文本蕴涵识别方法仅停留在词汇级的识别,无法涉及句法、语义等方面,造成识别结果的F值较低。针对该问题,提出一种将句法结构的变换和传统词汇语义特征结合的中文文本蕴涵识别方法。对文本进行基于句法分析树变换的预处理,将句法分... 传统文本蕴涵识别方法仅停留在词汇级的识别,无法涉及句法、语义等方面,造成识别结果的F值较低。针对该问题,提出一种将句法结构的变换和传统词汇语义特征结合的中文文本蕴涵识别方法。对文本进行基于句法分析树变换的预处理,将句法分析中适用于文本蕴涵识别的特征加入到相关的统计和词汇语义特征中,使用统计机器学习的方法对由文本片段T和假设的文本片段H组成的文本对进行蕴涵关系分类,并经过语义规则的修正处理得到最终的识别结果。在NTCIR RITE3上的评测结果表明,与III&CYUT,Yamraj等相比,该方法能获得较高的F值。 展开更多
关键词 中文文本蕴涵 句法结构变换 词汇语义特征 词汇统计特征 统计机器学习
在线阅读 下载PDF
基于近邻规则和粒子群优化的半监督自标记方法 被引量:1
7
作者 周鹏 刘河 黎隽男 《统计与决策》 CSSCI 北大核心 2023年第18期44-49,共6页
自标记方法能用少量有标记样本和大量无标记样本来训练给定分类模型。误标记是自标记方法中的主要挑战。尽管学者们用数据剪辑技术去识别和移除在自标记方法迭代过程中被误预测的样本,但是许多数据剪辑技术严重依赖于特定假设。为了克... 自标记方法能用少量有标记样本和大量无标记样本来训练给定分类模型。误标记是自标记方法中的主要挑战。尽管学者们用数据剪辑技术去识别和移除在自标记方法迭代过程中被误预测的样本,但是许多数据剪辑技术严重依赖于特定假设。为了克服误标记问题和相关解决方案中的缺陷,文章提出一种基于近邻规则和粒子群优化的自标记方法SLM-NNPSO。首先,SLM-NNPSO用有标记集去训练一个给定的分类模型。其次,SLM-NNPSO用近邻规则来发现具有高置信度的无标记样本,并用被训练的分类模型来预测他们。再次,SLM-NNPSO用粒子优化来识别和移除被误预测的样本,并把被正确预测的样本加入有标记集中。上述过程不断迭代,直到SLM-NNPSO没有发现具有高置信度的无标记样本。最后,SLM-NNPSO输出在迭代过程中被训练的分类模型。经仿真实验证明,就训练k近邻分类器的平均分类正确率而言,在来自销售市场、医学检测、图像识别等领域的12个真实数据集上,SLM-NNPSO优于5个流行的自标记方法。 展开更多
关键词 统计机器学习 数据挖掘 半监督分类 自标记方法 粒子群优化算法 智能管理
在线阅读 下载PDF
Log integration on large scale for global networking monitoring
8
作者 缪嘉嘉 吴泉源 贾焰 《Journal of Central South University》 SCIE EI CAS 2009年第6期976-981,共6页
Supposing that the overall situation is dug out from the distributed monitoring nodes, there should be two critical obstacles, heterogenous schema and instance, to integrating heterogeneous data from different monitor... Supposing that the overall situation is dug out from the distributed monitoring nodes, there should be two critical obstacles, heterogenous schema and instance, to integrating heterogeneous data from different monitoring sensors. To tackle the challenge of heterogenous schema, an instance-based approach for schema mapping, named instance-based machine-learning (IML) approach was described. And to solve the problem of heterogenous instance, a novel approach, called statistic-based clustering (SBC) approach, which utilized clustering and statistics technologies to match large scale sources holistically, was also proposed. These two algorithms utilized the machine-leaning and clustering technology to improve the accuracy. Experimental analysis shows that the IML approach is more precise than SBC approach, reaching at least precision of 81% and recall rate of 82%. Simulation studies further show that SBC can tackle large scale sources holisticalty with 85% recall rate when there are 38 data sources. 展开更多
关键词 MACHINE-LEARNING CLUSTERING data integration schema matching instance matching
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部