期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于语义联系的新闻网页关键词抽取 被引量:10
1
作者 谢飞 吴信东 +2 位作者 胡学钢 李星华 江兆中 《广西师范大学学报(自然科学版)》 CAS 北大核心 2009年第1期145-148,共4页
提出一种基于语义联系的新闻网页关键词抽取方法,不仅考虑了词语在知识库《知网》中的语义相似度,还考虑词语在具体上下文中的相关性,用词汇链将词语语义联系表示成图形式,在此基础上抽取出新闻网页关键词。对从网易网站选取120篇有核... 提出一种基于语义联系的新闻网页关键词抽取方法,不仅考虑了词语在知识库《知网》中的语义相似度,还考虑词语在具体上下文中的相关性,用词汇链将词语语义联系表示成图形式,在此基础上抽取出新闻网页关键词。对从网易网站选取120篇有核心提示的新闻网页进行测试,实验结果表明,所提出的方法比基于词频的关键词抽取方法和基于《知网》语义相似度构建词汇链的关键词抽取方法,在准确率和召回率上有很大的提高,当抽取关键词个数为3时,比基于词频方法的准确率和召回率分别提高了27.77%和21.38%。 展开更多
关键词 关键词抽取 词汇链 语义联系
在线阅读 下载PDF
药物-疾病关系预测:一种推荐系统模型 被引量:6
2
作者 汪浩 王海平 +1 位作者 吴信东 刘琦 《中国药理学通报》 CAS CSCD 北大核心 2015年第12期1770-1774,共5页
目的药物重定位是指发掘已有药物新的治疗作用,然而具有潜在治疗作用的药物-疾病往往隐藏在数以百万计的关系对中。该研究基于医疗大数据分析,预测具有潜在治疗关系的药物-疾病关系对。方法将社交网络中推荐系统模型应用于药物重定位研... 目的药物重定位是指发掘已有药物新的治疗作用,然而具有潜在治疗作用的药物-疾病往往隐藏在数以百万计的关系对中。该研究基于医疗大数据分析,预测具有潜在治疗关系的药物-疾病关系对。方法将社交网络中推荐系统模型应用于药物重定位研究,并假设具有相似化学结构的药物可能具有相似的适应症。从开源数据库收集已知药物-疾病的治疗关系、副作用关系以及药物和疾病特征描述符,计算得到药物-药物的相似度和疾病-疾病相似度,再构建推荐模型将上述信息融合,并预测具有潜在治疗关系的药物-疾病,最终得到预测关系对的排序列表。结果列表排名前500的关系对中,有12.8%得到临床实验支持或综述报道,20%得到模式生物实验或细胞实验支持。结论相比于已有分类模型和随机抽样结果,本模型可明显提高具有潜在治疗作用药物-疾病的富集程度。 展开更多
关键词 药物重定位 医药大数据 推荐系统 相似性度量 协同过滤 药物和疾病关系预测 机器学习
在线阅读 下载PDF
普适医疗信息管理与服务的关键技术与挑战 被引量:47
3
作者 吴信东 叶明全 +3 位作者 胡东辉 吴共庆 胡学钢 王浩 《计算机学报》 EI CSCD 北大核心 2012年第5期827-845,共19页
随着区域医疗、移动医疗、转化医学等新兴技术的应用和发展,电子病历、电子健康档案及转化基因等数据都呈现出爆炸式增长.为了将医疗服务信任问题渗透到人与医疗信息系统可信交互中,提供以个性化、一体化、协同化与知识化为特征的现代... 随着区域医疗、移动医疗、转化医学等新兴技术的应用和发展,电子病历、电子健康档案及转化基因等数据都呈现出爆炸式增长.为了将医疗服务信任问题渗透到人与医疗信息系统可信交互中,提供以个性化、一体化、协同化与知识化为特征的现代医疗服务,必须有效管理和分析这些海量数据资源,达到医疗信息与服务普适共享、广大民众普遍受惠的目的.文中以社会计算为背景,提出一种面向现代医疗服务模式的普适医疗信息管理与服务体系PMIMSS,讨论了普适医疗面临的关键技术问题,包括医疗信息共享与集成、医疗知识发现与服务、医疗服务质量评价、个性化医疗服务推荐,以及基于人与医疗信息系统交互的可信机制等,并总结了当前的研究现状和进展,详细分析了存在的挑战性问题,提出了未来的研究方向. 展开更多
关键词 普适医疗 可信机制 医疗知识发现 医疗服务推荐 服务质量评价 医疗信息管理
在线阅读 下载PDF
在线社交网络影响力分析 被引量:120
4
作者 吴信东 李毅 李磊 《计算机学报》 EI CSCD 北大核心 2014年第4期735-752,共18页
社交影响力分析是社交网络分析的关键问题之一.近十几年间,随着在线社交网络的蓬勃发展,研究人员才开始有机会在大量现实数据的基础上对社交影响力进行建模和分析,并取得了丰硕的研究成果和广泛的应用价值.文中回顾了近些年在线社交网... 社交影响力分析是社交网络分析的关键问题之一.近十几年间,随着在线社交网络的蓬勃发展,研究人员才开始有机会在大量现实数据的基础上对社交影响力进行建模和分析,并取得了丰硕的研究成果和广泛的应用价值.文中回顾了近些年在线社交网络影响力分析的主要成果,阐述了社交影响力的相关概念和它们之间的关系,重点从网络拓扑、用户行为和交互信息等几个方面总结了影响力分析的建模和度量方法,介绍了与影响力传播密切相关的意见领袖发现和影响力最大传播问题的研究现状,并对在线社交网络影响力分析的前景进行了展望. 展开更多
关键词 在线社交网络 社交影响力 方法和模型 影响力最大传播 意见领袖发现 社会计算
在线阅读 下载PDF
周期性一般间隙约束的序列模式挖掘 被引量:12
5
作者 武优西 周坤 +2 位作者 刘靖宇 江贺 吴信东 《计算机学报》 EI CSCD 北大核心 2017年第6期1338-1352,共15页
序列模式挖掘是从给定序列中发现出现频率高的模式的一种方法,目前已在诸多领域被广泛应用.假定子模式p_i和p_j(i<j)可以分别匹配事件A和事件B,传统的序列模式挖掘方法能够对事件B在事件A之后的序列进行检测,而不能对事件B发生在事件... 序列模式挖掘是从给定序列中发现出现频率高的模式的一种方法,目前已在诸多领域被广泛应用.假定子模式p_i和p_j(i<j)可以分别匹配事件A和事件B,传统的序列模式挖掘方法能够对事件B在事件A之后的序列进行检测,而不能对事件B发生在事件A之前的序列进行识别.为了解决此问题,文中提出了周期性一般间隙约束的序列模式挖掘问题,该问题具有如下5个特点:间隙约束的最小值可为负值的一般间隙约束;每个间隙约束都相同的周期性模式;在支持数统计方面无特殊约束,即允许序列中事件多次使用;该挖掘问题满足Apriori性质;挖掘支持率大于给定的频繁度阈值的频繁模式.为了进行有效地挖掘,采用深度优先的方式建立模式树.文中采用模式匹配技术,在一遍扫描序列数据库的情况下,建立其所有超模式的不完整网树森林(不完整网树是网树的最后一层结点,可以存储在一个数组中,可以有效地表示一个模式在一个序列中的支持数),并对这些超模式的支持率进行有效地计算,进而挖掘出所有频繁模式,有效地提高了序列模式挖掘速度.实验结果验证了文中算法的可行性和有效性. 展开更多
关键词 序列模式挖掘 一般间隙 频繁模式 模式匹配 APRIORI性质 人工智能
在线阅读 下载PDF
一种求解MPMGOOC问题的启发式算法 被引量:21
6
作者 武优西 吴信东 +1 位作者 江贺 闵帆 《计算机学报》 EI CSCD 北大核心 2011年第8期1452-1462,共11页
具有间隙约束和一次性条件的最大模式匹配(Maximum Pattern Matching with Gaps and One-Off Condition,MPMGOOC)是一种具有通配符长度约束的模式匹配问题,其任务是寻找彼此互不相关的最多出现.文中基于一种新的非线性数据结构——网树... 具有间隙约束和一次性条件的最大模式匹配(Maximum Pattern Matching with Gaps and One-Off Condition,MPMGOOC)是一种具有通配符长度约束的模式匹配问题,其任务是寻找彼此互不相关的最多出现.文中基于一种新的非线性数据结构——网树,提出了一种解决MPMGOOC问题的启发式算法.与树结构不同之处在于,除根结点外,网树中任何结点可以多于1个双亲结点.文中给出了网树的定义及其相关的概念和性质.基于这些概念和性质,提出了一种选择较优出现(Selecting Better Occurrence,SBO)的启发式算法.该算法在搜索一个出现的循环中,采用了贪婪搜索双亲策略(Strategy of Greedy-Search Parent,SGSP)和最右双亲策略(Strategy of RightMostParent,SRMP)寻找相同叶子的两个出现并选择其中较好的出现作为SBO算法的结果.SGSP策略的核心思想是每一步都寻找当前结点的一个近似最优双亲(Approximately Optimimal Parent,AOP);SRMP策略的核心思想是每一步都寻找当前结点的最右双亲结点.实验结果表明,在多数情况下SBO算法可以获得更好的解且解的质量较其它算法有显著的提高.文中不但提供了一个解决MPMGOOC问题的启发式算法,更重要的是对于求解其它复杂问题具有一定的参考价值. 展开更多
关键词 模式匹配 通配符 一次性条件 网树 启发式算法
在线阅读 下载PDF
利用项集有序特性改进Apriori算法 被引量:11
7
作者 刘美玲 徐章艳 +3 位作者 卢景丽 区玉明 袁鼎荣 吴信东 《广西师范大学学报(自然科学版)》 CAS 2004年第1期33-37,共5页
Apriori算法是挖掘关联规则的一个经典算法,通过分析、研究该算法的基本思想,并利用项集的有序特性对其进行改进,减少了生成的候选集数量,从而提高算法的效率.
关键词 APRIORI算法 挖掘关联规则 非频繁项集 有序特性 数据挖掘
在线阅读 下载PDF
从大数据到大知识:HACE+BigKE 被引量:52
8
作者 吴信东 何进 +1 位作者 陆汝钤 郑南宁 《自动化学报》 EI CSCD 北大核心 2016年第7期965-982,共18页
大数据面向异构自治的多源海量数据,旨在挖掘数据间复杂且演化的关联.随着数据采集存储和互联网技术的发展,大数据分析和应用已成为各行各业的研发热点.本文从大数据的本质特征开始,评述现有的几种大数据模型,包括5V,5R,4P和HACE定理,... 大数据面向异构自治的多源海量数据,旨在挖掘数据间复杂且演化的关联.随着数据采集存储和互联网技术的发展,大数据分析和应用已成为各行各业的研发热点.本文从大数据的本质特征开始,评述现有的几种大数据模型,包括5V,5R,4P和HACE定理,同时从知识建模的角度,介绍一种大数据知识工程模型Big KE来生成大知识,并对大知识的前景进行展望. 展开更多
关键词 大数据 知识挖掘 异构 碎片化知识 在线学习
在线阅读 下载PDF
多细胞基因表达式编程的函数优化算法 被引量:8
9
作者 彭昱忠 元昌安 +2 位作者 陈建伟 吴信东 王汝凉 《控制理论与应用》 EI CAS CSCD 北大核心 2010年第11期1585-1589,共5页
针对处理复杂的函数优化问题时传统演化算法易出现收敛性能不佳、搜索冗长和精度不高等问题,提出了一种基于多细胞基因表达式编程的函数优化新算法.该算法引入了同源基因和细胞系统思想,设计了相应新的个体编码方案、种群生成和遗传操... 针对处理复杂的函数优化问题时传统演化算法易出现收敛性能不佳、搜索冗长和精度不高等问题,提出了一种基于多细胞基因表达式编程的函数优化新算法.该算法引入了同源基因和细胞系统思想,设计了相应新的个体编码方案、种群生成和遗传操作策略.通过对8个Benchmarks函数的对比实验,验证了该算法具有很强的全局寻优能力、较佳的收敛性能和更高的解精度. 展开更多
关键词 函数优化 演化算法 基因表达式编程 同源基因 细胞系统
在线阅读 下载PDF
基于种子节点选择的网络环境下多标签分类算法研究 被引量:3
10
作者 吴信东 赵银凤 李磊 《电子学报》 EI CAS CSCD 北大核心 2016年第9期2074-2080,共7页
多标签分类在基因分类,药物发现和文本分类等实际问题中有着广泛的应用.已存在的多标签分类算法,通常都是从网络中随机的选取节点作为训练集.然而,在分类算法执行的过程中,网络中不同节点所起的作用不同.在给定训练集数目的情况下,选择... 多标签分类在基因分类,药物发现和文本分类等实际问题中有着广泛的应用.已存在的多标签分类算法,通常都是从网络中随机的选取节点作为训练集.然而,在分类算法执行的过程中,网络中不同节点所起的作用不同.在给定训练集数目的情况下,选择的训练集不同,分类精度也会不同.所以我们引入了种子节点的概念,标签分类从种子节点开始,经过不断推理,得到网络中其他所有节点的标签.本文提出了SHDA(Nodes Selection of High Degree from Each Affiliation)算法,即从网络的每个社团中,按比例的选取度数较大的节点,然后将其合并,处理后得到种子节点.真实数据集上的实验表明,将种子节点用作训练集进行多标签分类,能够提升网络环境下多标签分类的准确率. 展开更多
关键词 多标签分类 网络 种子节点 推理 社团
在线阅读 下载PDF
从大数据到大知识:HACE+BigKE 被引量:11
11
作者 吴信东 《计算机科学》 CSCD 北大核心 2016年第7期3-6,共4页
本报告主要包括:1)大数据研究背景与动机;2)5V,5R,4P与HACE定理;3)大数据知识工程;4)大知识的挑战与前景展望4个方面的内容。1大数据的研究背景与动机20世纪90年代,"数据仓库之父"Bill Inmon开始关注大数据(海量数据)。简而言... 本报告主要包括:1)大数据研究背景与动机;2)5V,5R,4P与HACE定理;3)大数据知识工程;4)大知识的挑战与前景展望4个方面的内容。1大数据的研究背景与动机20世纪90年代,"数据仓库之父"Bill Inmon开始关注大数据(海量数据)。简而言之,大数据是无法在合理的时间内利用现有的数据处理手段进行诸如存储、管理、抓取等分析和处理的数据集合。 展开更多
关键词 HACE+BigKE 知识工程 知识获取 知识推理 专家系统 陆汝钤 评价系统 分析算法 并行处理 多模态
在线阅读 下载PDF
带任意长度通配符的模式匹配 被引量:5
12
作者 强继朋 谢飞 +2 位作者 高隽 胡学钢 吴信东 《自动化学报》 EI CSCD 北大核心 2014年第11期2499-2511,共13页
基因序列中,许多病毒并不是简单的直接复制自己,而是相邻字符间插入或者删除序列片段,如何从序列数据中检索这些病毒具有重要的研究价值.提出了一个更普遍的问题,带任意长度通配符的模式匹配问题(Pattern matching with arbitrary-lengt... 基因序列中,许多病毒并不是简单的直接复制自己,而是相邻字符间插入或者删除序列片段,如何从序列数据中检索这些病毒具有重要的研究价值.提出了一个更普遍的问题,带任意长度通配符的模式匹配问题(Pattern matching with arbitrary-length wildcards,PMAW),这里模式中不仅可以有多个通配符约束,而且每个通配符的约束可以是两个整数,也可以从整数到无穷大.给定序列S和带通配符的模式P,目标是从S中检索P的所有出现和每一次出现的匹配位置,并且要求任意两次出现不能共享序列中同一位置.为了有效地解决该问题,设计了两个基于位并行的匹配算法MOTW(Method of ocurrence then window)算法和MWTO(Method of window then ocurrence)算法.同时,MWTO算法进行细微改动就可以满足全局长度约束.实验结果既验证了算法求解问题的正确性,又验证了比相关的模式匹配算法具有更好的时间性能. 展开更多
关键词 通配符 模式匹配 位并行 基因序列
在线阅读 下载PDF
基于图和LDA主题模型的关键词抽取算法 被引量:38
13
作者 刘啸剑 谢飞 吴信东 《情报学报》 CSSCI 北大核心 2016年第6期664-672,共9页
关键词是表达文档核心内容的最小单元。自动抽取一篇或多篇文档的关键词,较传统的人工标注关键词,能节省大量的时间和人力消耗。本文提出了一种基于图和主题模型的关键词抽取算法,首先利用LDA主题模型,计算出词与词之间的相似性,作为词... 关键词是表达文档核心内容的最小单元。自动抽取一篇或多篇文档的关键词,较传统的人工标注关键词,能节省大量的时间和人力消耗。本文提出了一种基于图和主题模型的关键词抽取算法,首先利用LDA主题模型,计算出词与词之间的相似性,作为词与词之间的权重并构建一个带权无向词图。与传统TextRank不同的是,图的节点不再是单个的词,而是选择短语作为图的节点。最后,再从这些短语节点中选择Top K个词作为文章的关键词。我们选择了两个公开数据集进行了实验,结果表明我们的算法优于现有的关键词抽取算法。 展开更多
关键词 关键词抽取 LDA主题模型 TextRank图
在线阅读 下载PDF
基于密度聚类模式的中文新闻网页关键词提取 被引量:2
14
作者 尹倩 胡学钢 +1 位作者 谢飞 吴信东 《广西师范大学学报(自然科学版)》 CAS 北大核心 2009年第1期201-204,共4页
关键词在文本聚类/分类、自动摘要、信息检索等领域具有重要地位,然而当前互联网上的众多新闻网页没有提供关键词,人工标注关键词代价巨大,并且大多数已有的关键词自动提取算法都需要建立在人工标注的训练集之上,因而难以实用。由于关... 关键词在文本聚类/分类、自动摘要、信息检索等领域具有重要地位,然而当前互联网上的众多新闻网页没有提供关键词,人工标注关键词代价巨大,并且大多数已有的关键词自动提取算法都需要建立在人工标注的训练集之上,因而难以实用。由于关键词是文章中较重要且主题关联较凝聚的词的集合,因此提出一种基于密度聚类模式的中文新闻网页关键词提取方法,根据词语之间的共现信息,对网页分词后的词语进行聚类,在分析词语关联度的基础上提取出反映新闻主题的关键词。通过大量随机新闻网页实验结果表明,与单纯的TF/IDF(词频和文档频率倒数的乘积)方法相比,此算法召回率平均提高了7.15%,准确率平均提高了7.075%。 展开更多
关键词 关键词提取 词共现 聚类 自然语言处理
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部