期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
7
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种基于概率主题模型的命名实体链接方法
被引量:
32
1
作者
怀宝兴
宝腾飞
+1 位作者
祝恒书
刘淇
《软件学报》
EI
CSCD
北大核心
2014年第9期2076-2087,共12页
命名实体链接(named entity linking,简称NEL)是把文档中给定的命名实体链接到知识库中一个无歧义实体的过程,包括同义实体的合并、歧义实体的消歧等.该技术可以提升在线推荐系统、互联网搜索引擎等实际应用的信息过滤能力.然而,实体数...
命名实体链接(named entity linking,简称NEL)是把文档中给定的命名实体链接到知识库中一个无歧义实体的过程,包括同义实体的合并、歧义实体的消歧等.该技术可以提升在线推荐系统、互联网搜索引擎等实际应用的信息过滤能力.然而,实体数量的激增给实体消歧等带来了巨大挑战,使得当前的命名实体链接技术越来越难以满足人们对链接准确率的要求.考虑到文档中的词和实体往往具有不同的语义主题(如"苹果"既能表示水果又可以是某电子品牌),而同一文档中的词与实体应当具有相似的主题,因此提出在语义层面对文档进行建模和实体消歧的思想.基于此设计一种完整的、基于概率主题模型的命名实体链接方法.首先,利用维基百科(Wikipedia)构建知识库;然后,利用概率主题模型将词和命名实体映射到同一个主题空间,并根据实体在主题空间中的位置向量,把给定文本中的命名实体链接到知识库中一个无歧义的命名实体;最后,在真实的数据集上进行大量实验,并与标准方法进行对比.实验结果表明:所提出的框架能够较好地解决了实体歧义问题,取得了更高的实体链接准确度.
展开更多
关键词
命名实体链接
概率主题模型
维基百科
在线阅读
下载PDF
职称材料
基于用户查询日志的命名实体挖掘
被引量:
8
2
作者
翟海军
郭嘉丰
+1 位作者
王小磊
许洪波
《中文信息学报》
CSCD
北大核心
2010年第1期71-76,116,共7页
针对大规模查询日志中丰富的命名实体的挖掘是数据挖掘领域中的重要研究课题。已有的研究工作提出了一种基于种子实体的抽取框架,利用实体间的分布相似度进行挖掘。然而该工作只有当种子实体仅属于单个语义类别时才能取得好的结果,实际...
针对大规模查询日志中丰富的命名实体的挖掘是数据挖掘领域中的重要研究课题。已有的研究工作提出了一种基于种子实体的抽取框架,利用实体间的分布相似度进行挖掘。然而该工作只有当种子实体仅属于单个语义类别时才能取得好的结果,实际上命名实体往往可能从属于多个类别。该文通过引入一个弱指导话题模型,利用少量的人工指导信息,很好地解决了实体的类别模糊性,提高了挖掘的有效性。实验表明该文提出的方法在实体挖掘性能上显著优于已有的方法。
展开更多
关键词
计算机应用
中文信息处理
分开命名实体
用户查询日志
话题模型
在线阅读
下载PDF
职称材料
基于半监督话题模型的用户查询日志命名实体挖掘
被引量:
6
3
作者
曹雷
郭嘉丰
+1 位作者
白露
程学旗
《中文信息学报》
CSCD
北大核心
2012年第5期26-32,共7页
基于用户查询日志的命名实体挖掘,目标是从用户查询日志中挖掘具有指定类别的命名实体。已有研究工作提出一种基于种子实体的挖掘方法,利用实体类别与候选实体之间的模板分布相似性来对候选实体进行排序。然而该挖掘方法忽略了命名实体...
基于用户查询日志的命名实体挖掘,目标是从用户查询日志中挖掘具有指定类别的命名实体。已有研究工作提出一种基于种子实体的挖掘方法,利用实体类别与候选实体之间的模板分布相似性来对候选实体进行排序。然而该挖掘方法忽略了命名实体具有歧义性、查询模板具有多义性和未标注实体信息,因而不能够有效的对候选实体进行排序。该文采用半监督话题模型,利用查询模板之间的关系来学习实体类别的模板分布,进而改善候选实体的排序效果。实验结果表明了该文提出方法的有效性。
展开更多
关键词
用户查询日志
命名实体挖掘
半监督话题模型
在线阅读
下载PDF
职称材料
基于反馈报道的话题模型动态修正方法
被引量:
3
4
作者
郑燕
鲁燃
赵爱华
《计算机应用》
CSCD
北大核心
2012年第5期1343-1346,共4页
在话题追踪过程中,由于给定的初始话题相关报道少,而且话题具有动态演变的特点造成话题模型不准确。针对这一问题,提出了利用动态阈值收集反馈报道构造话题修正模型,实现了话题模型的动态修正;同时结合命名实体能够更加有效地区分不同...
在话题追踪过程中,由于给定的初始话题相关报道少,而且话题具有动态演变的特点造成话题模型不准确。针对这一问题,提出了利用动态阈值收集反馈报道构造话题修正模型,实现了话题模型的动态修正;同时结合命名实体能够更加有效地区分不同话题的特性,提出了在修正话题模型时增大相关命名实体权重的方法,从而获得更准确的话题表示模型。实验结果表明,该方法能有效避免话题漂移现象,降低话题追踪过程中的漏报率和错报率。
展开更多
关键词
话题追踪
话题模型
动态阈值
命名
实体
反馈报道
在线阅读
下载PDF
职称材料
医学信息领域人工智能技术的主题漂移与未来展望——基于JCR 26本医学信息期刊文本的命名实体识别
被引量:
5
5
作者
徐璐璐
杨嘉乐
康乐乐
《现代情报》
CSSCI
2022年第10期163-176,共14页
[目的/意义]在过去数十年中,医学信息研究领域被人工智能技术的重构。为厘清人工智能技术发展对医学信息研究领域带来的影响,本研究采用命名实体对医学信息领域人工智能技术进行识别,深入揭示其主题漂移特征与演化趋势,并提出3点未来展...
[目的/意义]在过去数十年中,医学信息研究领域被人工智能技术的重构。为厘清人工智能技术发展对医学信息研究领域带来的影响,本研究采用命名实体对医学信息领域人工智能技术进行识别,深入揭示其主题漂移特征与演化趋势,并提出3点未来展望。[方法/过程]研究中首先采集了JCR中26本医学信息期刊题录信息,而后利用Vosviewer可视化分析人工智能技术的总体分布,在此基础上采用3种深度学习模型对人工智能技术进行命名实体识别和对比,最后分5个时间段梳理其主题漂移并提出3点展望。[结果/结论]Vosviewer可视化显示20年来人工智能技术在医学信息领域占据重要地位;3种深度学习模型对比发现,基于Attention的Bi LSTM-CRF模型的命名实体识别结果最优,F1值提高到88.40%;在5个时间段内,医学信息领域人工智能主流技术以高、中频词为代表围绕着传统型技术且相对稳定,分支技术以低频词为代表则出现深度学习等复杂性技术且随时间有所改变,并呈现直觉(经验发掘)→支持(深入理解)→策略(强化分析)→后推理(支撑决策)→前推理(提前预测);即整体进入较为理性和务实状态,尚缺爆发性变革但确有一定程度变化的主题漂移演化脉络。对此,本文从技术、应用和并行层面提出3点未来展望,以期加强对人工智能在处理医学信息上优、缺点的认知,为更精准地挖掘多源数据提供优质医学诊断具有理论和现实意义。
展开更多
关键词
医学信息
人工智能技术
命名实体
主题漂移
BERT模型
双向长短期记忆网络
条件随机场
注意力机制
在线阅读
下载PDF
职称材料
基于词向量聚类的中文微博产品命名实体识别
被引量:
8
6
作者
王洪亮
《兰州理工大学学报》
CAS
北大核心
2017年第1期104-110,共7页
随着微博等社交平台的兴起,如何针对微博数据进行产品命名实体识别成为了自然语言处理领域研究的热点之一,也是实现舆情监督和商业智能的基础.传统的命名实体识别技术没有考虑中文微博口语化、不规范等特点,且忽略了深层语义对命名实体...
随着微博等社交平台的兴起,如何针对微博数据进行产品命名实体识别成为了自然语言处理领域研究的热点之一,也是实现舆情监督和商业智能的基础.传统的命名实体识别技术没有考虑中文微博口语化、不规范等特点,且忽略了深层语义对命名实体识别的重要作用.因此,考虑中文微博的特殊性,提出一种融合全局上下文信息的词向量特征选择方法,分别采用主题模型和神经网络词向量聚类两种方法获取深层语义信息,并结合层叠条件随机场进行中文微博的命名实体识别.实验结果表明,基于词向量聚类的中文微博产品命名实体识别方法取得了较好的效果.
展开更多
关键词
中文微博
命名实体
主题模型
神经网络
词向量
在线阅读
下载PDF
职称材料
基于功能分解结构模型的工程知识自动提取与组织方法
7
作者
赵书彬
徐诚
《兵工学报》
EI
CAS
CSCD
北大核心
2020年第10期1950-1961,共12页
知识的提取与重用对提高工程设计效率、减少设计活动中的重复工作有着重要意义,针对工程领域知识形式的多样化、结构化等特点,提出一种基于功能分解结构模型的半自动化知识提取方法。通过功能分解完成结构模板的构建;采用命名实体识别...
知识的提取与重用对提高工程设计效率、减少设计活动中的重复工作有着重要意义,针对工程领域知识形式的多样化、结构化等特点,提出一种基于功能分解结构模型的半自动化知识提取方法。通过功能分解完成结构模板的构建;采用命名实体识别技术从工程文本中提取设计相关关键信息;进一步基于隐含狄利克雷分布模型完成文本主题聚类,在此基础上实现关键信息与功能分解结构的关联;在提出该方法与流程的基础上,完成原型系统的设计与开发,并以自动武器概念设计以及闭锁机构的设计为例展示了完整的功能分解以及知识提取过程。研究结果表明:半自动知识提取方法能有效地减少知识提取过程中的人为工作;知识重用适应工程领域的设计思路,可向设计者提供相关的领域知识。
展开更多
关键词
自动武器
知识提取
知识重用
命名实体识别
主题模型
在线阅读
下载PDF
职称材料
题名
一种基于概率主题模型的命名实体链接方法
被引量:
32
1
作者
怀宝兴
宝腾飞
祝恒书
刘淇
机构
中国科学技术大学计算机科学与技术学院
出处
《软件学报》
EI
CSCD
北大核心
2014年第9期2076-2087,共12页
基金
国家杰出青年科学基金(61325010)
国家高技术研究发展计划(863)(2014AA015203)
+3 种基金
安徽省科技专项资金(13Z02008-5)
安徽省国际科技合作计划(1303063008)
安徽省科技攻关计划(1301022064)
安徽省自然科学基金(1408085QF110)
文摘
命名实体链接(named entity linking,简称NEL)是把文档中给定的命名实体链接到知识库中一个无歧义实体的过程,包括同义实体的合并、歧义实体的消歧等.该技术可以提升在线推荐系统、互联网搜索引擎等实际应用的信息过滤能力.然而,实体数量的激增给实体消歧等带来了巨大挑战,使得当前的命名实体链接技术越来越难以满足人们对链接准确率的要求.考虑到文档中的词和实体往往具有不同的语义主题(如"苹果"既能表示水果又可以是某电子品牌),而同一文档中的词与实体应当具有相似的主题,因此提出在语义层面对文档进行建模和实体消歧的思想.基于此设计一种完整的、基于概率主题模型的命名实体链接方法.首先,利用维基百科(Wikipedia)构建知识库;然后,利用概率主题模型将词和命名实体映射到同一个主题空间,并根据实体在主题空间中的位置向量,把给定文本中的命名实体链接到知识库中一个无歧义的命名实体;最后,在真实的数据集上进行大量实验,并与标准方法进行对比.实验结果表明:所提出的框架能够较好地解决了实体歧义问题,取得了更高的实体链接准确度.
关键词
命名实体链接
概率主题模型
维基百科
Keywords
named
entity
linking
probabilistic
topic
model
s
Wikipedia
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于用户查询日志的命名实体挖掘
被引量:
8
2
作者
翟海军
郭嘉丰
王小磊
许洪波
机构
中国科学技术大学计算机学院
中国科学院计算技术研究所
出处
《中文信息学报》
CSCD
北大核心
2010年第1期71-76,116,共7页
文摘
针对大规模查询日志中丰富的命名实体的挖掘是数据挖掘领域中的重要研究课题。已有的研究工作提出了一种基于种子实体的抽取框架,利用实体间的分布相似度进行挖掘。然而该工作只有当种子实体仅属于单个语义类别时才能取得好的结果,实际上命名实体往往可能从属于多个类别。该文通过引入一个弱指导话题模型,利用少量的人工指导信息,很好地解决了实体的类别模糊性,提高了挖掘的有效性。实验表明该文提出的方法在实体挖掘性能上显著优于已有的方法。
关键词
计算机应用
中文信息处理
分开命名实体
用户查询日志
话题模型
Keywords
computer application
Chinese information processing
named
entity
query log
topic
model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于半监督话题模型的用户查询日志命名实体挖掘
被引量:
6
3
作者
曹雷
郭嘉丰
白露
程学旗
机构
中国科学院计算技术研究所网络数据科学与工程研究中心
中国科学院研究生院
出处
《中文信息学报》
CSCD
北大核心
2012年第5期26-32,共7页
基金
国家自然科学基金资助项目(60903139
60873243
+2 种基金
60933005)
国家863计划重点资助项目(2010AA012502
2010AA012503)
文摘
基于用户查询日志的命名实体挖掘,目标是从用户查询日志中挖掘具有指定类别的命名实体。已有研究工作提出一种基于种子实体的挖掘方法,利用实体类别与候选实体之间的模板分布相似性来对候选实体进行排序。然而该挖掘方法忽略了命名实体具有歧义性、查询模板具有多义性和未标注实体信息,因而不能够有效的对候选实体进行排序。该文采用半监督话题模型,利用查询模板之间的关系来学习实体类别的模板分布,进而改善候选实体的排序效果。实验结果表明了该文提出方法的有效性。
关键词
用户查询日志
命名实体挖掘
半监督话题模型
Keywords
query log
named entity mining~ semi-supervised topic model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于反馈报道的话题模型动态修正方法
被引量:
3
4
作者
郑燕
鲁燃
赵爱华
机构
山东师范大学信息科学与工程学院
山东省分布式计算机软件新技术重点实验室
出处
《计算机应用》
CSCD
北大核心
2012年第5期1343-1346,共4页
基金
国家自然科学基金资助项目(60873247)
山东省高新自主创新专项工程(2008ZZ28)
+1 种基金
山东省自然科学基金资助项目(ZR2009GZ007)
济南市青年科技明星计划项目(20080201)
文摘
在话题追踪过程中,由于给定的初始话题相关报道少,而且话题具有动态演变的特点造成话题模型不准确。针对这一问题,提出了利用动态阈值收集反馈报道构造话题修正模型,实现了话题模型的动态修正;同时结合命名实体能够更加有效地区分不同话题的特性,提出了在修正话题模型时增大相关命名实体权重的方法,从而获得更准确的话题表示模型。实验结果表明,该方法能有效避免话题漂移现象,降低话题追踪过程中的漏报率和错报率。
关键词
话题追踪
话题模型
动态阈值
命名
实体
反馈报道
Keywords
topic
tracking
topic
model
dynamic threshold
named
entity
feedback stories
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
医学信息领域人工智能技术的主题漂移与未来展望——基于JCR 26本医学信息期刊文本的命名实体识别
被引量:
5
5
作者
徐璐璐
杨嘉乐
康乐乐
机构
南通大学图书馆
南京大学信息管理学院
江苏省数据工程与知识服务重点实验室
南通大学信息科学技术学院
出处
《现代情报》
CSSCI
2022年第10期163-176,共14页
基金
江苏省高校哲学社会科学研究一般项目“医学信息智能化发展的主题漂移与趋势分析”(项目编号:2020SJA1591)。
文摘
[目的/意义]在过去数十年中,医学信息研究领域被人工智能技术的重构。为厘清人工智能技术发展对医学信息研究领域带来的影响,本研究采用命名实体对医学信息领域人工智能技术进行识别,深入揭示其主题漂移特征与演化趋势,并提出3点未来展望。[方法/过程]研究中首先采集了JCR中26本医学信息期刊题录信息,而后利用Vosviewer可视化分析人工智能技术的总体分布,在此基础上采用3种深度学习模型对人工智能技术进行命名实体识别和对比,最后分5个时间段梳理其主题漂移并提出3点展望。[结果/结论]Vosviewer可视化显示20年来人工智能技术在医学信息领域占据重要地位;3种深度学习模型对比发现,基于Attention的Bi LSTM-CRF模型的命名实体识别结果最优,F1值提高到88.40%;在5个时间段内,医学信息领域人工智能主流技术以高、中频词为代表围绕着传统型技术且相对稳定,分支技术以低频词为代表则出现深度学习等复杂性技术且随时间有所改变,并呈现直觉(经验发掘)→支持(深入理解)→策略(强化分析)→后推理(支撑决策)→前推理(提前预测);即整体进入较为理性和务实状态,尚缺爆发性变革但确有一定程度变化的主题漂移演化脉络。对此,本文从技术、应用和并行层面提出3点未来展望,以期加强对人工智能在处理医学信息上优、缺点的认知,为更精准地挖掘多源数据提供优质医学诊断具有理论和现实意义。
关键词
医学信息
人工智能技术
命名实体
主题漂移
BERT模型
双向长短期记忆网络
条件随机场
注意力机制
Keywords
medical information
artificial intelligence technology
named
entity
recognition(NER)
topic
drift
BERT
model
Bi LSTM
CRF
attention
model
分类号
TP274 [自动化与计算机技术—检测技术与自动化装置]
在线阅读
下载PDF
职称材料
题名
基于词向量聚类的中文微博产品命名实体识别
被引量:
8
6
作者
王洪亮
机构
石家庄职业技术学院
出处
《兰州理工大学学报》
CAS
北大核心
2017年第1期104-110,共7页
基金
国家自然科学基金(61100009)
河北省科学研究计划项目(Z2014181)
河北省科技支撑计划(13210345)
文摘
随着微博等社交平台的兴起,如何针对微博数据进行产品命名实体识别成为了自然语言处理领域研究的热点之一,也是实现舆情监督和商业智能的基础.传统的命名实体识别技术没有考虑中文微博口语化、不规范等特点,且忽略了深层语义对命名实体识别的重要作用.因此,考虑中文微博的特殊性,提出一种融合全局上下文信息的词向量特征选择方法,分别采用主题模型和神经网络词向量聚类两种方法获取深层语义信息,并结合层叠条件随机场进行中文微博的命名实体识别.实验结果表明,基于词向量聚类的中文微博产品命名实体识别方法取得了较好的效果.
关键词
中文微博
命名实体
主题模型
神经网络
词向量
Keywords
Chinese microblog
named
entity
topic
model
neural network
word-vector
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于功能分解结构模型的工程知识自动提取与组织方法
7
作者
赵书彬
徐诚
机构
南京理工大学机械工程学院
出处
《兵工学报》
EI
CAS
CSCD
北大核心
2020年第10期1950-1961,共12页
基金
国防基础科研项目(JCKY2016209B001)。
文摘
知识的提取与重用对提高工程设计效率、减少设计活动中的重复工作有着重要意义,针对工程领域知识形式的多样化、结构化等特点,提出一种基于功能分解结构模型的半自动化知识提取方法。通过功能分解完成结构模板的构建;采用命名实体识别技术从工程文本中提取设计相关关键信息;进一步基于隐含狄利克雷分布模型完成文本主题聚类,在此基础上实现关键信息与功能分解结构的关联;在提出该方法与流程的基础上,完成原型系统的设计与开发,并以自动武器概念设计以及闭锁机构的设计为例展示了完整的功能分解以及知识提取过程。研究结果表明:半自动知识提取方法能有效地减少知识提取过程中的人为工作;知识重用适应工程领域的设计思路,可向设计者提供相关的领域知识。
关键词
自动武器
知识提取
知识重用
命名实体识别
主题模型
Keywords
automatic weapon
knowledge acquisition
knowledge reuse
named
entity
recognition
topic
model
分类号
TP319 [自动化与计算机技术—计算机软件与理论]
TJ202 [兵器科学与技术—武器系统与运用工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种基于概率主题模型的命名实体链接方法
怀宝兴
宝腾飞
祝恒书
刘淇
《软件学报》
EI
CSCD
北大核心
2014
32
在线阅读
下载PDF
职称材料
2
基于用户查询日志的命名实体挖掘
翟海军
郭嘉丰
王小磊
许洪波
《中文信息学报》
CSCD
北大核心
2010
8
在线阅读
下载PDF
职称材料
3
基于半监督话题模型的用户查询日志命名实体挖掘
曹雷
郭嘉丰
白露
程学旗
《中文信息学报》
CSCD
北大核心
2012
6
在线阅读
下载PDF
职称材料
4
基于反馈报道的话题模型动态修正方法
郑燕
鲁燃
赵爱华
《计算机应用》
CSCD
北大核心
2012
3
在线阅读
下载PDF
职称材料
5
医学信息领域人工智能技术的主题漂移与未来展望——基于JCR 26本医学信息期刊文本的命名实体识别
徐璐璐
杨嘉乐
康乐乐
《现代情报》
CSSCI
2022
5
在线阅读
下载PDF
职称材料
6
基于词向量聚类的中文微博产品命名实体识别
王洪亮
《兰州理工大学学报》
CAS
北大核心
2017
8
在线阅读
下载PDF
职称材料
7
基于功能分解结构模型的工程知识自动提取与组织方法
赵书彬
徐诚
《兵工学报》
EI
CAS
CSCD
北大核心
2020
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部