期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
18
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
人工智能的安全风险与防范
被引量:
2
1
作者
郑方
《信息安全研究》
CSCD
北大核心
2024年第2期101-102,共2页
人工智能(artificial intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,其对人类进步的贡献是有目共睹、毋庸置疑的.然而,任何事物都有两面性,有好的一面就有坏的一面,这两...
人工智能(artificial intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,其对人类进步的贡献是有目共睹、毋庸置疑的.然而,任何事物都有两面性,有好的一面就有坏的一面,这两面既相互排斥又相互依存,这就是矛盾的对立统一.本专题讨论人工智能的安全风险问题,以便为防范安全风险做好准备.
展开更多
关键词
人工智能
相互排斥
安全风险
风险与防范
专题讨论
人的智能
人类进步
两面性
在线阅读
下载PDF
职称材料
机器语言能力和人工智能如何助力乡村振兴
被引量:
2
2
作者
孙茂松
《语言科学》
CSSCI
北大核心
2022年第5期453-455,共3页
机器语言能力是机器对人类自然语言信息的智能化处理能力,要求智能机器不仅能够学会世界上各种有记录的自然语言,还要具有对文字视听信息进行自动化处理的能力,实现机器与机器、机器与人之间的交互。有了交流的基础,人就可以控制智能机...
机器语言能力是机器对人类自然语言信息的智能化处理能力,要求智能机器不仅能够学会世界上各种有记录的自然语言,还要具有对文字视听信息进行自动化处理的能力,实现机器与机器、机器与人之间的交互。有了交流的基础,人就可以控制智能机器在各个领域发展出“专业技能”当前,受益于人工智能,我国乡村教育、文化提升、农业建设和乡村司法文明等方面都取得长足进步,这说明机器语言能力和人工智能的发展在乡村振兴的伟大事业中是有价值、有前景的。
展开更多
关键词
机器语言能力
人工智能
乡村振兴
在线阅读
下载PDF
职称材料
让国产大模型产业更好赋能经济社会发展
被引量:
2
3
作者
邓志东
《人民论坛》
北大核心
2025年第2期27-30,共4页
近年来,大模型产业逐步从互联网空间走向真实的物理世界,与实体经济深度融合,在深度和广度上更好地赋能智能经济与智能社会的发展。应充分发挥我国生成式人工智能产业的规模优势,聚焦多样化应用场景的快速落地、商业模式创新与价值实现...
近年来,大模型产业逐步从互联网空间走向真实的物理世界,与实体经济深度融合,在深度和广度上更好地赋能智能经济与智能社会的发展。应充分发挥我国生成式人工智能产业的规模优势,聚焦多样化应用场景的快速落地、商业模式创新与价值实现。从数据、算力、模型与应用场景等多维度,直面大模型应用落地中的各种挑战,通过政策引领、体制机制创新、更高质量数据集的构建与开放使用、全国一体化AI算力基础设施建设以及场景创新等的合力支撑,重塑我国生成式人工智能产业发展的全球竞争新优势,让中国的人工智能发展为增进人类福祉作出更大的贡献。
展开更多
关键词
大模型产业
生成式人工智能
通用智能体
在线阅读
下载PDF
职称材料
HowNet义原标注一致性检验方法研究
被引量:
8
4
作者
刘阳光
岂凡超
+1 位作者
刘知远
孙茂松
《中文信息学报》
CSCD
北大核心
2021年第4期23-34,共12页
义原(sememe)被定义为人类语言中不可再分的最小语义单位。一个词语的意义可以由多个义原的组合来表示。以往人们已经人工为词语标注义原并构建了知网(HowNet)这一语言知识库,并借此将义原应用到了多种自然语言处理任务。但传统的人工...
义原(sememe)被定义为人类语言中不可再分的最小语义单位。一个词语的意义可以由多个义原的组合来表示。以往人们已经人工为词语标注义原并构建了知网(HowNet)这一语言知识库,并借此将义原应用到了多种自然语言处理任务。但传统的人工标注费时费力,而且不同的专家进行标注难免会引入标注者的主观偏差,导致标注的一致性和准确性难以保证。因此,保证词的义原标注一致性已成为建设高质量语言知识库HowNet、提升义原应用任务效果的首要任务。该文首次提出了一种对HowNet已标注的义原进行一致性检验的方法。实验结果表明,所提方法切实有效,能够很好地应用于HowNet知识库的标注一致性检验以及完善扩充。
展开更多
关键词
义原标注
HOWNET
一致性检验
在线阅读
下载PDF
职称材料
中文开放域问答系统数据增广研究
被引量:
2
5
作者
杜家驹
叶德铭
孙茂松
《中文信息学报》
CSCD
北大核心
2022年第11期121-130,共10页
开放域问答是自然语言处理中的重要任务之一。目前的开放域问答模型总是倾向于在问题和文章之间做浅层的文本匹配,经常在一些简单问题上出错。这些错误的原因部分是由于阅读理解数据集缺少一些真实场景下常见的模式。该文提出了几种能...
开放域问答是自然语言处理中的重要任务之一。目前的开放域问答模型总是倾向于在问题和文章之间做浅层的文本匹配,经常在一些简单问题上出错。这些错误的原因部分是由于阅读理解数据集缺少一些真实场景下常见的模式。该文提出了几种能够提高开放域问答鲁棒性的数据增广方法,能有效减少这些常见模式的影响。此外,我们还构造并公开发布了一个新的开放域问答数据集,能够评估模型在真实场景下的实际效果。实验结果表明,该文提出的方法在实际场景下带来了性能提升。
展开更多
关键词
开放域问答
鲁棒性
数据增广
在线阅读
下载PDF
职称材料
瓶装数据:一种极端环境下的终端数据安全新机制
6
作者
支录奎
郑方
+2 位作者
国强
成舸
支野
《信息安全研究》
CSCD
北大核心
2024年第6期579-584,共6页
在现实生活中,移动终端(手机)是必不可少的数据交互工具.工具使用的效果不仅仅在于手机本身,更重要的是在于网络应用环境是否给力,如果在网络极端环境下终端数据交互不尽人意时,如何另辟蹊径,在网络异常时终端数据仍然可正常交互.提出...
在现实生活中,移动终端(手机)是必不可少的数据交互工具.工具使用的效果不仅仅在于手机本身,更重要的是在于网络应用环境是否给力,如果在网络极端环境下终端数据交互不尽人意时,如何另辟蹊径,在网络异常时终端数据仍然可正常交互.提出一种新的理念瓶装数据:一种极端环境下的终端数据安全新机制,其主要创新点在于,当网络异常前事先将个人数据存放在离线的数据“瓶子”里,同时将生物比对模板也同样装在自己的数据“瓶子”里,一旦网络中断“瓶子”里的数据不受到任何网络影响,实现身份认证并与离线读卡器进行数据安全交互.
展开更多
关键词
极端环境
终端数据
在线阅读
下载PDF
职称材料
基于百科语料的中英文双语词典提取
被引量:
2
7
作者
王星
单力秋
+3 位作者
侯磊
于济凡
陈吉
陶明阳
《中文信息学报》
CSCD
北大核心
2021年第1期25-33,共9页
双语词典是跨语言自然语言处理中一项非常重要的资源。目前提取双语词典的方法主要是基于平行语料库和基于可比语料库,但是这两种方法在提取新词或者某些技术术语时都存在双语资源匮乏的问题。相比之下,基于部分双语语料的方法由于利用...
双语词典是跨语言自然语言处理中一项非常重要的资源。目前提取双语词典的方法主要是基于平行语料库和基于可比语料库,但是这两种方法在提取新词或者某些技术术语时都存在双语资源匮乏的问题。相比之下,基于部分双语语料的方法由于利用的是新闻或者百科知识,故可以很好地解决这个问题,然而目前基于部分双语语料的方法主要集中在对文本内容的提取上,缺乏对文本内容以外部分的提取。针对此不足,该文以中英文两种语言为例,提出了一种基于百科语料的中英文双语词典的提取方法。该方法是在对文本内容提取的基础上结合在线百科的结构特点,分别用五种不同的方法对百科语料进行提取,综合查重后得到的双语信息数量为969 308条。与以往的基于部分双语语料的双语词典的提取方法相比,该方法在在线百科语料上的提取数量提高了170.75%。
展开更多
关键词
双语词典提取
跨语言自然语言处理
部分双语语料
在线阅读
下载PDF
职称材料
声纹识别在数字人民币中的应用探析
被引量:
2
8
作者
舒皓
向银杉
+1 位作者
成舸
郑方
《信息安全研究》
2022年第12期1231-1235,共5页
声纹识别作为一种新兴的生物识别技术近年来开始逐渐走向成熟,不仅在中国建设银行等金融机构的多个场景得到应用,也被纳入中国人民银行数字人民币试点的可信身份技术体系.从数字人民币的账户安全要求和声纹识别技术的基本特征入手,就声...
声纹识别作为一种新兴的生物识别技术近年来开始逐渐走向成熟,不仅在中国建设银行等金融机构的多个场景得到应用,也被纳入中国人民银行数字人民币试点的可信身份技术体系.从数字人民币的账户安全要求和声纹识别技术的基本特征入手,就声纹技术对数字人民币的安全改进以及声纹支付的应用场景进行了探讨.
展开更多
关键词
数字人民币
移动支付
声纹识别
声纹支付
生物特征
在线阅读
下载PDF
职称材料
基于维基百科的冬奥会概念下的低频词条双语迭代扩展
9
作者
王星
陶明阳
+4 位作者
侯磊
于济凡
单力秋
张馨如
陈吉
《中文信息学报》
CSCD
北大核心
2021年第2期33-40,51,共9页
随着2022年北京冬奥会的临近,有必要构建一个与冬奥会相关的垂直领域知识图谱,但目前网络上没有较完整的冬奥会相关术语集,因此,需要用集合扩展的方法对冬奥会术语集进行补充。近年来,集合扩展的方法主要基于Word2Vec进行研究,但扩展平...
随着2022年北京冬奥会的临近,有必要构建一个与冬奥会相关的垂直领域知识图谱,但目前网络上没有较完整的冬奥会相关术语集,因此,需要用集合扩展的方法对冬奥会术语集进行补充。近年来,集合扩展的方法主要基于Word2Vec进行研究,但扩展平均词频较低的冬奥会中文领域时效果并不理想。该文提出了中英文双语迭代扩展的方法,利用数量多、词频较高的英文语料库和中英文跨语言同义词数据集解决中文数据集平均质量较低的问题。该文使用维基百科中冬奥会领域相关的词条组成的数据集进行实验。实验结果表明,与其他集合扩展方法相比,该文提出的扩展方法扩展出的新词质量提升了12%以上。
展开更多
关键词
集合扩展
低频词
迭代扩展
在线阅读
下载PDF
职称材料
基于数据增广和CNN的地震随机噪声压制
被引量:
71
10
作者
王钰清
陆文凯
+2 位作者
刘金林
张猛
苗永康
《地球物理学报》
SCIE
EI
CAS
CSCD
北大核心
2019年第1期421-433,共13页
卷积神经网络(Convolutional Neural Network,CNN)是一种基于数据驱动的学习算法,简化了传统从特征提取到分类的两阶段式处理任务,被广泛应用于计算机科学的各个领域.在标注数据不足的地震数据去噪领域,CNN的推广应用受到限制.针对这一...
卷积神经网络(Convolutional Neural Network,CNN)是一种基于数据驱动的学习算法,简化了传统从特征提取到分类的两阶段式处理任务,被广泛应用于计算机科学的各个领域.在标注数据不足的地震数据去噪领域,CNN的推广应用受到限制.针对这一问题,本文提出了一种基于数据生成和增广的地震数据CNN去噪框架.对于合成数据,本文对无噪地震数据添加不同方差的高斯噪声,增广后构成训练集,实现基于小样本的CNN训练.对于实际地震数据,由于无法获得真实的干净数据和噪声来生成训练样本集,本文提出一种直接从无标签实际有噪数据生成标签数据集的方法.在所提出的方法中,我们利用目前已有的去噪方法从实际地震数据中分别获得估计干净数据和估计噪声,前者与未知的干净数据具有相似纹理,后者与实际噪声具有相似的概率分布.人工合成数据和实际数据实验结果表明,相较于F-X反褶积,BM3D和自适应频域滤波算法,本文方法能更好地压制随机噪声和保护有效信号.最后,本文采用神经网络可视化方法对去噪CNN的机理进行了探索,一定程度上解释了网络每一层的学习内容.
展开更多
关键词
卷积神经网络
数据增广
地震噪声压制
神经网络可视化
在线阅读
下载PDF
职称材料
基于神经网络的集句诗自动生成
被引量:
9
11
作者
梁健楠
孙茂松
+3 位作者
矣晓沅
杨成
陈慧敏
刘正皓
《中文信息学报》
CSCD
北大核心
2019年第3期126-135,共10页
集句诗是中国古典诗歌的一种特殊体裁。是从前人的诗篇中选取已有诗句,再将其巧妙组合形成一首新诗,是一种艺术的再创造形式。集句诗的生成要求集辑而成的诗不仅合辙押韵,且有完整的内容、连贯的上下文和新颖的主旨意境,对创作者的知识...
集句诗是中国古典诗歌的一种特殊体裁。是从前人的诗篇中选取已有诗句,再将其巧妙组合形成一首新诗,是一种艺术的再创造形式。集句诗的生成要求集辑而成的诗不仅合辙押韵,且有完整的内容、连贯的上下文和新颖的主旨意境,对创作者的知识储备和诗词鉴赏能力有极高的要求。该文基于计算机的海量存储和快速检索能力,以及神经网络模型对文本语义较强的表示和理解能力,提出一种新颖的集句诗自动生成模型。该模型以数十万首古诗作为基础,利用循环神经网络(RNN)自动学习古诗句的语义表示,并设计了多种方法自动计算两句诗句的上下文关联性。根据用户输入的首句,模型能够自动计算选取上下文语义最相关连贯的诗句进行集辑,从而形成一首完整的集句诗。自动评测和人工评测的实验结果都表明,该文模型能够生成质量较好的集句诗,远远超过基线模型的效果。
展开更多
关键词
神经网络
中国古典诗歌
自动诗歌生成
在线阅读
下载PDF
职称材料
基于局部语义相关性的定义文本义原预测
被引量:
4
12
作者
杜家驹
岂凡超
+1 位作者
孙茂松
刘知远
《中文信息学报》
CSCD
北大核心
2020年第5期1-9,共9页
作为人类语言的最小语义单位,义原已被成功应用于许多自然语言处理任务。人工构造和更新义原知识库成本较大,因此义原预测被用来辅助义原标注。该文探索了利用定义文本为词语自动预测义原的方法。词语的各个义原通常都与定义文本中的不...
作为人类语言的最小语义单位,义原已被成功应用于许多自然语言处理任务。人工构造和更新义原知识库成本较大,因此义原预测被用来辅助义原标注。该文探索了利用定义文本为词语自动预测义原的方法。词语的各个义原通常都与定义文本中的不同词语的语义有相关关系,这种现象被称为局部语义相关性。与之对应,该文提出了义原相关池化(SCorP)模型,该模型能够利用局部语义相关性来预测义原。在HowNet上的评测结果表明,SCorP取得了当前最好的义原预测性能。大量的定量分析进一步证明了SCorP模型能够正确地学习义原与定义文本之间的局部语义相关性。
展开更多
关键词
义原预测
HOWNET
语义相关性
在线阅读
下载PDF
职称材料
基于生活日志的情绪识别
被引量:
1
13
作者
王鹏宇
张敏
+2 位作者
马为之
刘奕群
马少平
《中文信息学报》
CSCD
北大核心
2021年第1期96-103,112,共9页
抑郁症日益成为影响现代人生活幸福程度的重要因素。实时有效地识别用户情绪的方法对于抑郁症潜在患者的发现和治疗十分有意义。用户情绪的状态及变化会体现在其生活日志数据上。该文从使用可穿戴设备收集的用户生活日志数据出发,对数...
抑郁症日益成为影响现代人生活幸福程度的重要因素。实时有效地识别用户情绪的方法对于抑郁症潜在患者的发现和治疗十分有意义。用户情绪的状态及变化会体现在其生活日志数据上。该文从使用可穿戴设备收集的用户生活日志数据出发,对数据进行了特征方面的分析;进一步地,使用以回归树为弱学习器的集成学习模型,设计了使用全部数据、仅用户自身数据以及仅他人数据进行训练的三组实验构成的对比实验框架,以比较使用不同用户数据对识别结果的影响。实验结果表明,基于生活日志数据的集成学习模型可以有效地识别用户的情绪状态。同时,基于实验结果提出了用户认知不一致的猜想,对于心理学上的抑郁分析也有一定的启发作用。该工作是目前所知第一个利用用户生活日志信息进行情绪识别以及抑郁症患者分析的工作,为后续进一步扩大实验规模和改良实验设计提供了思路。
展开更多
关键词
生活日志数据
情绪识别
集成学习
在线阅读
下载PDF
职称材料
融合注意力机制和指针标注的实体关系联合抽取方法
被引量:
4
14
作者
唐楠楠
陈吉
+1 位作者
侯磊
王星
《小型微型计算机系统》
CSCD
北大核心
2023年第2期256-262,共7页
实体关系三元组是组成知识图谱的基本单位,其抽取的效果直接影响大型知识图谱的构建.针对目前多数关系抽取模型存在语义特征表达能力不足、实体关系发生重叠难以抽取等问题,本文提出了一种融合注意力机制和指针标注的实体关系联合抽取模...
实体关系三元组是组成知识图谱的基本单位,其抽取的效果直接影响大型知识图谱的构建.针对目前多数关系抽取模型存在语义特征表达能力不足、实体关系发生重叠难以抽取等问题,本文提出了一种融合注意力机制和指针标注的实体关系联合抽取模型.模型采用预训练语言模型BERT训练词向量,利用多头注意力机制获取丰富的语义特征信息,通过指针标注抽取主语,然后采用改进的层归一化将主语特征作为条件信息与句子向量进行特征融合来增强模型表达能力,最终在预定义的关系条件下抽取主语对应的宾语,通过分层的指针标注处理重叠问题.本文使用公开数据集NYT和WebNLG进行测试,实验结果表明该模型在两个数据集上的F1值相比基线模型分别提高了2.5%和0.9%,可有效提升三元组抽取效果,并在一定程度上解决了三元组重叠问题.
展开更多
关键词
知识图谱
实体关系联合抽取
BERT
注意力机制
指针标注
在线阅读
下载PDF
职称材料
基于深度神经网络的诗词检索
被引量:
3
15
作者
梁健楠
孙茂松
矣晓沅
《中文信息学报》
CSCD
北大核心
2020年第12期82-91,共10页
中国古典诗词是中国古典文学的代表之一,是中华传统文化的宝藏,源远流长。中国古典诗词研究是自然语言处理方向的一项重要且富有意义的工作。随着人工智能的发展,人工神经网络在图像、文本等领域得到广泛的应用,取得了显著的突破,给人...
中国古典诗词是中国古典文学的代表之一,是中华传统文化的宝藏,源远流长。中国古典诗词研究是自然语言处理方向的一项重要且富有意义的工作。随着人工智能的发展,人工神经网络在图像、文本等领域得到广泛的应用,取得了显著的突破,给人工智能与中国古典诗词相结合提供了新的思路和方法。让机器去理解中国古典诗词的韵律和意境是一项极具挑战的工作,其中,通过研究诗词的相似性来提升机器对诗词的理解这一研究课题被赋予了更为重要的意义。诗词检索是对诗词内容做对比,查找出在语义和意境上相接近的诗词,这要求对整首诗词的内容和意境有深入的理解。该文模型以数十万首古诗作为基础,利用循环神经网络(RNN)自动学习古诗句的语义表示,并设计了多种方法自动计算两首诗之间的关联性,以此计算两首诗词之间的语义距离,实现诗词的推荐。自动评测和人工评测的实验结果都表明,该文模型能够生成质量较好的诗词检索结果。
展开更多
关键词
神经网络
中国古典诗词
诗词检索
在线阅读
下载PDF
职称材料
基于“声纹+”的无监督可信身份认证
被引量:
1
16
作者
张慧
王钰
+2 位作者
成舸
向银杉
郑方
《信息安全研究》
2020年第7期615-621,共7页
近年来,随着移动互联网和物联网的快速发展以及自助终端、无人商店等新业态的兴起,线上网络空间或线下自助空间的无监督身份认证成为人们日常生活不可或缺的部分,需要进行无监督身份认证的场景呈指数级增加.目前,生物特征识别成为用户...
近年来,随着移动互联网和物联网的快速发展以及自助终端、无人商店等新业态的兴起,线上网络空间或线下自助空间的无监督身份认证成为人们日常生活不可或缺的部分,需要进行无监督身份认证的场景呈指数级增加.目前,生物特征识别成为用户自我证明的最主要手段,然而部分生物特征一旦泄露,遭到非法利用或非本人意愿情况下"被认证",将严重损害用户自身利益.因此,针对无监督情形下的可信身份认证进行了深度分析,提出了无监督身份认证的五性要求,综合比较了各类生物特征的认证特点及其短板,分析了声纹识别技术运用于无监督可信身份认证的优势,以及基于"声纹+"多维度技术融合用于"从实人到实意"的可信身份认证未来趋势.
展开更多
关键词
无监督身份认证
五性要求
生物特征识别
声纹识别
“声纹+”技术
可信身份认证
在线阅读
下载PDF
职称材料
基于C-V2X的车路协同自动驾驶关键技术与应用
被引量:
15
17
作者
王鲲
董振江
+1 位作者
杨凡
周谷越
《电信科学》
2023年第3期45-60,共16页
随着车联网技术的演进,自动驾驶在单车智能的基础上,又有了新的发展形态——车路协同自动驾驶。通过“人-车-路-云”深度融合形成的一体化复杂信息物理系统(cyber physical system,CPS),可以与自动驾驶车辆实现协同感知、协同决策规划...
随着车联网技术的演进,自动驾驶在单车智能的基础上,又有了新的发展形态——车路协同自动驾驶。通过“人-车-路-云”深度融合形成的一体化复杂信息物理系统(cyber physical system,CPS),可以与自动驾驶车辆实现协同感知、协同决策规划甚至协同控制,提升自动驾驶安全性,帮助克服各类复杂交通环境。首先介绍了车路协同的复杂信息物理系统的概念内涵和总体架构,并提出了车路协同自动驾驶的一系列典型应用场景、技术原理、C-V2X(cellular vehicle-to-everything)性能要求、车路协同系统功能与性能要求,可以为下一阶段智能网联汽车与智能交通的深度融合发展提供参考和解决思路。
展开更多
关键词
自动驾驶
蜂窝车联网
网联自动驾驶车辆
车路协同自动驾驶
在线阅读
下载PDF
职称材料
概率式关联可信中文知识图谱——“文脉”
18
作者
李文浩
刘文长
+1 位作者
孙茂松
矣晓沅
《中文信息学报》
CSCD
北大核心
2022年第12期67-73,共7页
国内现有的中文知识图谱往往以维基百科、百度百科等群体智能贡献的知识库作为资源抽取得到,但这些知识图谱利用的主要是百科的实体名片信息和分类体系信息。然而,这些百科中也有大量的内部链接信息,其中蕴含了大量知识。故而该文中利...
国内现有的中文知识图谱往往以维基百科、百度百科等群体智能贡献的知识库作为资源抽取得到,但这些知识图谱利用的主要是百科的实体名片信息和分类体系信息。然而,这些百科中也有大量的内部链接信息,其中蕴含了大量知识。故而该文中利用维基百科的内部链接构造边,并统计目标实体在源实体定义文本中出现的频度,利用其对应的TF-IDF值作为边权,构造了一个概率式中文知识图谱。该文还提出了一种可信链接筛选算法,对偶发链接进行了去除,使知识图谱更加可信。基于上述方法,该文挖掘出了一个概率式关联可信中文知识图谱,命名为“文脉”,将其在GitHub上进行了开源,以期能对知识指导的自然语言处理以及其他下游任务有所襄助。
展开更多
关键词
维基百科
知识图谱构建
可信链接筛选
在线阅读
下载PDF
职称材料
题名
人工智能的安全风险与防范
被引量:
2
1
作者
郑方
机构
清华大学
北京信息科学与技术国家
研究
中心语音和语言技术团队
清华大学人工智能研究院
听觉
智能
研究
中心
北京得意音通技术有限责任公司
APSIPA
中国计算机学会(CCF)语音对话与听觉专委会
中文信息学会常务理事及语音信息专委会
声学学会
全国人机语音通讯学术会议常设机构委员会
公安部全国安全防范标委会人体生物特征识别应用分委会
工信部中文语音交互技术标准工作组声纹识别专题组
出处
《信息安全研究》
CSCD
北大核心
2024年第2期101-102,共2页
文摘
人工智能(artificial intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,其对人类进步的贡献是有目共睹、毋庸置疑的.然而,任何事物都有两面性,有好的一面就有坏的一面,这两面既相互排斥又相互依存,这就是矛盾的对立统一.本专题讨论人工智能的安全风险问题,以便为防范安全风险做好准备.
关键词
人工智能
相互排斥
安全风险
风险与防范
专题讨论
人的智能
人类进步
两面性
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
TP309 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
机器语言能力和人工智能如何助力乡村振兴
被引量:
2
2
作者
孙茂松
机构
清华大学
计算机科学与技术系
清华大学人工智能研究院
出处
《语言科学》
CSSCI
北大核心
2022年第5期453-455,共3页
文摘
机器语言能力是机器对人类自然语言信息的智能化处理能力,要求智能机器不仅能够学会世界上各种有记录的自然语言,还要具有对文字视听信息进行自动化处理的能力,实现机器与机器、机器与人之间的交互。有了交流的基础,人就可以控制智能机器在各个领域发展出“专业技能”当前,受益于人工智能,我国乡村教育、文化提升、农业建设和乡村司法文明等方面都取得长足进步,这说明机器语言能力和人工智能的发展在乡村振兴的伟大事业中是有价值、有前景的。
关键词
机器语言能力
人工智能
乡村振兴
分类号
H002 [语言文字—语言学]
在线阅读
下载PDF
职称材料
题名
让国产大模型产业更好赋能经济社会发展
被引量:
2
3
作者
邓志东
机构
清华大学
计算机科学与技术系
清华大学人工智能研究院
视觉
智能
研究
中心
出处
《人民论坛》
北大核心
2025年第2期27-30,共4页
文摘
近年来,大模型产业逐步从互联网空间走向真实的物理世界,与实体经济深度融合,在深度和广度上更好地赋能智能经济与智能社会的发展。应充分发挥我国生成式人工智能产业的规模优势,聚焦多样化应用场景的快速落地、商业模式创新与价值实现。从数据、算力、模型与应用场景等多维度,直面大模型应用落地中的各种挑战,通过政策引领、体制机制创新、更高质量数据集的构建与开放使用、全国一体化AI算力基础设施建设以及场景创新等的合力支撑,重塑我国生成式人工智能产业发展的全球竞争新优势,让中国的人工智能发展为增进人类福祉作出更大的贡献。
关键词
大模型产业
生成式人工智能
通用智能体
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
HowNet义原标注一致性检验方法研究
被引量:
8
4
作者
刘阳光
岂凡超
刘知远
孙茂松
机构
清华大学
计算机科学与技术系
清华大学人工智能研究院
清华大学
智能
技术与系统国家重点实验室
出处
《中文信息学报》
CSCD
北大核心
2021年第4期23-34,共12页
基金
国家重点研发计划(2020AAA0106501)。
文摘
义原(sememe)被定义为人类语言中不可再分的最小语义单位。一个词语的意义可以由多个义原的组合来表示。以往人们已经人工为词语标注义原并构建了知网(HowNet)这一语言知识库,并借此将义原应用到了多种自然语言处理任务。但传统的人工标注费时费力,而且不同的专家进行标注难免会引入标注者的主观偏差,导致标注的一致性和准确性难以保证。因此,保证词的义原标注一致性已成为建设高质量语言知识库HowNet、提升义原应用任务效果的首要任务。该文首次提出了一种对HowNet已标注的义原进行一致性检验的方法。实验结果表明,所提方法切实有效,能够很好地应用于HowNet知识库的标注一致性检验以及完善扩充。
关键词
义原标注
HOWNET
一致性检验
Keywords
sememe annotation
HowNet
consistency check
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
中文开放域问答系统数据增广研究
被引量:
2
5
作者
杜家驹
叶德铭
孙茂松
机构
清华大学
计算机科学与技术系
清华大学人工智能研究院
清华大学
智能
技术与系统国家重点实验室
出处
《中文信息学报》
CSCD
北大核心
2022年第11期121-130,共10页
基金
国家重点研发计划项目(2020AAA0106500)。
文摘
开放域问答是自然语言处理中的重要任务之一。目前的开放域问答模型总是倾向于在问题和文章之间做浅层的文本匹配,经常在一些简单问题上出错。这些错误的原因部分是由于阅读理解数据集缺少一些真实场景下常见的模式。该文提出了几种能够提高开放域问答鲁棒性的数据增广方法,能有效减少这些常见模式的影响。此外,我们还构造并公开发布了一个新的开放域问答数据集,能够评估模型在真实场景下的实际效果。实验结果表明,该文提出的方法在实际场景下带来了性能提升。
关键词
开放域问答
鲁棒性
数据增广
Keywords
open-domain question answering
robustness
data augmentation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
瓶装数据:一种极端环境下的终端数据安全新机制
6
作者
支录奎
郑方
国强
成舸
支野
机构
陕西省公安厅
陕西省公安厅科信委专家组
陕西公安信息化应用实验室
清华大学人工智能研究院
听觉
智能
研究
中心
北京
大学
图书馆重点期刊评审组
清华大学
北京信息科学与技术国家
研究
中心语音和语言技术团队
北京得意音通技术有限责任公司
APSIPA
中国计算机学会(CCF)语音对话与听觉专委会
中文信息学会常务理事及语音信息专委会
声学学会
全国人机语音通信学术会议常设机构委员会
公安部全国安全防范标委会人体生物特征识别应用分委会
工信部中文语音交互技术标准工作组声纹识别专题组
国家信息中心
北京得意音通技术有限公司
公安部道路交通安全
研究
中心
出处
《信息安全研究》
CSCD
北大核心
2024年第6期579-584,共6页
基金
国家重点研发计划项目(2022YFB3104405)。
文摘
在现实生活中,移动终端(手机)是必不可少的数据交互工具.工具使用的效果不仅仅在于手机本身,更重要的是在于网络应用环境是否给力,如果在网络极端环境下终端数据交互不尽人意时,如何另辟蹊径,在网络异常时终端数据仍然可正常交互.提出一种新的理念瓶装数据:一种极端环境下的终端数据安全新机制,其主要创新点在于,当网络异常前事先将个人数据存放在离线的数据“瓶子”里,同时将生物比对模板也同样装在自己的数据“瓶子”里,一旦网络中断“瓶子”里的数据不受到任何网络影响,实现身份认证并与离线读卡器进行数据安全交互.
关键词
极端环境
终端数据
分类号
TP309.2 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于百科语料的中英文双语词典提取
被引量:
2
7
作者
王星
单力秋
侯磊
于济凡
陈吉
陶明阳
机构
辽宁工程技术
大学
电子与信息工程学院
清华大学
计算机科学与技术系
清华大学人工智能研究院
知识
智能
研究
中心
清华大学
北京信息科学与技术国家
研究
中心
出处
《中文信息学报》
CSCD
北大核心
2021年第1期25-33,共9页
基金
国家自然科学基金(61402212,61533018)
国家“十三五”重点研发计划(2017YFB1002101)
+4 种基金
NSFC-通用技术基础研究联合基金(U1736204)
辽宁省高等学校杰出青年学者成长计划(LJQ2015045)
中国博士后基金(2016M591452)
辽宁省自然科学基金(2015020098)
辽宁工程技术大学青年教师提升计划(拔尖人才)项目。
文摘
双语词典是跨语言自然语言处理中一项非常重要的资源。目前提取双语词典的方法主要是基于平行语料库和基于可比语料库,但是这两种方法在提取新词或者某些技术术语时都存在双语资源匮乏的问题。相比之下,基于部分双语语料的方法由于利用的是新闻或者百科知识,故可以很好地解决这个问题,然而目前基于部分双语语料的方法主要集中在对文本内容的提取上,缺乏对文本内容以外部分的提取。针对此不足,该文以中英文两种语言为例,提出了一种基于百科语料的中英文双语词典的提取方法。该方法是在对文本内容提取的基础上结合在线百科的结构特点,分别用五种不同的方法对百科语料进行提取,综合查重后得到的双语信息数量为969 308条。与以往的基于部分双语语料的双语词典的提取方法相比,该方法在在线百科语料上的提取数量提高了170.75%。
关键词
双语词典提取
跨语言自然语言处理
部分双语语料
Keywords
bilingual dictionary extraction
cross language natural language processing
part of bilingual corpus
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
声纹识别在数字人民币中的应用探析
被引量:
2
8
作者
舒皓
向银杉
成舸
郑方
机构
中国建设银行北京科创支行
北京得意音通技术有限责任公司
清华大学人工智能研究院
听觉
智能
研究
中心
出处
《信息安全研究》
2022年第12期1231-1235,共5页
文摘
声纹识别作为一种新兴的生物识别技术近年来开始逐渐走向成熟,不仅在中国建设银行等金融机构的多个场景得到应用,也被纳入中国人民银行数字人民币试点的可信身份技术体系.从数字人民币的账户安全要求和声纹识别技术的基本特征入手,就声纹技术对数字人民币的安全改进以及声纹支付的应用场景进行了探讨.
关键词
数字人民币
移动支付
声纹识别
声纹支付
生物特征
Keywords
e-CNY
mobile payment
voiceprint recognition
voiceprint payment
biometrics
分类号
TP391.42 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于维基百科的冬奥会概念下的低频词条双语迭代扩展
9
作者
王星
陶明阳
侯磊
于济凡
单力秋
张馨如
陈吉
机构
辽宁工程技术
大学
电子与信息工程学院
清华大学
计算机科学与技术系
清华大学人工智能研究院
知识
智能
研究
中心
清华大学
北京信息科学与技术国家
研究
中心
出处
《中文信息学报》
CSCD
北大核心
2021年第2期33-40,51,共9页
基金
国家自然科学基金(61402212)
国家自然科学基金(61533018)
+5 种基金
国家“十三五”重点研发计划(2017YFB1002101)
NSFC-通用技术基础研究联合基金(U1736204)
辽宁省高等学校杰出青年学者成长计划(LJQ2015045)
中国博士后基金(2016M591452)
辽宁省自然科学基金(2015020098)
辽宁工程技术大学青年教师提升计划(拔尖人才)。
文摘
随着2022年北京冬奥会的临近,有必要构建一个与冬奥会相关的垂直领域知识图谱,但目前网络上没有较完整的冬奥会相关术语集,因此,需要用集合扩展的方法对冬奥会术语集进行补充。近年来,集合扩展的方法主要基于Word2Vec进行研究,但扩展平均词频较低的冬奥会中文领域时效果并不理想。该文提出了中英文双语迭代扩展的方法,利用数量多、词频较高的英文语料库和中英文跨语言同义词数据集解决中文数据集平均质量较低的问题。该文使用维基百科中冬奥会领域相关的词条组成的数据集进行实验。实验结果表明,与其他集合扩展方法相比,该文提出的扩展方法扩展出的新词质量提升了12%以上。
关键词
集合扩展
低频词
迭代扩展
Keywords
set extension
low frequency word
iterative extension
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于数据增广和CNN的地震随机噪声压制
被引量:
71
10
作者
王钰清
陆文凯
刘金林
张猛
苗永康
机构
清华大学人工智能研究院
智能
技术与系统国家重点实验室
北京信息科学与技术国家
研究
中心
清华大学
自动化系
出处
《地球物理学报》
SCIE
EI
CAS
CSCD
北大核心
2019年第1期421-433,共13页
基金
国家自然科学基金项目(41674116)资助
文摘
卷积神经网络(Convolutional Neural Network,CNN)是一种基于数据驱动的学习算法,简化了传统从特征提取到分类的两阶段式处理任务,被广泛应用于计算机科学的各个领域.在标注数据不足的地震数据去噪领域,CNN的推广应用受到限制.针对这一问题,本文提出了一种基于数据生成和增广的地震数据CNN去噪框架.对于合成数据,本文对无噪地震数据添加不同方差的高斯噪声,增广后构成训练集,实现基于小样本的CNN训练.对于实际地震数据,由于无法获得真实的干净数据和噪声来生成训练样本集,本文提出一种直接从无标签实际有噪数据生成标签数据集的方法.在所提出的方法中,我们利用目前已有的去噪方法从实际地震数据中分别获得估计干净数据和估计噪声,前者与未知的干净数据具有相似纹理,后者与实际噪声具有相似的概率分布.人工合成数据和实际数据实验结果表明,相较于F-X反褶积,BM3D和自适应频域滤波算法,本文方法能更好地压制随机噪声和保护有效信号.最后,本文采用神经网络可视化方法对去噪CNN的机理进行了探索,一定程度上解释了网络每一层的学习内容.
关键词
卷积神经网络
数据增广
地震噪声压制
神经网络可视化
Keywords
Convolutional neural network
Data augmentation
Seismic noise attenuation
Neural network visualization
分类号
P315 [天文地球—地震学]
在线阅读
下载PDF
职称材料
题名
基于神经网络的集句诗自动生成
被引量:
9
11
作者
梁健楠
孙茂松
矣晓沅
杨成
陈慧敏
刘正皓
机构
清华大学
计算机科学与技术系
清华大学人工智能研究院
清华大学
智能
技术与系统国家重点实验室
出处
《中文信息学报》
CSCD
北大核心
2019年第3期126-135,共10页
基金
国家社会科学基金(13&ZD190)
文摘
集句诗是中国古典诗歌的一种特殊体裁。是从前人的诗篇中选取已有诗句,再将其巧妙组合形成一首新诗,是一种艺术的再创造形式。集句诗的生成要求集辑而成的诗不仅合辙押韵,且有完整的内容、连贯的上下文和新颖的主旨意境,对创作者的知识储备和诗词鉴赏能力有极高的要求。该文基于计算机的海量存储和快速检索能力,以及神经网络模型对文本语义较强的表示和理解能力,提出一种新颖的集句诗自动生成模型。该模型以数十万首古诗作为基础,利用循环神经网络(RNN)自动学习古诗句的语义表示,并设计了多种方法自动计算两句诗句的上下文关联性。根据用户输入的首句,模型能够自动计算选取上下文语义最相关连贯的诗句进行集辑,从而形成一首完整的集句诗。自动评测和人工评测的实验结果都表明,该文模型能够生成质量较好的集句诗,远远超过基线模型的效果。
关键词
神经网络
中国古典诗歌
自动诗歌生成
Keywords
neural network
Chinese classical poetry
automatic poetry generation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于局部语义相关性的定义文本义原预测
被引量:
4
12
作者
杜家驹
岂凡超
孙茂松
刘知远
机构
清华大学
计算机科学与技术系
清华大学人工智能研究院
清华大学
智能
技术与系统国家重点实验室
出处
《中文信息学报》
CSCD
北大核心
2020年第5期1-9,共9页
基金
国家自然科学基金(61661146007)
文摘
作为人类语言的最小语义单位,义原已被成功应用于许多自然语言处理任务。人工构造和更新义原知识库成本较大,因此义原预测被用来辅助义原标注。该文探索了利用定义文本为词语自动预测义原的方法。词语的各个义原通常都与定义文本中的不同词语的语义有相关关系,这种现象被称为局部语义相关性。与之对应,该文提出了义原相关池化(SCorP)模型,该模型能够利用局部语义相关性来预测义原。在HowNet上的评测结果表明,SCorP取得了当前最好的义原预测性能。大量的定量分析进一步证明了SCorP模型能够正确地学习义原与定义文本之间的局部语义相关性。
关键词
义原预测
HOWNET
语义相关性
Keywords
sememe prediction
HowNet
semantic relevance
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于生活日志的情绪识别
被引量:
1
13
作者
王鹏宇
张敏
马为之
刘奕群
马少平
机构
清华大学
计算机科学与技术系
清华大学人工智能研究院
清华大学
北京信息科学与技术国家
研究
中心
出处
《中文信息学报》
CSCD
北大核心
2021年第1期96-103,112,共9页
基金
国家重点研发计划(2018YFC0831900)
国家自然科学基金(61672311,61532011)
清华大学国强研究院资助项目(2019GQG0004)。
文摘
抑郁症日益成为影响现代人生活幸福程度的重要因素。实时有效地识别用户情绪的方法对于抑郁症潜在患者的发现和治疗十分有意义。用户情绪的状态及变化会体现在其生活日志数据上。该文从使用可穿戴设备收集的用户生活日志数据出发,对数据进行了特征方面的分析;进一步地,使用以回归树为弱学习器的集成学习模型,设计了使用全部数据、仅用户自身数据以及仅他人数据进行训练的三组实验构成的对比实验框架,以比较使用不同用户数据对识别结果的影响。实验结果表明,基于生活日志数据的集成学习模型可以有效地识别用户的情绪状态。同时,基于实验结果提出了用户认知不一致的猜想,对于心理学上的抑郁分析也有一定的启发作用。该工作是目前所知第一个利用用户生活日志信息进行情绪识别以及抑郁症患者分析的工作,为后续进一步扩大实验规模和改良实验设计提供了思路。
关键词
生活日志数据
情绪识别
集成学习
Keywords
life log data
emotion recognition
integrated learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
融合注意力机制和指针标注的实体关系联合抽取方法
被引量:
4
14
作者
唐楠楠
陈吉
侯磊
王星
机构
辽宁工程技术
大学
电子与信息工程学院
临沂
大学
信息科学与工程学院
清华大学
计算机科学与技术系
清华大学人工智能研究院
知识
智能
研究
中心
出处
《小型微型计算机系统》
CSCD
北大核心
2023年第2期256-262,共7页
基金
国家自然科学基金项目(62006107,62006136,61402212)资助
NSFC-通用技术基础研究联合基金重点项目(U1736204)资助.
文摘
实体关系三元组是组成知识图谱的基本单位,其抽取的效果直接影响大型知识图谱的构建.针对目前多数关系抽取模型存在语义特征表达能力不足、实体关系发生重叠难以抽取等问题,本文提出了一种融合注意力机制和指针标注的实体关系联合抽取模型.模型采用预训练语言模型BERT训练词向量,利用多头注意力机制获取丰富的语义特征信息,通过指针标注抽取主语,然后采用改进的层归一化将主语特征作为条件信息与句子向量进行特征融合来增强模型表达能力,最终在预定义的关系条件下抽取主语对应的宾语,通过分层的指针标注处理重叠问题.本文使用公开数据集NYT和WebNLG进行测试,实验结果表明该模型在两个数据集上的F1值相比基线模型分别提高了2.5%和0.9%,可有效提升三元组抽取效果,并在一定程度上解决了三元组重叠问题.
关键词
知识图谱
实体关系联合抽取
BERT
注意力机制
指针标注
Keywords
knowledge graph
entity relation extraction
BERT
attention mechanism
pointer annotation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于深度神经网络的诗词检索
被引量:
3
15
作者
梁健楠
孙茂松
矣晓沅
机构
清华大学
计算机科学与技术系
清华大学人工智能研究院
清华大学
智能
技术与系统国家重点实验室
出处
《中文信息学报》
CSCD
北大核心
2020年第12期82-91,共10页
基金
国家社会科学基金重大项目(18ZDA238)。
文摘
中国古典诗词是中国古典文学的代表之一,是中华传统文化的宝藏,源远流长。中国古典诗词研究是自然语言处理方向的一项重要且富有意义的工作。随着人工智能的发展,人工神经网络在图像、文本等领域得到广泛的应用,取得了显著的突破,给人工智能与中国古典诗词相结合提供了新的思路和方法。让机器去理解中国古典诗词的韵律和意境是一项极具挑战的工作,其中,通过研究诗词的相似性来提升机器对诗词的理解这一研究课题被赋予了更为重要的意义。诗词检索是对诗词内容做对比,查找出在语义和意境上相接近的诗词,这要求对整首诗词的内容和意境有深入的理解。该文模型以数十万首古诗作为基础,利用循环神经网络(RNN)自动学习古诗句的语义表示,并设计了多种方法自动计算两首诗之间的关联性,以此计算两首诗词之间的语义距离,实现诗词的推荐。自动评测和人工评测的实验结果都表明,该文模型能够生成质量较好的诗词检索结果。
关键词
神经网络
中国古典诗词
诗词检索
Keywords
neural network
Chinese classical poetry
poetry retrieval
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于“声纹+”的无监督可信身份认证
被引量:
1
16
作者
张慧
王钰
成舸
向银杉
郑方
机构
贵州得意音通技术有限责任公司
北京得意音通技术有限责任公司
北京信息科学与技术国家
研究
中心(
清华大学
)
清华大学人工智能研究院
听觉
智能
研究
中心
出处
《信息安全研究》
2020年第7期615-621,共7页
文摘
近年来,随着移动互联网和物联网的快速发展以及自助终端、无人商店等新业态的兴起,线上网络空间或线下自助空间的无监督身份认证成为人们日常生活不可或缺的部分,需要进行无监督身份认证的场景呈指数级增加.目前,生物特征识别成为用户自我证明的最主要手段,然而部分生物特征一旦泄露,遭到非法利用或非本人意愿情况下"被认证",将严重损害用户自身利益.因此,针对无监督情形下的可信身份认证进行了深度分析,提出了无监督身份认证的五性要求,综合比较了各类生物特征的认证特点及其短板,分析了声纹识别技术运用于无监督可信身份认证的优势,以及基于"声纹+"多维度技术融合用于"从实人到实意"的可信身份认证未来趋势.
关键词
无监督身份认证
五性要求
生物特征识别
声纹识别
“声纹+”技术
可信身份认证
Keywords
unsupervised identity authentication
five-feature requirement
biometric recognition
“Voiceprint+”technology
trusted identity authentication
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于C-V2X的车路协同自动驾驶关键技术与应用
被引量:
15
17
作者
王鲲
董振江
杨凡
周谷越
机构
北京百度智行科技有限公司
南京邮电
大学
清华大学
人工智能
产业
研究院
出处
《电信科学》
2023年第3期45-60,共16页
基金
科技创新2030——“新一代人工智能”重大项目(No.2022ZD0115504)。
文摘
随着车联网技术的演进,自动驾驶在单车智能的基础上,又有了新的发展形态——车路协同自动驾驶。通过“人-车-路-云”深度融合形成的一体化复杂信息物理系统(cyber physical system,CPS),可以与自动驾驶车辆实现协同感知、协同决策规划甚至协同控制,提升自动驾驶安全性,帮助克服各类复杂交通环境。首先介绍了车路协同的复杂信息物理系统的概念内涵和总体架构,并提出了车路协同自动驾驶的一系列典型应用场景、技术原理、C-V2X(cellular vehicle-to-everything)性能要求、车路协同系统功能与性能要求,可以为下一阶段智能网联汽车与智能交通的深度融合发展提供参考和解决思路。
关键词
自动驾驶
蜂窝车联网
网联自动驾驶车辆
车路协同自动驾驶
Keywords
autonomous driving
C-V2X
connected and automated vehicle
VICAD
分类号
U471.15 [机械工程—车辆工程]
在线阅读
下载PDF
职称材料
题名
概率式关联可信中文知识图谱——“文脉”
18
作者
李文浩
刘文长
孙茂松
矣晓沅
机构
清华大学
计算机科学与技术系
清华大学人工智能研究院
北京信息科学与技术国家
研究
中心
加州
大学
戴维斯分校计算机科学系
江苏高校语言能力协同创新中心
微软亚洲
研究院
出处
《中文信息学报》
CSCD
北大核心
2022年第12期67-73,共7页
基金
国家社会科学基金(18ZDA238)
文摘
国内现有的中文知识图谱往往以维基百科、百度百科等群体智能贡献的知识库作为资源抽取得到,但这些知识图谱利用的主要是百科的实体名片信息和分类体系信息。然而,这些百科中也有大量的内部链接信息,其中蕴含了大量知识。故而该文中利用维基百科的内部链接构造边,并统计目标实体在源实体定义文本中出现的频度,利用其对应的TF-IDF值作为边权,构造了一个概率式中文知识图谱。该文还提出了一种可信链接筛选算法,对偶发链接进行了去除,使知识图谱更加可信。基于上述方法,该文挖掘出了一个概率式关联可信中文知识图谱,命名为“文脉”,将其在GitHub上进行了开源,以期能对知识指导的自然语言处理以及其他下游任务有所襄助。
关键词
维基百科
知识图谱构建
可信链接筛选
Keywords
Wikipedia
knowledge graph construction
reliable link screening
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
人工智能的安全风险与防范
郑方
《信息安全研究》
CSCD
北大核心
2024
2
在线阅读
下载PDF
职称材料
2
机器语言能力和人工智能如何助力乡村振兴
孙茂松
《语言科学》
CSSCI
北大核心
2022
2
在线阅读
下载PDF
职称材料
3
让国产大模型产业更好赋能经济社会发展
邓志东
《人民论坛》
北大核心
2025
2
在线阅读
下载PDF
职称材料
4
HowNet义原标注一致性检验方法研究
刘阳光
岂凡超
刘知远
孙茂松
《中文信息学报》
CSCD
北大核心
2021
8
在线阅读
下载PDF
职称材料
5
中文开放域问答系统数据增广研究
杜家驹
叶德铭
孙茂松
《中文信息学报》
CSCD
北大核心
2022
2
在线阅读
下载PDF
职称材料
6
瓶装数据:一种极端环境下的终端数据安全新机制
支录奎
郑方
国强
成舸
支野
《信息安全研究》
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
7
基于百科语料的中英文双语词典提取
王星
单力秋
侯磊
于济凡
陈吉
陶明阳
《中文信息学报》
CSCD
北大核心
2021
2
在线阅读
下载PDF
职称材料
8
声纹识别在数字人民币中的应用探析
舒皓
向银杉
成舸
郑方
《信息安全研究》
2022
2
在线阅读
下载PDF
职称材料
9
基于维基百科的冬奥会概念下的低频词条双语迭代扩展
王星
陶明阳
侯磊
于济凡
单力秋
张馨如
陈吉
《中文信息学报》
CSCD
北大核心
2021
0
在线阅读
下载PDF
职称材料
10
基于数据增广和CNN的地震随机噪声压制
王钰清
陆文凯
刘金林
张猛
苗永康
《地球物理学报》
SCIE
EI
CAS
CSCD
北大核心
2019
71
在线阅读
下载PDF
职称材料
11
基于神经网络的集句诗自动生成
梁健楠
孙茂松
矣晓沅
杨成
陈慧敏
刘正皓
《中文信息学报》
CSCD
北大核心
2019
9
在线阅读
下载PDF
职称材料
12
基于局部语义相关性的定义文本义原预测
杜家驹
岂凡超
孙茂松
刘知远
《中文信息学报》
CSCD
北大核心
2020
4
在线阅读
下载PDF
职称材料
13
基于生活日志的情绪识别
王鹏宇
张敏
马为之
刘奕群
马少平
《中文信息学报》
CSCD
北大核心
2021
1
在线阅读
下载PDF
职称材料
14
融合注意力机制和指针标注的实体关系联合抽取方法
唐楠楠
陈吉
侯磊
王星
《小型微型计算机系统》
CSCD
北大核心
2023
4
在线阅读
下载PDF
职称材料
15
基于深度神经网络的诗词检索
梁健楠
孙茂松
矣晓沅
《中文信息学报》
CSCD
北大核心
2020
3
在线阅读
下载PDF
职称材料
16
基于“声纹+”的无监督可信身份认证
张慧
王钰
成舸
向银杉
郑方
《信息安全研究》
2020
1
在线阅读
下载PDF
职称材料
17
基于C-V2X的车路协同自动驾驶关键技术与应用
王鲲
董振江
杨凡
周谷越
《电信科学》
2023
15
在线阅读
下载PDF
职称材料
18
概率式关联可信中文知识图谱——“文脉”
李文浩
刘文长
孙茂松
矣晓沅
《中文信息学报》
CSCD
北大核心
2022
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部