-
题名基于大语言模型的体检总检结论自动生成研究
- 1
-
-
作者
郑路程
李旭涛
徐敏
-
机构
首都师范大学信息工程学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2024年第11期2569-2575,共7页
-
基金
国家自然科学基金项目(62177034)资助.
-
文摘
本文研究了基于大语言模型自动生成体检总检结论的方法.与常规文本摘要生成任务不同,体检总检结论的生成特别关注体检异常检查结果,要求生成结论不仅准确,还需遵循医学领域的专业知识和标准.为此,本文基于经医疗知识问答数据微调的大型预训练语言模型,提出了一个体检总检结论自动生成方法.该方法包括两个关键模块:1)异常信息抽取模块,利用少量标注数据增强模型在抽取科室小结中异常检查结果识别能力;2)结论项排序模块,使得生成内容符合体检总检结论的顺序规范.在真实体检数据集上的实验表明,这两个核心模块有效提升了总检结论生成质量.本文为医疗文档自动生成技术提供了新思路,展现了大语言模型在医疗人工智能应用中的前瞻性.
-
关键词
体检科室小结
体检总检结论
大语言模型
异常文本抽取
结论项重排
医疗问答
-
Keywords
departmental examination results
healthcare examination summary
large-scale pre-trained language models
abnormal information extraction
summary item sequencing
medical question and answer
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名自动问答综述
被引量:168
- 2
-
-
作者
郑实福
刘挺
秦兵
李生
-
机构
哈尔滨工业大学信息检索实验室
-
出处
《中文信息学报》
CSCD
北大核心
2002年第6期46-52,共7页
-
基金
哈尔滨工业大学校自然科学基金项目 (HIT 2 0 0 0 5 0 )
-
文摘
自动问答技术是自然语言处理领域中一个非常热门的研究方向 ,它综合运用了各种自然语言处理技术。本文介绍了自动问答技术的发展现状和自动问答系统中常用的技术。自动问答系统一般包括三个主要组成部分 :问题分析、信息检索和答案抽取。本文分别介绍了这三个主要组成部分的主要功能和常用的方法。最后还介绍了自动问答系统的评价问题。
-
关键词
自动问答
问题分类
信息检索
答案抽取
自然语言处理
问题分析
-
Keywords
question answering
question classification
information retrieval
answer extraction
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名基于潜在语义分析的汉语问答系统答案提取
被引量:45
- 3
-
-
作者
余正涛
樊孝忠
郭剑毅
耿增民
-
机构
昆明理工大学信息工程与自动化学院
北京理工大学计算机科学工程系
-
出处
《计算机学报》
EI
CSCD
北大核心
2006年第10期1889-1893,共5页
-
基金
教育部博士点基金(20050007023)
国家自然科学基金(60663004)
云南省信息技术基金(2002IT03)资助.
-
文摘
为了解决在汉语问答系统答案提取时,由于词的同义或多义现象而导致的“漏提”或“错提”等问题,提出了一种基于潜在语义分析(LSA)的问题和答案句子相似度计算方法.它利用空间向量模型作为问题和句子的表示方法,借助于潜在语义分析理论,对大量问答作句子语料统计分析,构建了一个潜在的词-句子语义空间,从而消除了词之间的相关性,并在语义空间上实现了问题与答案句子相似度计算,有效地解决了词的同义和多义问题.最后结合问题类型和相似度计算结果,对汉语基于事实的简单陈述问题进行了答案句子提取实验.答案提取的MRR值达到了0.47,明显优于空间向量模型.结果说明该方法具有很好的效果.
-
关键词
问答系统
答案提取
相似度
向量空间模型
潜在语义分析
-
Keywords
question-answering system
answer extracting
similarity
Vector Space Model (VSM)
Latent Semantic Analysis (LSA)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于句法结构分析的中文问题分类
被引量:83
- 4
-
-
作者
文勖
张宇
刘挺
马金山
-
机构
哈尔滨工业大学信息检索研究室
-
出处
《中文信息学报》
CSCD
北大核心
2006年第2期33-39,共7页
-
基金
国家自然科学基金资助项目(60435020)
-
文摘
问题分类是问答系统中重要的组成部分,问题分类结果的好坏直接影响问答系统的质量。本文提出了一种用于问题分类的特征提取的新方法,该方法主要使用句法分析的结果,提取问题的主干和疑问词及其附属成分作为分类的特征,此方法大幅度地减少了噪音,突出了问题分类的主要特征,利用贝叶斯分类器分类,有效地提高了问题分类的精度。实验结果证明了该方法的有效性,大类和小类的分类精度分别达到了86.62%和71.92%,取得了较好的效果。
-
关键词
计算机应用
中文信息处理
问答系统
问题分类
特征提取
句法分析
-
Keywords
computer application
Chinese information processing
question answering system
question classification
feature extraction
syntactic parsing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名问答式检索技术及评测研究综述
被引量:48
- 5
-
-
作者
吴友政
赵军
段湘煜
徐波
-
机构
中国科学院自动化研究所模式识别国家重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2005年第3期1-13,共13页
-
基金
国家自然科学基金资助项目 (6 0 372 0 16
6 0 2 72 0 4 1)
北京市自然科学基金资助项目 (40 5 2 0 2 7)
-
文摘
问答式检索系统(简称问答系统)是集自然语言处理技术和信息检索技术于一身的新一代搜索引擎。它的出现旨在提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。经过这几年的发展,问答系统已经成为自然语言处理领域和信息检索领域的一个重要分支和新兴的研究热点,其“通过系统化、大规模地定量评测推动研究向前发展”的发展轨迹,以及某些成功的启示,如基于字符表层的文本分析技术(模板技术)的有效性,快速、浅层自然语言处理技术的必要性,都极大地推动了自然语言处理研究的发展,促进了NLP研究与应用的紧密结合。回顾问答系统研究的历史,总结问答技术的研究现状,将有助于这方面工作向前发展。
-
关键词
人工智能
自然语言处理
综述
问答系统
问答评测
信息抽取
信息检索
-
Keywords
artificial intelligence
natural language processing
overview
question answering
evaluation of QA
information retrieval
information extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于网络的中文问答系统及信息抽取算法研究
被引量:46
- 6
-
-
作者
崔桓
蔡东风
苗雪雷
-
机构
沈阳航空工业学院自然语言处理实验室
-
出处
《中文信息学报》
CSCD
北大核心
2004年第3期24-31,共8页
-
文摘
问答系统 (QuestionAnsweringSystem)能用准确、简洁的答案回答用户用自然语言提出的问题。目前多数问答系统利用大规模文本作为抽取答案的知识库 ,而网络上丰富的资源为问答系统提供了另外一种良好的知识来源 ,对于回答简短、基于事实的问题非常有效。本文对基于网络的问答系统研究现状作了简要的介绍 ,分析了网络信息的特点。我们提出了一种基于语句相似度计算的答案抽取方法 ,在此基础上实现了一个基于网络的中文问答系统。该系统只利用网络搜索引擎返回结果中的摘要部分作为答案抽取的资源 ,从而节省了下载、分析网络源文本的时间。实验结果表明该系统对人名、数量及时间类型的问题效果显著 ,对测试问题集的MRR值达到 0 5 1。
-
关键词
计算机应用
中文信息处理
问答系统
句子相似度
信息抽取
-
Keywords
computer application
Chinese information processing
question answering system
sentence similarity
information extraction
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名汉语问答系统答案提取方法研究
被引量:8
- 7
-
-
作者
余正涛
樊孝忠
宋丽哲
高盛祥
-
机构
昆明理工大学信息工程与自动化学院
北京理工大学计算机科学工程系
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第3期183-185,共3页
-
基金
云南省信息技术基金资助项目(2002IT03)
-
文摘
答案提取是问答系统的关键部分,文章介绍了汉语问答系统的基本结构及其实现过程,以问题和答案中关键词的词频统计特性为基础,进一步考虑问题和句子中关键词位置分布信息,提出了一种结合向量空间模型(VSM)和关键词最小匹配距离的问题和句子相似度的计算方法。并以相似度为基础,结合问题类别,对汉语基于事实的简单陈述问题进行了答案句子提取实验,结果表明该方法有较好的效果。
-
关键词
问答系统
答案提取
相似度
向量空间模型
最小匹配距离
-
Keywords
question-answering system
answer extracting
similarity
Vector space model
Minimal matching span
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名问答系统研究综述
被引量:60
- 8
-
-
作者
毛先领
李晓明
-
机构
北京大学信息科学技术学院
-
出处
《计算机科学与探索》
CSCD
2012年第3期193-207,共15页
-
基金
国家自然科学基金No.60933004~~
-
文摘
近年来,问答系统被大量广泛地研究。问答系统的目标是给定一个问题,能够得到简短、精确的答案。根据处理数据的不同,将问答系统分为三类:基于结构化数据的问答系统、基于自由文本的问答系统、基于问题答案对的问答系统。对这三大类系统的特点、面临的问题和相关的研究分别进行了叙述和总结。最后,讨论了问答系统未来可能的研究方向。
-
关键词
问答系统(QA)
传统问答系统(TQA)
基于社区的问答系统(CQA)
信息检索
答案抽取
-
Keywords
question and answering (QA)
traditional question and answering (TQA)
community-based questionand answering (CQA)
information retrieval
answer extraction
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于浅层语义树核的阅读理解答案句抽取
被引量:14
- 9
-
-
作者
张志昌
张宇
刘挺
李生
-
机构
哈尔滨工业大学计算机学院信息检索研究室
-
出处
《中文信息学报》
CSCD
北大核心
2008年第1期80-86,共7页
-
基金
国家自然科学基金资助项目(60435020
60675034)
国家863项目(2006AA01Z145)
-
文摘
阅读理解系统是通过对一篇自然语言文本的分析理解,对用户根据该文本所提的问题,自动抽取或者生成答案。本文提出一种利用浅层语义信息的英文阅读理解抽取方法,首先将问题和所有候选句的语义角色标注结果表示成树状结构,用树核(tree kernel)的方法计算问题和每个候选句之间的语义结构相似度,将该相似度值和词袋方法获得的词匹配数融合在一起,选择具有最高分值的候选句作为最终的答案句。在Remedia测试语料上,本文方法取得43.3%的HumSent准确率。
-
关键词
计算机应用
中文信息处理
阅读理解
答案句抽取
浅层语义
树核
-
Keywords
computer application
Chinese information processing
reading comprehension
answer sentence extraction
shallow semantic
tree kernel
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Web的问答系统综述
被引量:20
- 10
-
-
作者
李舟军
李水华
-
机构
北京航空航天大学计算机学院
-
出处
《计算机科学》
CSCD
北大核心
2017年第6期1-7,42,共8页
-
基金
国家自然科学基金项目(61672081
U1636211)
+1 种基金
国家863计划项目(2015AA016004)
北京成像技术高精尖创新中心项目(BAICIT-2016001)资助
-
文摘
微软小冰引发了问答系统的新一轮研究热潮。作为一种新型的信息检索方式,问答系统能直接以自然语言与用户进行人性化的交互。而基于Web的问答系统能通过搜索引擎获取开放的互联网上的各种相关信息,并将以自然语言形式表述的准确答案返回给用户,因此此类系统同时具有搜索引擎和问答系统的优点。首先,对基于Web的问答系统的研究背景与发展历史进行了概述;然后,详细介绍了基于Web的问答系统的架构及其问题分析、信息检索、答案抽取这三大关键技术的研究进展;在此基础上,分析了基于Web的问答系统所面临的问题;最后,对基于Web的问答系统的未来发展趋势进行了展望。
-
关键词
问答系统
基于Web的问答系统
问题分析
信息检索
答案抽取
-
Keywords
question answering
Web-based question answering
question analysis
information retrieval
answer extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于网络的中文问答系统的研究
被引量:6
- 11
-
-
作者
王宇
战学刚
蔡建山
-
机构
鞍山科技大学计算机科学与工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第7期162-165,共4页
-
文摘
文章设计并实现了一个基于网络的中文问答系统。该系统只利用网络搜索引擎返回结果中的摘要部分作为答案抽取的资源,从而节省了下载、分析网络源文本的时间,提出了一种针对该系统的信息抽取算法,并采用一种基于语句相似度计算的答案抽取算法并且进行了改进。实验结果表明该系统对人名及时间类型的问题效果显著。对测试问题集的MRR值达到0.47。
-
关键词
问答系统
句子相似度
信息抽取
答案抽取
-
Keywords
question answering system,sentence similarity,information extraction,answer extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名自动问答系统研究综述
被引量:21
- 12
-
-
作者
刘里
曾庆田
-
机构
山东科技大学信息科学与工程学院
-
出处
《山东科技大学学报(自然科学版)》
CAS
2007年第4期73-76,共4页
-
基金
国家自然科学基金(60603090)
山东省优秀中青年科学家奖励基金(2006BSB01171)
山东省泰山学者专项基金
-
文摘
自动问答系统是自然语言处理领域中一个非常热门的研究方向,它综合运用了多种自然语言处理技术。本文综述了国内外自动问答技术的发展现状,对系统三个主要组成部分:问题分析、信息检索和答案抽取进行了深入的分析,通过比较,得出了自动问答系统运用各类技术之间的优势与不足。在此基础上,提出了自动问答系统的发展方向。
-
关键词
自动问答系统
问题处理
信息检索
答案抽取
-
Keywords
automatic question and answering system
question processing
information retrieval
answer extraction.
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名面向问答的数值信息抽取
被引量:3
- 13
-
-
作者
张桂平
张宁
白宇
-
机构
沈阳航空航天大学人机智能研究中心
-
出处
《郑州大学学报(理学版)》
CAS
北大核心
2018年第4期21-25,30,共6页
-
基金
教育部人文社会科学研究项目(17YJCZH003)
辽宁省自然科学基金项目(20170540696)
沈阳市科技计划项目(17-231-1-82)
-
文摘
数值信息作为数据的一种直观表达方式,能够真实、有效地表达数据的量化含义.完整的数值信息要素包含有数字,数字的量化对象,如:主体及其属性,以及时空约束条件.对文本中蕴含的数值信息进行有效识别和抽取,并以问答的形式反馈给用户是大数据挖掘的重要意义,越来越受到学术界和产业界的关注.提出了一种基于数值模板结合条件随机场的数值信息抽取方法,该方法利用数值相关知识来制定数值信息抽取模板,对文本模式匹配,并使用条件随机场修补模板的局限性.实验结果的准确率、召回率和F值分别为0.847、0.665和0.745.
-
关键词
数值信息抽取
数值模板
问答
-
Keywords
numerical information extraction
numerical templates
questions and answers
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于答案模式和语义特征融合的答案抽取方法
被引量:3
- 14
-
-
作者
田卫东
祖永亮
-
机构
合肥工业大学计算机与信息学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第13期127-130,共4页
-
基金
国家自然科学基金 No.60828005~~
-
文摘
答案抽取是问答系统的关键技术。根据对问题-答案的分析可知,它们之间不仅存在语义上的相似性,而且还有句法上的关联性。提出了一种基于问题-答案之间句法模式和句子语义二元特征融合的答案抽取方法。通过对不同的特征赋予不同的权值来调节各特征对答案抽取准确率计算的贡献。与其他方法相比,描述答案的信息更加全面,答案抽取更加准确。
-
关键词
答案抽取
问答系统
特征融合
句义相似
模式匹配
-
Keywords
answer extraction
question answering
feature fusion
sentence similarity
pattern matching
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-
-
题名综合句法结构及语义相似度的问题推荐技术
被引量:7
- 15
-
-
作者
段利国
陈俊杰
-
机构
太原理工大学计算机科学与技术学院
-
出处
《计算机科学》
CSCD
北大核心
2012年第1期203-206,共4页
-
基金
国家自然科学基金项目(60970059)
山西省国际科技合作计划项目(2009081022)资助
-
文摘
针对因特网上的大规模问答对资源提出一种新的应用,即在问答系统中加入基于百度知道平台构建的大规模问答对库,通过相似度计算,把库中最相似的问题推荐给用户。实验下载网页10500个,成功提取问答对4687个,运用关键词的TF/IDF、树核函数的句法匹配及问句的语义距离3种方法中的一种、两种和三种进行实验,分别获得79.44%,81.67%和88.33%的准确率。结果表明,综合运用多种方法查找相似问题,效果更好。
-
关键词
问答系统
信息抽取
问题推荐
语义距离
树核函数
-
Keywords
syntax match of tree kernel function
semantic distance of sentences synthetically were given to illustrate the proposed technique.The application of our experiments obtained accurate rate by 79.44%
81.67% and 88.33% respectively in terms of using 1
2 or 3 methods abovementioned.The experimental results show that using one more methods synthetically to calculate similarity can acquire more preferable effects. Key words:question and answer system
information extraction
question recommend
Semantic distance
Tree kernel function
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Web的中文开放式问题回答系统
- 16
-
-
作者
林旭东
彭宏
郑启伦
陈绍坚
-
机构
华南理工大学计算机科学与工程学院
-
出处
《计算机科学》
CSCD
北大核心
2006年第5期211-213,226,共4页
-
基金
广东省科技攻关项目(A10202001)
广州市科技攻关项目(2004Z2-D0091)
-
文摘
互联网正逐渐成为重要的信息资源,然而大多数搜索引擎不能处理自然语言提出的问题。基于互联网的中文问题回答系统由问题处理、信息检索、答案抽取和答案判断组成,利用命名实体识别、语义依存关系和案例规则模板实现答案抽取。实验表明:命名实体识别、语义依存关系和案例规则模板能有效地实现答案抽取,获得较高正确率。
-
关键词
问题回答
语义依存关系
命名实体识别
信息抽取
-
Keywords
question answering,Semantic dependency relations,Named entity recognition,information extraction
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于信息抽取技术的问答系统
被引量:8
- 17
-
-
作者
于根
李晓戈
刘睿
范贤
杜丽萍
-
机构
西安邮电大学计算机学院
-
出处
《计算机工程与设计》
北大核心
2017年第4期1051-1055,共5页
-
基金
国家自然科学基金项目(61373116)
陕西省普通高等学校重点学科专项资金建设基金项目(112-1602)
西安邮电大学研究生创新基金项目(ZL2013-34)
-
文摘
通过分析实体关系和命名实体,提出基于层次的答案提取方法。在将问题分为实体关系型、实体型和关键词型3类的基础上,按照实体关系层、实体层、关键词层得到答案集,利用基础特征、命名实体匹配和实体关系匹配进行特征排序提取答案。基于NLPCCEVAL2015的测试结果表明,在考虑命名实体和实体关系的情况下,准确率比仅使用基础特征的情形提高了6.1%,达到54.05%。
-
关键词
问答系统
信息抽取
实体关系
命名实体
层次法
-
Keywords
question answer system
information extraction
entity relation
named entity
hierarchical method
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名知识库问答系统中实体关系抽取方法研究
被引量:14
- 18
-
-
作者
张芳容
杨青
-
机构
武汉理工大学计算机科学与技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2020年第11期219-224,共6页
-
基金
国家自然科学基金(No.51179146)。
-
文摘
针对现有的中文开放领域知识库问答系统缺乏对多关系问答的支持,将知识库问答过程分为实体识别、实体关系抽取和答案检索三个步骤,重点讨论了实体关系抽取的实现方法。在实体关系抽取阶段,提出一种基于规则的关系词提取方法抽取问句中的关系词,然后将关系词与知识库中的谓词进行相似度计算,得到关系集合,结合实体识别的结果,将问句转换为具有语义信息的三元组形式。实验结果表明,该方法可以支持多关系问答,并且具有较高的平均F1分数。
-
关键词
知识库问答
实体关系抽取
相似度计算
-
Keywords
knowledge-based question answering
entity relation extraction
similarity calculation
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名预训练语言模型的应用综述
被引量:18
- 19
-
-
作者
孙凯丽
罗旭东
罗有容
-
机构
广西多源信息挖掘与安全重点实验室
广西师范大学计算机科学与工程学院/软件学院
剑桥大学伊曼纽尔学院
-
出处
《计算机科学》
CSCD
北大核心
2023年第1期176-184,共9页
-
基金
广西多源信息挖掘与安全重点实验室系统性研究课题(22-A-01-02)。
-
文摘
近年来,预训练语言模型发展迅速,将自然语言处理推到了一个全新的发展阶段。文中的综述旨在帮助研究人员了解强大的预训练语言模型在何处以及如何应用于自然语言处理。具体来讲,首先简要回顾了典型的预训练模型,包括单语言预训练模型、多语言预训练模型以及中文预训练模型;然后讨论了这些预训练模型对5个不同的自然语言处理任务的贡献,即信息提取、情感分析、问答系统、文本摘要和机器翻译;最后讨论了预训练模型的应用所面临的一些挑战。
-
关键词
预训练语言模型
自然语言处理
深度学习
信息提取
情感分析
问答系统
文本摘要
机器翻译
-
Keywords
Pretrained language model
Natural language process
Deep learning
information extraction
Sentiment analysis
question answering system
Text summarization
Machine translation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于短语检索和答案排序的列表问题回答方法
- 20
-
-
作者
袁晓丰
邱锡鹏
吴立德
黄萱菁
-
机构
复旦大学计算机科学与工程系
-
出处
《中文信息学报》
CSCD
北大核心
2008年第5期74-79,共6页
-
基金
国家自然科学基金重点资助项目(60435020
60673038)
-
文摘
文章针对列表类自动问题回答的任务要求,提出了一种基于短语检索和答案距离排序模型的列表类问题回答的方法。该短语检索模型在传统的TF/IDF检索模型上进行改进,提出了利用不同长度短语作为查询词的检索方法,能够返回更多包含正确答案的相关文档;答案的距离排序模型则利用答案与上下文词之间的距离作为排序的依据对答案列表进行排序,可以提高正确答案的排名。这两种模型地提出在一定程度上解决了如何在返回尽可能多的答案的同时保证答案质量的问题。实验结果表明利用这两种模型的列表类问题回答方法对系统的性能有显著提高。
-
关键词
计算机应用
中文信息处理
问题回答
文档检索
信息抽取
-
Keywords
computer application
Chinese information processing
question answering
document retrieval
information extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-