期刊文献+
共找到4,516篇文章
< 1 2 226 >
每页显示 20 50 100
自然语言处理与信息检索系统 被引量:23
1
作者 邱君瑞 《情报杂志》 CSSCI 北大核心 2002年第3期47-48,共2页
把自然语言处理的理解层面从低级到高级划分为七个层次:即语音层次→词形层次→词汇层次→句法层次→语义层次→语用层次→语境层次。在此基础上,探讨了自然语言处理在信息检索系统中的应用。
关键词 自然语言处理 情报检索 信息检索系统 智能化
在线阅读 下载PDF
第四届自然语言处理与信息检索国际会议
2
作者 本刊记者 《语言科学》 CSSCI 北大核心 2020年第4期435-435,共1页
第四届自然语言处理与信息检索国际会议(The 4 th International Conference on Natural Language Processing and Information Retrieval)定于2020年12月18-20日在韩国首尔世宗大学召开,由第四届自然语言处理与信息检索国际会议委员会... 第四届自然语言处理与信息检索国际会议(The 4 th International Conference on Natural Language Processing and Information Retrieval)定于2020年12月18-20日在韩国首尔世宗大学召开,由第四届自然语言处理与信息检索国际会议委员会主办。本届研讨会主要领域包括促进自然语言处理与信息检索等领域的学术交流与合作。主要议题包括但不限于:知识获取与表达;基于理论和模型的分析技术;文本分类与发掘;语音识别与合成;自动文本生成。 展开更多
关键词 自然语言处理 信息检索 文本分类 文本生成 语音识别与合成 获取与表达 主要议题
在线阅读 下载PDF
基于自然语言处理的施工安全需求信息提取
3
作者 吴志江 刘梦瑶 马国丰 《中国安全科学学报》 北大核心 2025年第6期51-59,共9页
为解决潜藏在项目文档中的施工安全需求信息因欠缺关联性、语义模糊而难以被发掘的问题,开发一种结合自然语言处理(NLP)技术的2阶段集成框架,用于项目文档分析并进行需求信息的分类提取。首先,结合NLP的多元技术获取待评估工程的安全目... 为解决潜藏在项目文档中的施工安全需求信息因欠缺关联性、语义模糊而难以被发掘的问题,开发一种结合自然语言处理(NLP)技术的2阶段集成框架,用于项目文档分析并进行需求信息的分类提取。首先,结合NLP的多元技术获取待评估工程的安全目标,并基于主题模型建立关联模型以推荐合适的施工安全需求类型;然后,考虑3类要素的语义特征,分别采用关键词分析、情感分析以及依存关系分析对3类要素进行提取;最后,以2类建筑工程(民用和工业建筑)为例,开展施工安全需求的分类提取测试。结果表明:2阶段集成框架分别为民用建筑和工业建筑推荐到4种合适的需求类型,结合词性和词汇情感色彩能够有效提取到需求关键词和行为观点词,并且主体要素在补充建筑类型说明后的提取精度可达到88.6%;测试结果证实响应安全目标特征能够从繁杂的施工安全需求信息中推荐出适宜类型,而结合自然语言处理的需求信息分类提取可以避免主观偏好以提高信息提取精度。 展开更多
关键词 自然语言处理(NLP) 施工安全需求 需求信息 项目文档 需求类型
在线阅读 下载PDF
自然语言处理在信息检索中的应用综述 被引量:51
4
作者 王灿辉 张敏 马少平 《中文信息学报》 CSCD 北大核心 2007年第2期35-45,共11页
在信息检索①发展的过程中,研究者们不断尝试着将自然语言处理应用到检索里,希望能够为检索效果提高带来帮助。然而这些尝试的结果大多和研究者们最初的设想相反,自然语言处理在大多数情况下没有改进信息检索效果,甚至反而起了负面作用... 在信息检索①发展的过程中,研究者们不断尝试着将自然语言处理应用到检索里,希望能够为检索效果提高带来帮助。然而这些尝试的结果大多和研究者们最初的设想相反,自然语言处理在大多数情况下没有改进信息检索效果,甚至反而起了负面作用。即便有一些帮助,也往往是微小的,远远不如自然语言处理所需要的计算消耗那么大。研究者们对这些现象进行了分析,认为:自然语言处理更适合于应用在需要精确结果的任务中,例如问答系统、信息抽取等;自然语言处理需要针对信息检索进行优化才可能发挥积极作用。最新的一些进展(例如在语言模型中加入自然语言处理)在一定程度上印证了这一结论。 展开更多
关键词 人工智能 自然语言处理 综述 信息检索
在线阅读 下载PDF
基于自然语言处理的信息检索 被引量:5
5
作者 于志敏 张文德 《山东科技大学学报(自然科学版)》 CAS 2006年第1期122-124,共3页
介绍了信息检索的主要技术热点,分析了实现信息检索的关键技术,并就基于自然语言处理的信息检索的实现技术进行了讨论。
关键词 自然语言处理 信息检索 技术热点 实现技术
在线阅读 下载PDF
语义理解下的自然语言处理及信息检索模型 被引量:4
6
作者 吴晨 张全 +1 位作者 缪建明 韦向峰 《计算机科学》 CSCD 北大核心 2008年第5期113-118,共6页
本文从如何利用语义来构建理想信息检索系统的角度出发,以HNC自然语言理解体系为基础,给出了一种在这一体系下分步构建信息检索系统的实施方案。结合HNC在信息检索方面新近取得的研究成果,从理论和工程两个角度介绍了这一体系服务于信... 本文从如何利用语义来构建理想信息检索系统的角度出发,以HNC自然语言理解体系为基础,给出了一种在这一体系下分步构建信息检索系统的实施方案。结合HNC在信息检索方面新近取得的研究成果,从理论和工程两个角度介绍了这一体系服务于信息检索的相关内容,讨论了其中几个重要模型的实现方法。最后沿着方案思路给出了在目前成果基础上进一步发展检索系统的展望。 展开更多
关键词 信息检索 自然语言理解 语义 HNC
在线阅读 下载PDF
大语言模型的“语言”跟自然语言性质迥然不同 被引量:4
7
作者 陆俭明 《语言战略研究》 北大核心 2025年第1期1-1,共1页
大语言模型的诞生“在人类历史上称得上史无前例的技术成就”(孙茂松),因为这使机器真正能跟人自由对话了。先前的自然语言处理——具体到汉语就是中文信息处理,其目的就是要让机器能理解我们人所说的话语,反过来又能生成让我们人能接... 大语言模型的诞生“在人类历史上称得上史无前例的技术成就”(孙茂松),因为这使机器真正能跟人自由对话了。先前的自然语言处理——具体到汉语就是中文信息处理,其目的就是要让机器能理解我们人所说的话语,反过来又能生成让我们人能接受的话语,以实现“人机对话”。为达到此目的,上世纪70年代解决了“字处理”问题;80年代进一步解决了“词处理”问题,包括分词和词性标注;90年代逐步解决了“句处理”问题,包括句子的句法分析和语义分析。 展开更多
关键词 中文信息处理 自然语言处理 句法分析 词性标注 语义分析 人机对话 语言模型 分词
在线阅读 下载PDF
信息检索自然语言查询问句处理框架 被引量:3
8
作者 熊文新 宋柔 《计算机科学》 CSCD 北大核心 2006年第10期144-147,204,共5页
以自然语言形式提出的查询问句不同于通常的关键词或主题词查询,需要提取用户真正要检索的信息内容。该文提出一个自然语言查询语句的处理框架,由3个部分构成:(1)离析查询问句的操作表述和信息内容;(2)凸显真正的信息需求内容;(3)对不... 以自然语言形式提出的查询问句不同于通常的关键词或主题词查询,需要提取用户真正要检索的信息内容。该文提出一个自然语言查询语句的处理框架,由3个部分构成:(1)离析查询问句的操作表述和信息内容;(2)凸显真正的信息需求内容;(3)对不同信息内容采取不同的词语实现方法。这一处理可望为自然语言信息检索提供准确的用户需求分析。 展开更多
关键词 信息检索 查询请求 查询表述
在线阅读 下载PDF
基于自然语言处理的通用信息模型自动调试 被引量:1
9
作者 项炜 《计算机应用》 CSCD 北大核心 2013年第5期1446-1449,共4页
通用信息模型(CIM)是工业界的一种公开标准,并已实现于很多产品中,大量的bug被发现和修复。为了减少了人工查找错误根源所需的时间和精力,提出一种基于自然语言处理的方法对CIM的bug进行自动调试。首先使用最大熵模型对已解决bug的文档... 通用信息模型(CIM)是工业界的一种公开标准,并已实现于很多产品中,大量的bug被发现和修复。为了减少了人工查找错误根源所需的时间和精力,提出一种基于自然语言处理的方法对CIM的bug进行自动调试。首先使用最大熵模型对已解决bug的文档描述进行分词,然后基于构建的词典使用simHash找出那些重复性很大的已修复的bug,最后使用文档处理的方法分析客户提供的trace找出问题所在和解决方法。实验结果取得了87.5%准确率,表明了该方法的有效性。 展开更多
关键词 通用信息模型 自然语言处理 最大熵模型 调试 文档处理
在线阅读 下载PDF
第二十一届自然语言处理青年学者研讨会(YSSNLP2024)顺利召开
10
作者 《中文信息学报》 CSCD 北大核心 2024年第7期157-157,共1页
2024年6月14日至16日,由中国中文信息学会青年工作委员会主办,昆明理工大学承办的第二十一届全国自然语言处理青年学者研讨会(YSSNLP 2024)在云南昆明顺利召开。本次会议的主题为"智能生成赋能中文信息,开放交流推动通用智能!
关键词 昆明理工大学 中文信息 自然语言处理 青年学者 开放交流 云南昆明 SNL 智能生成
在线阅读 下载PDF
第十届全国少数民族自然语言处理青年论坛征文通知
11
作者 《中文信息学报》 CSCD 北大核心 2024年第3期129-129,共1页
“第十届全国少数民族自然语言处理青年论坛”将于2024年7月19日—21日在内蒙古自治区锡林郭勒盟锡林浩特市举行。会议由中国中文信息学会少数民族语言文字信息专业委员会主办,呼和浩特民族学院和锡林郭勒职业学院承办。会议旨在为全国... “第十届全国少数民族自然语言处理青年论坛”将于2024年7月19日—21日在内蒙古自治区锡林郭勒盟锡林浩特市举行。会议由中国中文信息学会少数民族语言文字信息专业委员会主办,呼和浩特民族学院和锡林郭勒职业学院承办。会议旨在为全国各民族NLP青年学者提供一个学术交流平台。 展开更多
关键词 青年论坛 自然语言处理 中文信息 锡林浩特市 学术交流平台 少数民族语言文字 锡林郭勒盟 青年学者
在线阅读 下载PDF
基于AI算法的自然语言信息提取-翻译-校对系统设计 被引量:5
12
作者 崔丹 李舒淇 《现代电子技术》 北大核心 2024年第10期111-116,共6页
自20世纪90年代起,随着人工智能(AI)的飞速发展及其与深度学习等机器学习方法的广泛融合,自然语言处理(NLP)作为人工智能的核心,也取得了令人瞩目的进步。而随着国际学术交流、世界文化交融愈加频繁,人们搜寻、阅读他国网络信息的现实... 自20世纪90年代起,随着人工智能(AI)的飞速发展及其与深度学习等机器学习方法的广泛融合,自然语言处理(NLP)作为人工智能的核心,也取得了令人瞩目的进步。而随着国际学术交流、世界文化交融愈加频繁,人们搜寻、阅读他国网络信息的现实需求也随之增多。当信息搜寻者在搜寻非母语信息时,不仅会出现语言障碍问题,还会因错综复杂、层次不齐的各色信息而产生诸多不便。为了便于信息搜寻者快速高效地获取有用信息,文中基于人工智能算法(PageRank/TextRank)设计一种信息提取-翻译-校对(ETP)系统。系统通过AI自动搜索阅读页面上的重要信息和文本摘取,生成摘要,并基于机器翻译API模块完成翻译;其次,采用智能校对系统完成校对审核后,将信息呈现给搜寻者,以供其对全部信息高效且准确地进行预筛选,从而节省阅读时间和精力。最后对系统算法所实现的功能进行实验测试,结果达到预期。 展开更多
关键词 AI算法 自然语言处理 信息提取 机器翻译 翻译校对 PAGERANK算法 TextRank算法
在线阅读 下载PDF
基于自然语言处理的图像情感语义检索研究 被引量:2
13
作者 于昕 郭浩 +1 位作者 李海芳 陈俊杰 《计算机应用与软件》 CSCD 北大核心 2014年第6期37-41,共5页
自然语言问答在情感图像检索中并未广泛应用,对此进行了探索与尝试,设计和实现了一个以自然语言作为检索入口的情感图像检索系统,并给出系统架构及技术方案。研究过程中,引入自然语言处理技术对自然问句进行浅层语义分析,并建立了一个... 自然语言问答在情感图像检索中并未广泛应用,对此进行了探索与尝试,设计和实现了一个以自然语言作为检索入口的情感图像检索系统,并给出系统架构及技术方案。研究过程中,引入自然语言处理技术对自然问句进行浅层语义分析,并建立了一个情感映射模型,实现了常用情感词语与该模型之间以及该模型与情感图像之间的映射。另外,还对系统的检索结果进行了评价。通过对系统的实现,为自然语言问答与情感图像检索的结合提供了一种新的思路与方法。 展开更多
关键词 自然语言处理 图像情感语义检索 情感模型映射 OCC模型PAD模型
在线阅读 下载PDF
基于XML与自然语言处理的智能化资源检索 被引量:1
14
作者 王民 吴刚 +1 位作者 肖君 高少琛 《计算机工程与科学》 CSCD 2006年第11期103-104,129,共3页
在海量信息系统中如何快速、智能地获得所需资源是非常重要的。本文以上海教育资源库为背景,给出了一个基于XML与自然语言处理的智能化资源检索方案。文中给出了系统的体系结构,阐述了支撑系统实现的多个关键技术,并就实际系统的运行情... 在海量信息系统中如何快速、智能地获得所需资源是非常重要的。本文以上海教育资源库为背景,给出了一个基于XML与自然语言处理的智能化资源检索方案。文中给出了系统的体系结构,阐述了支撑系统实现的多个关键技术,并就实际系统的运行情况和进一步的工作做了说明。 展开更多
关键词 资源检索 信息 XML 自然语言处理
在线阅读 下载PDF
检入新境:大语言模型引领的信息检索主题与知识关联演化分析 被引量:1
15
作者 陈帅朴 刘芳霖 +3 位作者 钱宇星 倪珍妮 张志剑 荣国阳 《图书情报知识》 北大核心 2025年第3期53-65,87,共14页
[目的/意义]大语言模型(Large Language Model,LLM)正在引领信息检索领域经历从简单的文档检索走向全面满足用户信息需求的新阶段,审视和探讨LLM在这一转型过程中的演化趋势及其未来发展,对于LLM赋能信息检索领域的理论模式创新与实践... [目的/意义]大语言模型(Large Language Model,LLM)正在引领信息检索领域经历从简单的文档检索走向全面满足用户信息需求的新阶段,审视和探讨LLM在这一转型过程中的演化趋势及其未来发展,对于LLM赋能信息检索领域的理论模式创新与实践应用延展有着重要意义。[研究设计/方法]研究选取信息检索领域的多个前沿学科会议,通过主题以及知识关联演化的双重视角分析,深入探究LLM等前沿技术如何推动信息检索领域的演化发展、知识重构以及创新应用,进而揭示在LLM影响下信息检索领域的未来发展方向。[结论/发现]受LLM驱动,信息检索领域的研究主题和知识结构正经历演变。研究范式层面注重人机协同新理念、技术伦理的重视、用户体验增强带来的范式融合。研究技术层面注重LLM的高效检索模型架构与工作流程优化、轻量级语言模型与LLM的协同发展以及LLM的开源及平权发展。然而,LLM赋能信息检索领域仍面临技术评测有效性困难、生成内容的可靠性存疑以及社会应用的复杂性较高等挑战。[创新/价值]将细粒度的知识关联网络引入演化分析框架,创新技术赋能领域研究的多维分析视角。同时从数据层面厘清和揭示信息检索领域的演化规律,明确领域未来发展。 展开更多
关键词 语言模型 信息检索 主题演化 检索增强生成
在线阅读 下载PDF
基于自然语言处理和互信息的电力物联网技术协同创新研究 被引量:9
16
作者 王其清 李存斌 高昇宇 《华北电力大学学报(自然科学版)》 CAS 北大核心 2021年第3期72-80,共9页
电力物联网建设尚处于起步阶段,为寻找关键技术突破点和创新路径提出基于自然语言处理和互信息的电力物联网技术协同创新研究方法。从电力系统和物联网两个方面将电力物联网划分为8个技术子领域,包括电力“源-网-荷-储”以及物联网感知... 电力物联网建设尚处于起步阶段,为寻找关键技术突破点和创新路径提出基于自然语言处理和互信息的电力物联网技术协同创新研究方法。从电力系统和物联网两个方面将电力物联网划分为8个技术子领域,包括电力“源-网-荷-储”以及物联网感知层、网络层、计算层、应用层,并收集与子领域相关的Web of Science文献数据。基于自然语言处理技术提取文献中关键技术术语,构建术语-领域共现矩阵。在此基础上,采用互信息理论研究电力物联网技术子领域间协同关系。所提方法解析出了突现型、渐缓型、波动型和增长型四类电力物联网创新技术,研究发现电力源-储端、源-应用层互动强度最高,攻关新能源发电、储能以及物联网关键技术,创新领域交叉新兴技术应用是电力物联网建设的重点,研究结论为电力物联网技术创新发展提供了借鉴。 展开更多
关键词 电力物联网 协同创新 自然语言处理 信息 文本挖掘
在线阅读 下载PDF
自然语言处理视角下分散化政策情报信息量化研究——以1986-2018年旅游交通政策演进为例 被引量:8
17
作者 魏宇 邢剑华 《情报杂志》 CSSCI 北大核心 2020年第8期16-23,121,共9页
[目的/意义]情报信息的分散化分布规律是情报活动的基石,一些交叉性、前沿性政策类情报文本,呈现明显分散化特征,探寻此类情报信息量化研究方法,具有重要学术意义和现实紧迫性。[方法/过程]该文利用自然语言处理方法(Natural Language P... [目的/意义]情报信息的分散化分布规律是情报活动的基石,一些交叉性、前沿性政策类情报文本,呈现明显分散化特征,探寻此类情报信息量化研究方法,具有重要学术意义和现实紧迫性。[方法/过程]该文利用自然语言处理方法(Natural Language Processing,NLP),对旅游交通政策这一交叉领域的分散化政策演进进行量化分析。[结果/结论]研究验证了该方法对分散化政策类情报信息分析的适用性。结果表明:基于规则的命名实体识别对政策总量与结构的分析显示,发文总量逐年上升,不同时期政策结构有所差异。基于规则和统计模型的命名实体识别对政策制定主体的分析显示,政策颁发机构数量呈起伏上升趋势,多部门参与局面渐显。基于词性和句法分析的政策内容演进显示:“事故”始终是政策内容的语义核心词;语义聚焦主题词演进兼具继承性和发展性。 展开更多
关键词 自然语言处理 情报信息 量化研究 分散化政策 旅游交通
在线阅读 下载PDF
基于对齐查询的跨语言信息检索方法
18
作者 李俊文 宋雨秋 +3 位作者 张维彦 阮彤 刘井平 朱焱 《计算机科学》 北大核心 2025年第8期259-267,共9页
跨语言信息检索是自然语言处理中一项重要的信息获取任务。最近,基于大语言模型的检索方法在这一任务中获得了广泛关注并取得了显著的进展。然而,现有基于提示大语言模型的无监督检索方法在效果和效率上仍有不足。对此,提出了一种全新... 跨语言信息检索是自然语言处理中一项重要的信息获取任务。最近,基于大语言模型的检索方法在这一任务中获得了广泛关注并取得了显著的进展。然而,现有基于提示大语言模型的无监督检索方法在效果和效率上仍有不足。对此,提出了一种全新的基于对齐查询的跨语言信息检索方法。具体而言,采用“预训练-微调”范式,基于预训练多语言模型提出了一种自适应的自指导编码器,通过同一语言内的检索学习指导跨语言检索学习。该方法引入与文档语种相同的语义对齐的查询,并设计了一种自适应的自指导机制,利用不同语种视角下的单语言检索结果的概率分布来指导跨语言检索。在22对语言组合上进行了广泛的实验来评估所提模型的有效性和效率,结果表明,所提方法的MRR指标达到了当前最先进水平。具体而言,其在高资源语种组合上相较于次优基线的平均MRR提高了15.45%,在低资源语种组合上相较于次优基线提高了18.9%。此外,相比基于大语言模型的方法,该方法在训练时间和推理时间上均更短,并且显著提升了收敛性能。相关代码已公开1)。 展开更多
关键词 语言信息检索 对齐查询 自指导 自适应层级系数
在线阅读 下载PDF
基于查询感知和信息压缩的检索增强语言模型
19
作者 何欣洋 何智毅 +1 位作者 任思远 彭程 《计算机应用》 北大核心 2025年第S1期24-29,共6页
检索增强生成(RAG)已经成为了解决大语言模型(LLM)存在幻觉、无法获取最新知识等问题的主要方法。然而,目前的RAG方法普遍将检索到的所有文档一起输入到LLM中,没有对不相关的文档进行识别,并且没有考虑单个文档中的噪声对LLM性能的影响... 检索增强生成(RAG)已经成为了解决大语言模型(LLM)存在幻觉、无法获取最新知识等问题的主要方法。然而,目前的RAG方法普遍将检索到的所有文档一起输入到LLM中,没有对不相关的文档进行识别,并且没有考虑单个文档中的噪声对LLM性能的影响,而这些不相关的文档和文档中的噪声会误导LLM生成错误的答案,降低模型性能,并增加LLM的推理时间。针对上述问题,提出一种基于查询感知和信息压缩的检索增强语言模型。首先,在检索过程完成后,通过信息压缩模块利用关键句抽取模块来选择单个文档中的关键句;其次,通过重排器模块选择文档集中最相关的文档,从而达到去除文档中的噪声和过滤不相关文档的目的;最后,提出基于查询感知的上下文学习(ICL)模块,通过在训练集中检索与输入最相似的示例对并把它们插入到LLM的上下文中,利用LLM的ICL能力来提高模型性能。实验结果显示,相比最好的基线模型REAR(RElevance-Aware Retrieval-augmented framework),所提模型在NQ(Natural Questions)、SQuAD(Stanford Question Answering Dataset)和TQA(TriviaQA)数据集的F1值上分别获得了0.70、0.96、1.23个百分点的提升,在NQ和SQuAD数据集的EM(Exact Match)值上分别获得了1.13和0.82个百分点的提升,证明了所提模型在开放域问答(ODQA)任务上的有效性。此外,由于所提出的模型无需额外训练,降低了对计算资源的需求,并且该模型可以应用到任意LLM中,体现了所提模型广泛的适用性。 展开更多
关键词 检索增强生成 语言模型 上下文学习 信息压缩 开放域问答
在线阅读 下载PDF
自然语言处理技术在药物专利检索中的应用研究
20
作者 程晓静 程文堂 王艳 《情报学报》 CSSCI 北大核心 2005年第1期42-46,共5页
本文研究了自然语言处理技术在药物专利检索中的应用,开发出一套翻译软件,能够将药物专利中对族性变量的文本描述半自动化地转化为符合规则的GSCCT格式,为准确、高效地建立药物专利检索数据库打下了基础.
关键词 自然语言处理 翻译软件 检索 数据库 变量 规则 描述 技术 准确 文本
在线阅读 下载PDF
上一页 1 2 226 下一页 到第
使用帮助 返回顶部