期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
融合在线检索和量化低秩适配器微调范式的新闻文稿生成 被引量:1
1
作者 励琦 刘志强 +3 位作者 李岚 向宗元 毛瑞琛 陈群 《计算机应用》 CSCD 北大核心 2024年第S01期34-38,共5页
现有大语言模型(LLM)由于存在信息滞后性,在特定风格新闻稿件生成任务上存在生成内容捏造、行文不流畅连贯等问题。为了缓解这些问题,提出一套基于实时在线的web_search技术和量化低秩适配器(QLoRA)微调技术的新闻文稿生成系统的解决方... 现有大语言模型(LLM)由于存在信息滞后性,在特定风格新闻稿件生成任务上存在生成内容捏造、行文不流畅连贯等问题。为了缓解这些问题,提出一套基于实时在线的web_search技术和量化低秩适配器(QLoRA)微调技术的新闻文稿生成系统的解决方案。首先,利用Bing和Google提供的API根据给定的新闻标题,获取最新的新闻素材集合;其次,利用语义相关性模型和摘要模型对初始素材集合进行筛选和文本处理,选取准确的新闻内容;再次,设计动态的prompt模板综合处理检索到的新闻素材,并在prompt中加入新闻风格约束提示词;最后,将完整的prompt提示词指令输入经过QLoRA微调的LLM中,生成新闻文稿。实验结果显示,在人工整理的热点新闻标题数据集上,所提方案生成的新闻在内容正确性、逻辑连贯性等多维人工评估标准上的平均准确率达到90%,满足实际生产应用的需求,有效提高了新闻生产的效率和质量。目前,该系统已在杭州文广集团内部成功部署应用。 展开更多
关键词 在线检索 量化低秩适配器 微调范式 大语言模型 文稿生成 提示词
在线阅读 下载PDF
美国档案在线检索平台建设的启示——以美国国家档案文件署为例 被引量:1
2
作者 王成琴 《中国档案》 北大核心 2012年第8期42-44,共3页
美国国家档案文件署从20世纪90年代开始建设档案在线信息导航系统,将国内数字化的档案信息资源纳入统一的检索平台,实现档案信息一站式检索。考察美国的档案在线检索平台建设情况,对我国档案在线检索平台建设有很好的启示作用。
关键词 档案文件 在线检索 平台建设 美国 国家 20世纪90年代 档案信息资源 信息导航系统
在线阅读 下载PDF
面向语义增强的在线哈希方法
3
作者 赵志杰 康潇 +3 位作者 张雪凝 王少华 刘兴波 聂秀山 《数据采集与处理》 北大核心 2025年第4期1096-1106,共11页
传统的基于批处理的哈希学习方法通常无法满足大规模流数据实时在线检索的需求。在线哈希学习其核心在于无需重复访问原始累积数据,只为新增数据学习哈希码,并实时更新哈希函数以适应新旧数据的变化。现有在线哈希方法仍面临诸多挑战,... 传统的基于批处理的哈希学习方法通常无法满足大规模流数据实时在线检索的需求。在线哈希学习其核心在于无需重复访问原始累积数据,只为新增数据学习哈希码,并实时更新哈希函数以适应新旧数据的变化。现有在线哈希方法仍面临诸多挑战,如类间关系挖掘不足导致的语义偏移和新旧数据关联不足导致的遗忘问题。针对这些问题,本文提出了一种新的在线哈希学习方法——面向语义增强的在线哈希(Online semantic enhancement hashing,OSEH)。该方法通过设计三重矩阵分解框架,深入挖掘特征和标签间的交互关系,以生成反映类间关系的细粒度标签矩阵。同时,结合标签嵌入和成对相似性保持技术,将增强的语义信息有效融入哈希学习过程,优化哈希码的生成和哈希函数的实时更新。在大规模检索数据集上的实验结果表明,本文所提方法显著提升了在线哈希学习的性能。 展开更多
关键词 在线检索 监督在线哈希 三重矩阵分解 细粒度标签
在线阅读 下载PDF
国外期刊综合检索平台——cnpLINKer在线数据库检索系统
4
作者 王晓娜 胡晋军 《现代情报》 2003年第11期85-86,共2页
cnpLINKer在线数据库检索系统为信息用户提供了一个方便快捷的查阅国外各类期刊文献的综合网络平台 ,该系统目前主要提供约 30 0 0种外文期刊的目次和文摘的查询检索。
关键词 外国期刊 综合检索系统 cnpLINKer 数据库检索系统 在线检索
在线阅读 下载PDF
基于事件图的在线事件检索
5
作者 杨文静 邱泳钦 +2 位作者 李思旭 李锐 王斌 《中文信息学报》 CSCD 北大核心 2017年第4期154-164,共11页
在线事件检索是针对事件查询,按时间序迭代返回小批量数据集中事件相关文档的检索任务。其目标是在时间轴上不断收集新鲜的事件文档,是进行一系列事件相关工作的重要基础。面对此任务,传统方法采用先进的检索模型来提升检索精度,然而却... 在线事件检索是针对事件查询,按时间序迭代返回小批量数据集中事件相关文档的检索任务。其目标是在时间轴上不断收集新鲜的事件文档,是进行一系列事件相关工作的重要基础。面对此任务,传统方法采用先进的检索模型来提升检索精度,然而却没有考虑事件本身的特性。针对这一问题,该文尝试使用两类图(事件关键词共现图、融合事件类型的二部图)对事件建模,提出了一种基于事件图的在线检索框架。案例分析与在两个公开的TREC数据集上的实验结果表明,该文方法显著提升了事件检索精度(P@10最高增幅达30%,平均增幅5.85%),且能自适应在线检索环境,支持事件的演变分析。 展开更多
关键词 事件图 在线事件检索 事件查询模型 事件演变
在线阅读 下载PDF
域内海量数据中热点话题及其特征词抽取方法 被引量:3
6
作者 袁华 徐华林 +1 位作者 钱宇 罗谦 《管理工程学报》 CSSCI CSCD 北大核心 2018年第4期133-140,共8页
在特定信息域内的网络文档中,主题及其特征词的抽取工作是近年人工语言处理研究的重点,其研究结果具有显著的管理决策意义。本研究提出一种新的数据挖掘方法用于从海量UGC中分析出其"热点话题词"和"局部特征词"之... 在特定信息域内的网络文档中,主题及其特征词的抽取工作是近年人工语言处理研究的重点,其研究结果具有显著的管理决策意义。本研究提出一种新的数据挖掘方法用于从海量UGC中分析出其"热点话题词"和"局部特征词"之间的关联关系。首先,利用网页抓取工具从网上获得某个域相关的文档,并对文档内容实施分词操作。然后,基于分词结果,抽取网页文档中存在的域内信息词并组成新的数据集。最后,我们提出一种基于热点话题词和语义分隔符号的数据集切分方法来获得每个热点话题词相关的本地特征词数据集。并且在该数据集上,可以分析出特征词对于热点话题词的依赖关系,从而找到每个话题词最恰当的特征词集合。该方法算法简单,尤为重要的是它能很好屏蔽那些不相关的高频共现词对特征抽取的影响,可广泛应用于文本相关的在线信息检索任务,为管理决策和电子商务活动服务。 展开更多
关键词 在线信息检索 频繁模式挖掘 最大置信度 信息域 特征抽取
在线阅读 下载PDF
国外业界动态
7
《国家图书馆学刊》 2005年第4期88-90,共3页
关键词 PROQUEST 报纸数据库 国外 信息公司 历史内容 芝加哥 研究中心 在线检索 数字化
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部