期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
融合大语言模型和数据增强的文本情感分类模型研究
1
作者 杨巍 肖强 《情报杂志》 北大核心 2025年第8期172-179,197,共9页
[研究目的]探索应用大语言模型(LLMs)的内容理解能力和生成能力,提升现有情感分类模型的准确性。[研究方法]提出了融合LLMs内容理解能力和生成能力的文本情感分类模型LLMGen4Sent,以深入挖掘文本所蕴含的情感内涵,并通过增强数据和对比... [研究目的]探索应用大语言模型(LLMs)的内容理解能力和生成能力,提升现有情感分类模型的准确性。[研究方法]提出了融合LLMs内容理解能力和生成能力的文本情感分类模型LLMGen4Sent,以深入挖掘文本所蕴含的情感内涵,并通过增强数据和对比学习技术,提升样本的多样性和情感语义表征准确性。[研究结果/结论]实验结果表明,LLMGen4Sent在ChnSentiCorp和IMDB数据集上均取得了优异的性能;相对TextCNN模型,ACC准确率提升了12.22%、12.99%;相对Bert模型,ACC准确率提升了5.72%、5.88%;同时,通过消融实验也论证了LLMGen4Sent模型中各个模块的有效性。LLMGen4Sent模型能够有效捕捉文本的深层情感特征,并通过生成式数据增强技术和对比学习技术显著提高现有文本情感分类模型的准确性。 展开更多
关键词 情感分类模型 大语言模型 内容理解 数据增强 LLMGen4Sent
在线阅读 下载PDF
基于特征优选的GA-BiLSTM烧结矿中FeO含量预测模型
2
作者 李中正 吴朝霞 +1 位作者 王金杨 康增鑫 《东北大学学报(自然科学版)》 北大核心 2025年第6期56-65,共10页
针对传统烧结矿质量预测模型特征选择方法单一、脱离工艺机理等问题,导致模型预测精度不高且缺乏解释性,提出了一种基于特征优选的遗传算法优化双向长短期记忆网络(GA-BiLSTM)预测模型.首先通过多种特征选择方法并且结合烧结工艺机理筛... 针对传统烧结矿质量预测模型特征选择方法单一、脱离工艺机理等问题,导致模型预测精度不高且缺乏解释性,提出了一种基于特征优选的遗传算法优化双向长短期记忆网络(GA-BiLSTM)预测模型.首先通过多种特征选择方法并且结合烧结工艺机理筛选出最佳特征集,然后利用GA优化BiLSTM,最后将最佳特征集作为GA-BiLSTM模型的输入来预测烧结矿中FeO含量.将特征优选的GA-BiLSTM模型与其他模型进行对比分析.结果表明,所建立的模型预测误差较低,并且烧结矿中FeO质量分数在允许误差±0.5%的范围内准确度为94%,表现了较高的预测精度,为提高烧结矿质量提供了新的指导方向. 展开更多
关键词 烧结矿 特征优选 FEO含量 预测模型 大数据
在线阅读 下载PDF
Geological Model of Pre-Jurassic Heterogeneous Basement and Hydrocarbon Productivity Prediction of “Oil-and-Gas Bearing Contact Zone Horizon” Between Paleozoic and Mesozoic Deposits of Ostaninskoye and Severoostaninskoye Oil-and-Gas Fields(Western Siberi
3
作者 Kseniya I.Kanakova 《地学前缘》 EI CAS CSCD 北大核心 2009年第S1期157-158,共2页
This work is devoted to the analysis of the formation conditions and geologic model of Paleozoic basement rocks of a number of oil-and-gas fields, located in Tomsk region(South of West-Siberian Oil-and-Gas Province,Ru... This work is devoted to the analysis of the formation conditions and geologic model of Paleozoic basement rocks of a number of oil-and-gas fields, located in Tomsk region(South of West-Siberian Oil-and-Gas Province,Russia).The research is based on integrated data interpretation of seismic exploration, well logging and deep drilling.The study is at the interfaces between exploration geophysics 展开更多
关键词 seismic interpretation OIL content prediction well-logging data reservoir modeling
在线阅读 下载PDF
基于可见/近红外光谱和函数型线性回归模型的成熟期苹果可溶性固形物含量预测
4
作者 黄华 刘亚 +4 位作者 马毅航 向思函 何佳宁 王诗婷 郭俊先 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2024年第7期1905-1912,共8页
可溶性固形物含量(SSC)是反映苹果品质和成熟度的重要指标,能够用于苹果品质分析和成熟度预测。以新疆阿克苏冰糖心红富士苹果为研究对象,从果实膨大定形期至完熟期,以3d等间隔周期采摘样本,采集其380~1110nm的可见/近红外光谱,测定其S... 可溶性固形物含量(SSC)是反映苹果品质和成熟度的重要指标,能够用于苹果品质分析和成熟度预测。以新疆阿克苏冰糖心红富士苹果为研究对象,从果实膨大定形期至完熟期,以3d等间隔周期采摘样本,采集其380~1110nm的可见/近红外光谱,测定其SSC,共552个样品。然后,利用基函数平滑方法将采集的可见/近红外光谱离散数据转化为光谱曲线,即函数型数据,并以可见/近红外光谱曲线、一阶导曲线、二阶导曲线为函数型解释变量,SSC为标量响应变量,分别建立函数型线性回归模型。为了验证和分析模型的性能,根据原始光谱离散数据,经过移动平滑、一阶导和二阶导预处理后,分别建立偏最小二乘回归(PLSR)、核支持向量机(KSVM)、随机森林(RF)、梯度提升树(GBM)和深度神经网络(DeepNN)。结果表明,在建立的18个模型中,针对训练集,PLSR-dNIR模型、KSVM-dNIR模型、RF-dNIR模型、GBM-dNIR模型和Deep NN-d2NIR模型都优于FunLR-NIR模型、FunLR-dNIR模型、FunLR-d2NIR模型,且Deep NN-dNIR模型最优(r_(c)=0.9996,R_(c)^(2)=0.9986,RMSEC=0.0740,RPDC=27.4366);针对测试集,FunLR-NIR模型、FunLR-dNIR模型、FunLR-d2NIR模型均优于其他所有模型,且FunLR-NIR模型最优(r_(v)=0.9534,R_(v)^(2)=0.9077,RMSEV=0.5856,RPDV=3.3017)。综合训练集和测试集的结果来看,核支持向量机模型、随机森林模型、梯度提升树模型和深度神经网络模型容易过拟合,而函数型线性回归模型具有更好的普适性。此外,从三个函数型线性回归模型(FunLR-NIR模型、FunLR-dNIR模型、FunLR-d2NIR模型)的预测效果看,模型均具有良好的鲁棒性和较高的预测精度。试验结果表明,结合可见/近红外光谱技术与函数型数据分析构建的函数型线性回归模型,可成功、有效地实现成熟期苹果的可溶性固形物含量预测。 展开更多
关键词 苹果 可溶性固形物含量 可见/近红外光谱 函数型数据分析 函数型线性回归模型
在线阅读 下载PDF
基于“结构-功能”视角的中国居家养老服务政策文本评估 被引量:3
5
作者 孙少芹 任家庆 《智库理论与实践》 CSSCI 北大核心 2024年第2期29-40,共12页
[目的/意义]中国老龄化问题迫在眉睫,居家养老服务是政府积极推行的养老服务模式,评估居家养老服务政策文本有助于居家养老服务模式的推广。[方法/过程]本研究从“结构—功能”视角,统合定量和定性方法的优势,使用PMC指数模型,对中国居... [目的/意义]中国老龄化问题迫在眉睫,居家养老服务是政府积极推行的养老服务模式,评估居家养老服务政策文本有助于居家养老服务模式的推广。[方法/过程]本研究从“结构—功能”视角,统合定量和定性方法的优势,使用PMC指数模型,对中国居家养老政策文本进行量化分析和评估,量化分析供给主体与使用政策工具的匹配关系,及其对政策文本效果的影响。[结果/结论]研究发现:(1)现有政策在内容、项目和措施方面覆盖得较为全面,主要依靠政府力量推动社会服务供给,但政策法律位阶总体不高,服务对象、供给主体和资金来源参差不齐,缺少对市场主体的激励和规范;(2)政策工具的使用和供给主体的参与对政策评估得分影响大,增加政策工具或增加企业这一供给主体,会对政策效果有较大影响。根据以上结果,本研究得出以下启示:政策制定既要关注政策体系内容完整性,又要重视政策工具的中介意义和市场主体的治理参与,这需要政府使用好环境型和需求型工具,激发系统活力,夯实韧性环境。 展开更多
关键词 居家养老服务政策 文本评估 政策工具 数据驱动 PMC 模型
在线阅读 下载PDF
内蒙古大兴安岭森林火险等级预报模型研究
6
作者 杨淑香 吴宏伟 +2 位作者 董越 李洪峰 包兴华 《林业调查规划》 2024年第2期19-24,共6页
为提高森林火险等级预报的准确率和及时率,减少森林资源损失。以内蒙古大兴安岭地区为研究区域,利用遥感MODIS-NDVI数据反演可燃物的湿度指数,以气象指数、植被指数、闪电指数、湿度指数共同计算得出森林火险指数,以火险指数作为内蒙古... 为提高森林火险等级预报的准确率和及时率,减少森林资源损失。以内蒙古大兴安岭地区为研究区域,利用遥感MODIS-NDVI数据反演可燃物的湿度指数,以气象指数、植被指数、闪电指数、湿度指数共同计算得出森林火险指数,以火险指数作为内蒙古大兴安岭地区森林火险等级预报模型的量化指标,并对火险等级进行分级,获得内蒙古大兴安岭森林火险等级预报方法。该方法结合当地的实际情况,将闪电指数引入到预报模型中,并实现了定量化估测。同时,以近几年发生在该地区重特大森林火灾为例,对该预报模型进行了验证。该方法可较好地对内蒙古大兴安岭地区森林火险等级进行定量化预报。 展开更多
关键词 森林可燃物 MODIS-NDVI数据 含水率 火险等级 预报模型 大兴安岭
在线阅读 下载PDF
一种基于虚拟维修仿真的交互式电子技术手册生成方法 被引量:6
7
作者 梁伟杰 常雷 +1 位作者 李星新 杜晓明 《系统仿真学报》 EI CAS CSCD 北大核心 2008年第24期6854-6857,共4页
基于并行工程思想,提出了一种基于虚拟维修仿真分析过程的结果数据制作装备交互式电子技术手册(IETM)的方法。主要研究工作为:构建了一种基于主题的IETM内容数据模型(CDM),给出了典型装备IETM的组成结构;分析了典型虚拟维修仿真分析过... 基于并行工程思想,提出了一种基于虚拟维修仿真分析过程的结果数据制作装备交互式电子技术手册(IETM)的方法。主要研究工作为:构建了一种基于主题的IETM内容数据模型(CDM),给出了典型装备IETM的组成结构;分析了典型虚拟维修仿真分析过程中的结果数据;提出了虚拟维修仿真系统和IETM创作系统的并行集成框架,设计了集成接口和相关模型,在产品生命管理平台下实现了二者的集成;在基于Jack软件环境的虚拟维修仿真系统中,以某型榴弹炮为例,进行虚拟维修样机建模、维修任务生成、虚拟维修仿真,最后通过以上结果数据生成了该榴弹炮的4级IETM系统。 展开更多
关键词 虚拟维修仿真 交互式电子技术手册 内容数据模型 产品生命周期管理 系统集成
在线阅读 下载PDF
烤烟叶片色素含量的高光谱预测模型研究 被引量:13
8
作者 邢雪霞 刘国顺 +2 位作者 贾方方 孙榅淑 贾春雷 《中国烟草学报》 EI CAS CSCD 北大核心 2014年第1期54-60,共7页
研究烤烟叶片的高光谱曲线特征,探索建立烤烟色素含量的高光谱预测模型,以促进高光谱技术在现代烟草农业中的发展。采用大田试验,分析了不同光质条件下,烤烟叶片光谱的特征。利用相关分析方法,确定了21个光谱参数与色素含量的相关性,并... 研究烤烟叶片的高光谱曲线特征,探索建立烤烟色素含量的高光谱预测模型,以促进高光谱技术在现代烟草农业中的发展。采用大田试验,分析了不同光质条件下,烤烟叶片光谱的特征。利用相关分析方法,确定了21个光谱参数与色素含量的相关性,并建立了叶片色素含量的高光谱线性与非线性模拟方程。不同光质处理下,烟叶叶片光谱曲线相似,在可见光与近红外短波区域差异比较明显,而在近红外长波区域基本没有差异。光谱参数G_NDVI和TCARI分别与叶绿素、类胡萝卜素含量之间有较好的相关性,并建立了预测模型。经精度检验结果显示,模型能较好的预测烤烟色素含量。光谱参数G_NDVI和TCARI能有效检测烤烟色素含量,为高光谱技术在不同生态区域的应用提供理论依据。 展开更多
关键词 烤烟 高光谱 色素含量 模型
在线阅读 下载PDF
按内容检索的图象数据库系统数据模型 被引量:9
9
作者 周学海 李光亚 赵振西 《软件学报》 EI CSCD 北大核心 1998年第3期186-189,共4页
数据模型的研究是设计按内容检索的图象数据库系统的基础.本文在超语义数据模型的基础上,提出了一种新的图象数据库系统模型.该模型融合了面向对象的数据模型、语义数据模型和知识模型的特点,并根据图象信息的特点,增加了若干对象... 数据模型的研究是设计按内容检索的图象数据库系统的基础.本文在超语义数据模型的基础上,提出了一种新的图象数据库系统模型.该模型融合了面向对象的数据模型、语义数据模型和知识模型的特点,并根据图象信息的特点,增加了若干对象类型构造子,使得该模型能较好地支持按内容检索的图象数据库系统建模. 展开更多
关键词 数据模型 图象数据系统 图象处理
在线阅读 下载PDF
基于内容挖掘的国际大数据研究主题分析 被引量:5
10
作者 董克 陶艳 《图书情报知识》 CSSCI 北大核心 2016年第1期65-73,共9页
大数据是当前高速发展的新领域,也是广受关注的研究热点之一。本文以WOS数据库中大数据研究论文为分析对象,利用斯坦福主题模型工具包对大数据研究的内容进行了挖掘。分析结果表明,当前国际大数据研究集中在大数据环境下的风险控制、大... 大数据是当前高速发展的新领域,也是广受关注的研究热点之一。本文以WOS数据库中大数据研究论文为分析对象,利用斯坦福主题模型工具包对大数据研究的内容进行了挖掘。分析结果表明,当前国际大数据研究集中在大数据环境下的风险控制、大数据的核心技术、特定领域中的大数据及其应用研究等三大类十五个主题;大数据核心技术和特定领域中的大数据及其应用是当前大数据研究的主要内容;目前大数据研究的主题均处于高速发展阶段;特定领域的大数据及其应用研究增速最快,将成为未来最受关注的研究方向。 展开更多
关键词 大数据 内容挖掘 主题模型 研究趋势
在线阅读 下载PDF
基于内容相关的条件函数依赖的一致性清洗方法 被引量:1
11
作者 杜岳峰 申德荣 +1 位作者 张亮 于戈 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第12期1683-1687,共5页
基于条件函数依赖提出了一种内容相关的条件函数依赖,并给出基于内容相关的条件函数依赖的一致性清洗方法.通过分析条件函数依赖之间的关系,将相关联的条件函数依赖合并组成内容相关的条件函数依赖.内容相关的条件函数依赖可以检测多条... 基于条件函数依赖提出了一种内容相关的条件函数依赖,并给出基于内容相关的条件函数依赖的一致性清洗方法.通过分析条件函数依赖之间的关系,将相关联的条件函数依赖合并组成内容相关的条件函数依赖.内容相关的条件函数依赖可以检测多条件值下的数据一致性问题并提供可用于一致性修复的参考值.同时,提出了一种一致性修复的代价模型.模型参考内容相关的条件函数依赖对应元组的实际情况进行修复,实现代价最优,同时保证数据一致性.通过在两组真实数据集上进行试验测试,证明提出的基于内容相关的条件函数依赖的一致性清洗方法能够准确地检测数据的一致性问题并加以修复. 展开更多
关键词 数据清洗 条件函数依赖 内容相关 数据一致性 修复代价模型
在线阅读 下载PDF
基于内容检索的图像系统的关键技术及其实现 被引量:11
12
作者 陈跃峰 肖自美 杨灿 《计算机工程与应用》 CSCD 北大核心 2000年第10期17-21,共5页
大量多媒体化信息的产生使得基于内容的检索技术成为研究的热点.该文先给出了基于内容的图像检索系统的系统结构.然后归纳并详细阐述了该系统所包含的5种主要关键技术,提出要实现趋向语义的图像查询系统应建立在相关性反馈、多种特征组... 大量多媒体化信息的产生使得基于内容的检索技术成为研究的热点.该文先给出了基于内容的图像检索系统的系统结构.然后归纳并详细阐述了该系统所包含的5种主要关键技术,提出要实现趋向语义的图像查询系统应建立在相关性反馈、多种特征组合查询和对图像内容加注的文字进行全文本查询相结合的基础上,并且在原型系统上给出了实验结果. 展开更多
关键词 图像检索 图像数据模型 关系数据库 内容检索
在线阅读 下载PDF
教育大数据视角下的内容语义分析模型及应用研究 被引量:18
13
作者 刘清堂 张思 +2 位作者 范桂林 王洋 吴林静 《电化教育研究》 CSSCI 北大核心 2017年第1期54-61,93,共9页
教育大数据为分析学习行为与过程、提升学习绩效、科学规划与决策提供了巨大可能。当面临社会化学习中大容量、增殖速度快、具有一定情境特征的海量教育数据时,传统的分析方法遇到了瓶颈。如何建立可靠的学习分析模型,对教育数据进行科... 教育大数据为分析学习行为与过程、提升学习绩效、科学规划与决策提供了巨大可能。当面临社会化学习中大容量、增殖速度快、具有一定情境特征的海量教育数据时,传统的分析方法遇到了瓶颈。如何建立可靠的学习分析模型,对教育数据进行科学合理的分析和解释,成为当下研究的热点和难点。本文首先介绍了内容语义分析的概念、一般过程和分析方法,在此基础上提出了数字化课堂内容语义分析方法,以及社会化学习中的内容语义分析模型和应用框架,探讨了内容语义分析模型在数字化课堂教学、教育技术学领域本体库构建、网络研修社区教师反思水平分析中的应用,以期为探索教育大数据环境下的教育研究途径和方法提供借鉴。 展开更多
关键词 教育大数据 内容语义分析 分析模型 应用研究
在线阅读 下载PDF
模糊图像检索技术及应用研究 被引量:1
14
作者 张明 张正兰 《计算机应用》 CSCD 北大核心 2005年第6期1296-1298,共3页
提出了一种基于模糊空间的图像数据模型,给出了模糊相似性度量方法,结合水利工程图像查询的具体应用讨论了在模糊空间中图像的检索过程。
关键词 基于内容 模糊检索 模糊数据模型
在线阅读 下载PDF
复杂高炉炼铁过程的数据驱动建模及预测算法 被引量:62
15
作者 郜传厚 渐令 +1 位作者 陈积明 孙优贤 《自动化学报》 EI CSCD 北大核心 2009年第6期725-730,共6页
高炉炼铁过程的控制意味着控制高炉铁水温度及成份在指定的范围.本文以高炉炉内热状态的重要指示剂—高炉铁水硅含量为研究对象,针对机理建模难以准确预测、控制高炉铁水硅含量的发展变化,利用数据驱动建模的思想,建立了基于多元时间序... 高炉炼铁过程的控制意味着控制高炉铁水温度及成份在指定的范围.本文以高炉炉内热状态的重要指示剂—高炉铁水硅含量为研究对象,针对机理建模难以准确预测、控制高炉铁水硅含量的发展变化,利用数据驱动建模的思想,建立了基于多元时间序列的高炉铁水硅含量数据驱动预测模型.实例分析表明,建立的数据驱动预测模型能够很好地预测高炉铁水硅含量,连续预测167炉高炉铁水硅含量,命中率高达83.23%,预测均方根误差为0.07260.这些指标均优于基于单一硅时间序列所建立的数据驱动模型,对实际生产具有很好的指导作用. 展开更多
关键词 高炉炼铁过程 数据驱动 预测模型 铁水硅含量 时间序列
在线阅读 下载PDF
图象数据模型研究 被引量:1
16
作者 周学海 李光亚 赵振西 《中国科学技术大学学报》 CAS CSCD 北大核心 1997年第3期298-303,共6页
数据模型研究是设计按内容检索的图象数据库系统的基础.本文根据图象信息系统的特点,将面向对象模型与超语义模型有机结合,提出了一种新的图象数据模型及相应的说明语言.该模型以紧耦合方式融合了语义数据模型和知识模型的特点,并... 数据模型研究是设计按内容检索的图象数据库系统的基础.本文根据图象信息系统的特点,将面向对象模型与超语义模型有机结合,提出了一种新的图象数据模型及相应的说明语言.该模型以紧耦合方式融合了语义数据模型和知识模型的特点,并增加了表示图象对象间空间关系的机制,使得该模型可以更好地描述图象信息系统中的图象数据、领域知识以及空间关系语义. 展开更多
关键词 数据模型 模式说明语言 图象数据库系统
在线阅读 下载PDF
高光谱和NSGA2-ELM算法的粳稻叶片氮素含量反演 被引量:9
17
作者 冯帅 曹英丽 +4 位作者 许童羽 于丰华 陈春玲 赵冬雪 金彦 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2020年第8期2584-2591,共8页
为提供一种高效、快速和无损的粳稻叶片氮素含量反演方法,以粳稻小区试验为基础,利用高光谱技术和室内化学实验,获取粳稻分蘖期、拔节期和抽穗期三个生育期共280组叶片高光谱数据以及相对应的水稻叶片氮素含量数据,分析不同施氮水平的... 为提供一种高效、快速和无损的粳稻叶片氮素含量反演方法,以粳稻小区试验为基础,利用高光谱技术和室内化学实验,获取粳稻分蘖期、拔节期和抽穗期三个生育期共280组叶片高光谱数据以及相对应的水稻叶片氮素含量数据,分析不同施氮水平的粳稻叶片光谱特征,采用随机青蛙算法(random_frog)与迭代和保留信息变量算法(IRIV)相结合的方式筛选特征波段,并将任意两个光谱波段随机组合构建差值植被指数DSI(Ri,Rj)、比值植被指数RSI(Ri,Rj)和归一化植被指数NDSI(Ri,Rj),分别将较优的特征波段组合和植被指数组合作为模型输入,构建BP神经网络、支持向量机(SVR)和非支配的精英策略遗传算法优化极限学习机(NSGA2-ELM)粳稻叶片氮素含量反演模型,并对模型进行验证分析。结果表明:随着施氮水平的增加,粳稻叶片近红外波段范围反射率逐渐升高,在可见光波段范围反射率逐渐降低。采用random_frog与IRIV相结合的方式筛选特征波段共得到8个特征波段,其中可见光波段7个,分别为414.2, 430.9, 439.6, 447.9, 682.7, 685.4和686.3 nm,近红外波段仅有1个为999.1 nm,该方法较好地剔除了干扰信息,大大降低了波段间的共线性。同时从三种植被指数(DSI(Ri,Rj), RSI(Ri,Rj), NDSI(Ri,Rj))与粳稻叶片氮素含量的决定系数等势图中可知, DSI(R648.1,R738.1), RSI(R532.8,R677.3)和NDSI(R654.8,R532.9)与叶片氮素含量相关性最好,R^2分别为0.811 4, 0.829 7和0.816 9。在输入参量不同的建模效果对比分析中,以特征波段组合作为模型输入所构建的模型反演效果略优于植被指数组合,R^2均大于0.7, RMSE均小于0.57。而在反演模型间的对比分析中,提出的NSGA2-ELM反演模型的估测效果要优于BP神经网络模型和SVR模型,训练集决定系数R^2为0.817 2,均方根误差RMSE为0.355 5,验证集R^2为0.849 7, RMSE为0.301 1。鉴于此, random_frog-IRIV筛选特征波段方法结合NSGA2-ELM建模方法在快速检测粳稻叶片氮素含量中具有显著优势,可为粳稻田间精准施肥提供了参考。 展开更多
关键词 高光谱数据 叶片氮素含量 特征波段 植被指数 反演模型
在线阅读 下载PDF
数据稀缺性与大模型数据价值的非对称性 被引量:4
18
作者 王翔 周辉 +1 位作者 李志鹏 邢云 《信息安全研究》 CSCD 2023年第7期637-642,共6页
随着大模型产业的快速发展,出于市场竞争的需要,模型规模快速膨胀,但同时可用于训练的数据供给相对不足、未来日趋稀缺,特别是高质量数据无法满足大模型计算规模指数级增长需求.在数据制度性约束日趋严密的今天,大模型的运行机理呈现自... 随着大模型产业的快速发展,出于市场竞争的需要,模型规模快速膨胀,但同时可用于训练的数据供给相对不足、未来日趋稀缺,特别是高质量数据无法满足大模型计算规模指数级增长需求.在数据制度性约束日趋严密的今天,大模型的运行机理呈现自然垄断特征,而主要经济体之间数据治理思路的差异、国际段技术条件的差异以及算法歧视等因素都在持续加大供需双方的价值非对称性,影响大模型的数据价值分配,进而强化大模型所有者的数据垄断.我国发展大模型产业尽管面临国际段一系列技术条件限制,但是拥有数据禀赋优势,无论数量还是质量均具有很大潜力.为了更好积累数据价值收益,未来需要在自主平台、评估指标、国际规则等方面加强建设,并注重对大模型产业的政策引导. 展开更多
关键词 数据稀缺性 数据价值非对称性 数据垄断 智能生成(AIGC) 大模型(LLM) 跨境数据链
在线阅读 下载PDF
基于内容查询的图像数据库数据模型 被引量:2
19
作者 孟倩 《计算机应用与软件》 CSCD 北大核心 2007年第1期65-67,共3页
数据模型是实现基于内容查询的图像数据库的基础。构造了一个按内容检索的面向对象图像数据模型OO IDM(Ob ject-oriented im age data model),该模型能够很好地描述图像数据库系统中的图像数据、语义特征、图像特征以及支持空间推理。
关键词 基于内容 图像数据库 面向对象 数据模型
在线阅读 下载PDF
集合卡尔曼滤波数据同化方法改进土壤水分模拟效果 被引量:13
20
作者 陈鹤 杨大文 +1 位作者 刘钰 张宝忠 《农业工程学报》 EI CAS CSCD 北大核心 2016年第2期99-104,共6页
陆面过程模型是连续模拟土壤水分的有效工具,然而输入数据及模型结构本身的不确定性会导致模拟误差在模型运行过程中不断积累。数据同化技术可以考虑模型不确定性,实时修正模型状态变量,进而提高土壤水分的模拟精度。本研究构建集合卡... 陆面过程模型是连续模拟土壤水分的有效工具,然而输入数据及模型结构本身的不确定性会导致模拟误差在模型运行过程中不断积累。数据同化技术可以考虑模型不确定性,实时修正模型状态变量,进而提高土壤水分的模拟精度。本研究构建集合卡尔曼滤波(En KF,ensemble Kalman filter)数据同化方法,将其集成到水文强化陆面过程模型HELP(hydrologically-enhanced land process)中,对模型中土壤水分及表面温度等状态变量进行优化。模型选取山东位山生态水文观测站2006年的数据进行验证,采用未经同化的模型率定结果作为基准值。结果表明,数据同化后表层、根层、深层土壤水分模拟结果相比基准值均有提高,土壤含水量均方根误差减小30%-50%,证明采用数据同化方法能够有效提高土壤水分的模拟结果。 展开更多
关键词 土壤 遥感 温度 数据同化 陆面过程模型 土壤含水量
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部