现有的索引选择方法存在诸多局限性.首先,大多数方法考虑场景较为单一,不能针对特定数据模态选择合适的索引结构,进而无法有效应对海量多模态数据;其次,现有方法未考虑索引选择时索引构建的代价,无法有效应对动态的工作负载.针对上述问...现有的索引选择方法存在诸多局限性.首先,大多数方法考虑场景较为单一,不能针对特定数据模态选择合适的索引结构,进而无法有效应对海量多模态数据;其次,现有方法未考虑索引选择时索引构建的代价,无法有效应对动态的工作负载.针对上述问题,提出一种面向多模态数据的智能高效索引选择模型APE-X DQN(Distributed prioritized experience replay in deep Q-network),称为AP-IS(APE-X DQN for index selection).AP-IS设计了新型索引集编码和SQL语句编码方法,该方法使AP-IS在感知多模态数据的同时兼顾索引结构本身的特性,极大地降低了索引的存储代价.APIS集成新型索引效益评估方法,在优化强化学习奖励机制的同时,监控数据库工作负载的执行状态,保证动态工作负载下AP-IS在时间和空间上的优化效果.在真实多模态数据集上进行大量实验,验证了AP-IS在工作负载的延迟、存储代价和训练效率等方面的性能,结果均明显优于最新索引选择方法.展开更多
土木工程行业在信息化转型中面临着大量的非结构化的文本信息,大语言模型(large language models,LLMs)由于其强大的自然语言处理能力,为行业领域的智能化变革提供了新的机遇。采用系统性文献回顾的方法,在梳理LLMs的技术架构及在垂直...土木工程行业在信息化转型中面临着大量的非结构化的文本信息,大语言模型(large language models,LLMs)由于其强大的自然语言处理能力,为行业领域的智能化变革提供了新的机遇。采用系统性文献回顾的方法,在梳理LLMs的技术架构及在垂直领域研究现状的基础上,提出了LLMs在土木工程领域的四大应用场景及技术路线、面临的挑战及研究趋势。研究发现,LLMs已在土木工程领域有探索性的研究与应用,目前主要集中在内容生成类、智能问答类、文本摘要类及分析推理类四大应用场景,覆盖土木工程项目全生命周期阶段,并具有跨学科、跨模态融合的特性。然而,LLMs的应用仍面临知识专业性低、信息时效性差、数据质量及交互性低等挑战。基于此,提出了一系列未来研究机遇,在模型优化方面,利用参数高效微调技术注入专业知识,增强LLMs在土木工程领域应用的广度和深度;与知识图谱结合,提升LLMs在回答中的精准性、可解释性与时效性;融合多模态的数据类型,扩展LLMs在土木工程领域的应用场景;开发适用的模型评估方法,量化LLMs在土木工程领域应用的价值及性能表现。在应用场景方面,结合LLMs和土木工程领域特点,可以拓展LLMs在文档生成、问答系统、信息抽取、合规性审查等复杂任务中的应用,提高从业者与数据间的交互效率。研究旨在为学术界和企业界进一步将LLMs应用于土木工程领域提供借鉴与参考。展开更多
针对目前胶质瘤影像数据利用率不高、特征提取不全面等问题,提出一种基于深度学习的半监督胶质瘤肿瘤蛋白53(Tumor Protein 53,P53)突变状态预测方法 .首先,使用非均匀粒度多批次(Non-Uniform Granularity Multi-Batch,NUGMB)灰度等级...针对目前胶质瘤影像数据利用率不高、特征提取不全面等问题,提出一种基于深度学习的半监督胶质瘤肿瘤蛋白53(Tumor Protein 53,P53)突变状态预测方法 .首先,使用非均匀粒度多批次(Non-Uniform Granularity Multi-Batch,NUGMB)灰度等级划分算法,优化胶质瘤MR影像的预处理;其次,提出多中心协作(Multi Center Collaboration,MCC)的K均值聚类算法,进行胶质瘤影像数据的伪标签标注;最后,提出一种全新的注意力机制LWAM(Local Longer and Wider Attention Modules),构建基于LWAM的改进MaxViT模型,用于胶质瘤P53突变状态术前无创预测.基于NUGMB,MCC和LWAM算法的NML-MaxViT模型预测胶质瘤P53突变状态的准确率为96.23%,可实现术前无创预测,辅助医生的临床诊疗.展开更多
文摘现有的索引选择方法存在诸多局限性.首先,大多数方法考虑场景较为单一,不能针对特定数据模态选择合适的索引结构,进而无法有效应对海量多模态数据;其次,现有方法未考虑索引选择时索引构建的代价,无法有效应对动态的工作负载.针对上述问题,提出一种面向多模态数据的智能高效索引选择模型APE-X DQN(Distributed prioritized experience replay in deep Q-network),称为AP-IS(APE-X DQN for index selection).AP-IS设计了新型索引集编码和SQL语句编码方法,该方法使AP-IS在感知多模态数据的同时兼顾索引结构本身的特性,极大地降低了索引的存储代价.APIS集成新型索引效益评估方法,在优化强化学习奖励机制的同时,监控数据库工作负载的执行状态,保证动态工作负载下AP-IS在时间和空间上的优化效果.在真实多模态数据集上进行大量实验,验证了AP-IS在工作负载的延迟、存储代价和训练效率等方面的性能,结果均明显优于最新索引选择方法.
文摘土木工程行业在信息化转型中面临着大量的非结构化的文本信息,大语言模型(large language models,LLMs)由于其强大的自然语言处理能力,为行业领域的智能化变革提供了新的机遇。采用系统性文献回顾的方法,在梳理LLMs的技术架构及在垂直领域研究现状的基础上,提出了LLMs在土木工程领域的四大应用场景及技术路线、面临的挑战及研究趋势。研究发现,LLMs已在土木工程领域有探索性的研究与应用,目前主要集中在内容生成类、智能问答类、文本摘要类及分析推理类四大应用场景,覆盖土木工程项目全生命周期阶段,并具有跨学科、跨模态融合的特性。然而,LLMs的应用仍面临知识专业性低、信息时效性差、数据质量及交互性低等挑战。基于此,提出了一系列未来研究机遇,在模型优化方面,利用参数高效微调技术注入专业知识,增强LLMs在土木工程领域应用的广度和深度;与知识图谱结合,提升LLMs在回答中的精准性、可解释性与时效性;融合多模态的数据类型,扩展LLMs在土木工程领域的应用场景;开发适用的模型评估方法,量化LLMs在土木工程领域应用的价值及性能表现。在应用场景方面,结合LLMs和土木工程领域特点,可以拓展LLMs在文档生成、问答系统、信息抽取、合规性审查等复杂任务中的应用,提高从业者与数据间的交互效率。研究旨在为学术界和企业界进一步将LLMs应用于土木工程领域提供借鉴与参考。
文摘P53基因状态是胶质瘤精准诊疗的重要依据.针对目前基于MRI(Magnetic Resonance Imaging)的P53基因状态预测的深度学习模型中存在的异质性特征提取不全面、模型存在固有的多种不确定性等问题,提出脑胶质瘤P53基因状态精准预测模型CVT-RegNet(Improved RegNet Integrating CNN,Vision Transfomer and Truth Discovery).首先,采用RegNet网络作为P53基因突变状态预测模型的基础架构,自适应设计搜索P53基因的异质性特征;其次,在模型中将ViT(Vision Transfomer)模块与卷积神经网络(Convolutional Neural Networks,CNN)模块进行融合以改进RegNet网络,进一步优化模型的特征提取性能与计算效率;最后,融入真值发现算法进行迭代寻优以改善模型输出的不确定性,提高预测结果的准确度.实验结果表明,CVT-RegNet模型对P53突变状态的预测准确率达到95.06%,AUC(Area under Curve)得分为0.9492,优于现有的P53基因状态预测模型.CVT-RegNet实现了胶质瘤P53基因状态的无创预测,减轻了患者的经济负担及身心伤害,为胶质瘤的临床精准诊断治疗提供了重要价值.
文摘针对目前胶质瘤影像数据利用率不高、特征提取不全面等问题,提出一种基于深度学习的半监督胶质瘤肿瘤蛋白53(Tumor Protein 53,P53)突变状态预测方法 .首先,使用非均匀粒度多批次(Non-Uniform Granularity Multi-Batch,NUGMB)灰度等级划分算法,优化胶质瘤MR影像的预处理;其次,提出多中心协作(Multi Center Collaboration,MCC)的K均值聚类算法,进行胶质瘤影像数据的伪标签标注;最后,提出一种全新的注意力机制LWAM(Local Longer and Wider Attention Modules),构建基于LWAM的改进MaxViT模型,用于胶质瘤P53突变状态术前无创预测.基于NUGMB,MCC和LWAM算法的NML-MaxViT模型预测胶质瘤P53突变状态的准确率为96.23%,可实现术前无创预测,辅助医生的临床诊疗.