ReLM(Rephrasing Language Model)是当前性能领先的中文拼写纠错(CSC)模型。针对它在复杂语义场景中存在特征表达不足的问题,提出深层语义特征增强的ReLM——FeReLM(Feature-enhanced Rephrasing Language Model)。该模型利用深度可分...ReLM(Rephrasing Language Model)是当前性能领先的中文拼写纠错(CSC)模型。针对它在复杂语义场景中存在特征表达不足的问题,提出深层语义特征增强的ReLM——FeReLM(Feature-enhanced Rephrasing Language Model)。该模型利用深度可分离卷积(DSC)技术融合特征提取模型BGE(BAAI General Embeddings)生成的深层语义特征与ReLM生成的整体特征,从而有效提升模型对复杂上下文的解析力和拼写错误的识别纠正精度。首先,在Wang271K数据集上训练FeReLM,使模型持续学习句子中的深层语义和复杂表达;其次,迁移训练好的权重,从而将模型学习到的知识应用于新的数据集并进行微调。实验结果表明,在ECSpell和MCSC数据集上与ReLM、MCRSpell(Metric learning of Correct Representation for Chinese Spelling Correction)和RSpell(Retrieval-augmented Framework for Domain Adaptive Chinese Spelling Check)等模型相比,FeReLM的精确率、召回率、F1分数等关键指标的提升幅度可达0.6~28.7个百分点。此外,通过消融实验验证了所提方法的有效性。展开更多
现有相关工程与技术多关注建筑构件几何信息的映射,构件语义信息挖掘侧重于工程项目需要的单一信息,导致BIM(Building Information Modeling)数据在语义交互和智能分析中的潜力未被充分挖掘。该文提出一种基于知识图谱的BIM建筑构件语...现有相关工程与技术多关注建筑构件几何信息的映射,构件语义信息挖掘侧重于工程项目需要的单一信息,导致BIM(Building Information Modeling)数据在语义交互和智能分析中的潜力未被充分挖掘。该文提出一种基于知识图谱的BIM建筑构件语义信息提取方法,首先通过设计语义映射规则将IFC(Industry Foundation Classes)模型的实体、属性、物理信息转化为知识图谱,形成可用于语义分析的结构化语义网络,然后采用TransE嵌入模型对构建的BIM知识图谱进行嵌入学习,通过向量化表示增强信息提取能力。以某三层综合建筑楼为研究对象,提取并构建了包含996个BIM语义节点和2173条关系的知识图谱,进一步采用TransE模型进行语义信息嵌入,对提取结果进行验证。实验结果表明:知识图谱能有效提取BIM建筑构件语义信息,选取最优参数后进行TransE模型嵌入学习,实体语义成功率为97.27%,该方法能够精准捕捉建筑构件各类语义信息的关键内容,减少信息遗漏和提取错误,为BIM模型信息分析和决策提供了新思路。展开更多
文摘ReLM(Rephrasing Language Model)是当前性能领先的中文拼写纠错(CSC)模型。针对它在复杂语义场景中存在特征表达不足的问题,提出深层语义特征增强的ReLM——FeReLM(Feature-enhanced Rephrasing Language Model)。该模型利用深度可分离卷积(DSC)技术融合特征提取模型BGE(BAAI General Embeddings)生成的深层语义特征与ReLM生成的整体特征,从而有效提升模型对复杂上下文的解析力和拼写错误的识别纠正精度。首先,在Wang271K数据集上训练FeReLM,使模型持续学习句子中的深层语义和复杂表达;其次,迁移训练好的权重,从而将模型学习到的知识应用于新的数据集并进行微调。实验结果表明,在ECSpell和MCSC数据集上与ReLM、MCRSpell(Metric learning of Correct Representation for Chinese Spelling Correction)和RSpell(Retrieval-augmented Framework for Domain Adaptive Chinese Spelling Check)等模型相比,FeReLM的精确率、召回率、F1分数等关键指标的提升幅度可达0.6~28.7个百分点。此外,通过消融实验验证了所提方法的有效性。
文摘现有相关工程与技术多关注建筑构件几何信息的映射,构件语义信息挖掘侧重于工程项目需要的单一信息,导致BIM(Building Information Modeling)数据在语义交互和智能分析中的潜力未被充分挖掘。该文提出一种基于知识图谱的BIM建筑构件语义信息提取方法,首先通过设计语义映射规则将IFC(Industry Foundation Classes)模型的实体、属性、物理信息转化为知识图谱,形成可用于语义分析的结构化语义网络,然后采用TransE嵌入模型对构建的BIM知识图谱进行嵌入学习,通过向量化表示增强信息提取能力。以某三层综合建筑楼为研究对象,提取并构建了包含996个BIM语义节点和2173条关系的知识图谱,进一步采用TransE模型进行语义信息嵌入,对提取结果进行验证。实验结果表明:知识图谱能有效提取BIM建筑构件语义信息,选取最优参数后进行TransE模型嵌入学习,实体语义成功率为97.27%,该方法能够精准捕捉建筑构件各类语义信息的关键内容,减少信息遗漏和提取错误,为BIM模型信息分析和决策提供了新思路。