期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
19
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
论语言智能教育
被引量:
10
1
作者
周建设
薛嗣媛
《语言战略研究》
CSSCI
北大核心
2023年第4期30-43,共14页
语言智能教育是数智时代出现的新事物,涉及三方面内容:以语言智能学科为对象的理论教育,以语言智能工程为对象的技术教育,以语言智能服务为对象的应用教育。语言智能学科是基于语言理论的交叉学科,主要涉及脑语智能和计算智能两大主体...
语言智能教育是数智时代出现的新事物,涉及三方面内容:以语言智能学科为对象的理论教育,以语言智能工程为对象的技术教育,以语言智能服务为对象的应用教育。语言智能学科是基于语言理论的交叉学科,主要涉及脑语智能和计算智能两大主体内容。基于基础理论研究、数据资源建设、关键技术研发和应用系统创新四大主要方向,形成语言智能教育新模式。智能语音、机器翻译、知识图谱、智能内容生成、主题聚合度计算、情感计算、人文基因计算、写作智能评测等语言智能关键技术,是实现语言智能工程的基础。由教学资源建设、智能教学设计、智能读写训练、语言能力评估组成的“四位一体”的语言智能教学平台是语言智能在赋能全社会教育中的应用实践。
展开更多
关键词
数智时代
语言智能
智能教育
语言智能教育
技术应用
在线阅读
下载PDF
职称材料
语言智能技术发展与语言数据治理技术模式构建
被引量:
10
2
作者
张凯
薛嗣媛
周建设
《语言战略研究》
CSSCI
北大核心
2022年第4期35-48,共14页
梳理近60年(1960~2019)语言智能技术专利申请文献,可以发现近5年语言智能技术进步显著,预计在未来较长一段时期内仍将处于技术爆发期。当下,语言数据治理的重要性日渐凸显。分析当前智能技术赋能下机器翻译、智能客服、网络舆情监测、...
梳理近60年(1960~2019)语言智能技术专利申请文献,可以发现近5年语言智能技术进步显著,预计在未来较长一段时期内仍将处于技术爆发期。当下,语言数据治理的重要性日渐凸显。分析当前智能技术赋能下机器翻译、智能客服、网络舆情监测、多语言资源建设等语言数据热点服务,指出语言数据治理体系面临的技术困境:(1)语言数据的偏见现象;(2)经典语言治理模型的短板。为破解困境并弥补经典数据挖掘模式的短板,提出点状聚合、线性组合和多层事态3种语言数据治理模式并展开对比分析,以期对智能化数据治理提供参考。
展开更多
关键词
专利文献分析
语言智能技术发展
语言数据治理
语言数据治理技术模式
在线阅读
下载PDF
职称材料
语言智能评测理论研究与技术应用——以英语作文智能评测系统为例
被引量:
8
3
作者
周建设
张凯
+3 位作者
罗茵
娜仁图雅
张跃
刘小力
《语言战略研究》
2017年第5期12-19,共8页
近些年,语言智能评测技术取得了重要突破并得到应用推广,拓展了中国语言产业发展的新领域。本文基于大数据背景,分析语言评测技术发展及相关理论模型,结合2017年"英语百万同题英语写作"数据,对比分析用户行为、效果提升等情况...
近些年,语言智能评测技术取得了重要突破并得到应用推广,拓展了中国语言产业发展的新领域。本文基于大数据背景,分析语言评测技术发展及相关理论模型,结合2017年"英语百万同题英语写作"数据,对比分析用户行为、效果提升等情况,印证评测技术的有效性和发展语言智能评测产业的重要性。
展开更多
关键词
英语作文评测
评测技术
语言智能
语言产业
人工智能
在线阅读
下载PDF
职称材料
教育、科技、人才协同发展背景下的语言人才培养
被引量:
2
4
作者
周建设
董苏
薛嗣媛
《外国语文》
北大核心
2024年第4期33-44,共12页
大语言模型的出现对当代语言人才培养提出了挑战性要求,教育部提出了一系列关于教育、科技、人才的战略要求。必然地,探索语言人才培养已成为我国语言文字工作者的时代使命。本文顺应语言科技发展趋势,适应语言人才培养需求,结合教育数...
大语言模型的出现对当代语言人才培养提出了挑战性要求,教育部提出了一系列关于教育、科技、人才的战略要求。必然地,探索语言人才培养已成为我国语言文字工作者的时代使命。本文顺应语言科技发展趋势,适应语言人才培养需求,结合教育数字化转型,全面了解国内外语言人才培养的研究基础和实践成果,分析语言人才培养政策,科学设计数智时代语言智能人才培养规格,完善语言智能培养方案,创新语言智能培养模式,实施语言智能培养战略。
展开更多
关键词
语言人才培养
语言智能
语言智能教育
大语言模型
数智时代
在线阅读
下载PDF
职称材料
融合篇章成分识别的中文记叙文篇章结构测评
被引量:
1
5
作者
王晓艺
王锦丞
刘杰
《小型微型计算机系统》
北大核心
2025年第1期55-63,共9页
篇章结构合理性是作文自动评测中的重要考量维度.当前针对记叙文篇章结构合理性自动评估的研究还处于起步阶段.该文通过与语文教学专家共同制定记叙文篇章结构评价标准与篇章成分标注规范,构建了具有一定规模的中文记叙文篇章结构测评...
篇章结构合理性是作文自动评测中的重要考量维度.当前针对记叙文篇章结构合理性自动评估的研究还处于起步阶段.该文通过与语文教学专家共同制定记叙文篇章结构评价标准与篇章成分标注规范,构建了具有一定规模的中文记叙文篇章结构测评语料库.基于该语料库,该文提出了融合篇章成分识别的记叙文篇章结构测评模型.模型利用深度学习算法和注意力机制从单词、句子、段落3个层次学习文章特征,从而提取篇章结构的重要信息,最后通过融合识别的篇章成分结果进行结构合理性评分.利用构建的记叙文篇章结构语料库进行实验,结果表明,该文提出的模型准确率达到79.6%,优于现有工作和基线模型.
展开更多
关键词
篇章结构合理性
语料库
作文自动评分
层次注意力网络
BERT
在线阅读
下载PDF
职称材料
基于提示学习的记叙文篇章成分识别研究
6
作者
王晓艺
王炯
+1 位作者
刘杰
周建设
《计算机科学》
北大核心
2025年第6期330-335,共6页
篇章结构分析是作文自动评分中的重要技术之一,也是自然语言处理领域中的重要研究内容。近年来,作文篇章结构分析的研究很少且主要集中于议论文,对记叙文的研究还较少,尤其是在记叙文篇章结构方面,研究方法和研究资源都相对有限。针对...
篇章结构分析是作文自动评分中的重要技术之一,也是自然语言处理领域中的重要研究内容。近年来,作文篇章结构分析的研究很少且主要集中于议论文,对记叙文的研究还较少,尤其是在记叙文篇章结构方面,研究方法和研究资源都相对有限。针对这些问题,文中构建了面向中小学记叙文篇章成分识别的数据集,使用基于BERT-BiLSTM的语料自动标注模型提高标注效率,并对内容分布以及语料标注的一致性进行了统计分析。提出了基于提示学习的记叙文篇章成分识别方法,通过自动构建识别篇章成分的前缀提示模板,利用层次注意力机制学习更为丰富的文本特征,从而提高记叙文篇章结构识别能力。在自建数据集下进行实验,结果表明,所提出的方法识别记叙文篇章结构的准确率提高到85.80%,优于对比的预训练语言模型。
展开更多
关键词
数据集构建
篇章结构
作文自动评分
提示学习
在线阅读
下载PDF
职称材料
融合网络剪枝和动态扩展的终身文本分类方法
7
作者
张泽
王炯
+3 位作者
王晓艺
聂凯峰
刘杰
周建设
《小型微型计算机系统》
北大核心
2025年第6期1319-1325,共7页
随着互联网技术的发展,产生了大量的各种背景下的文本信息,包括新闻资料,科学文献等等,这些文本信息所包含的内容并不统一.对于神经网络而言,不断地增加新领域的训练数据必然会导致对旧信息的灾难遗忘.因此在实际应用中,训练出可以终身...
随着互联网技术的发展,产生了大量的各种背景下的文本信息,包括新闻资料,科学文献等等,这些文本信息所包含的内容并不统一.对于神经网络而言,不断地增加新领域的训练数据必然会导致对旧信息的灾难遗忘.因此在实际应用中,训练出可以终身学习的文本分类器具有很高的应用价值.为此,该文提出了一种基于网络剪枝和动态扩展策略的终身文本分类方法,适用于知识背景不断增加的文本分类场景.具体而言,该文将网络剪枝、参数正则化更新和网络扩展相结合,保证神经网络可以在不遗忘旧任务知识的前提下更有效的学习新任务.通过使用不确定正则化参数更新策略防止旧领域信息的遗忘,实现任务之间的知识迁移.在5个流行的文本分类数据集上进行终身学习的实验设置下进行验证,实验结果表明本文的方法与BERT预训练模型相比高出约10%,并且均优于其他终身学习的方法.
展开更多
关键词
文本分类
终身学习
动态网络扩展
正则化更新
在线阅读
下载PDF
职称材料
融合动态语义及静态结构特征的方面级情感分析
8
作者
尹文晓
周建设
+1 位作者
马登豪
吕学强
《计算机工程与应用》
北大核心
2025年第12期177-186,共10页
方面级情感分析作为细粒度情感分析任务,其目标是判断给定句子中特定方面的情感极性。目前这项任务面临的主要挑战是能否准确地建模方面词与观点词之间的关系。为了解决这个问题,从获取句子的动态语义特征和静态结构特征两方面出发,对...
方面级情感分析作为细粒度情感分析任务,其目标是判断给定句子中特定方面的情感极性。目前这项任务面临的主要挑战是能否准确地建模方面词与观点词之间的关系。为了解决这个问题,从获取句子的动态语义特征和静态结构特征两方面出发,对方面词与观点词之间的关系进行建模。该模型通过引入动态调整权重适配器,在结合上下文的基础上获取方面感知动态语义特征,同时按照短语-分句结构的句法层次与图注意力网络结合,从而利用更全面的句法信息来获取方面感知静态结构特征,通过融合动态语义特征和静态结构特征实现更准确的方面级情感极性预测。实验结果表明,该模型在Rest14、Laptop14、Twitter这3个公开数据集上,准确率和Macro-F1值相比于基线模型均有所提升,具有较好的方面级情感分析性能。
展开更多
关键词
方面级情感分析
动态语义
静态结构
图注意力网络
在线阅读
下载PDF
职称材料
写作智能评测研究综述和发展前景
被引量:
5
9
作者
薛嗣媛
周建设
任福继
《中文信息学报》
CSCD
北大核心
2023年第2期1-14,共14页
随着计算机技术的发展,写作智能评测研究有了更加丰富的技术手段和应用场景。该文对写作智能评测的相关研究进行了梳理,首先对写作智能评测系统的发展历程进行了阶段性梳理;其次介绍了写作智能评测研究的任务模式、常用数据库、评估方式...
随着计算机技术的发展,写作智能评测研究有了更加丰富的技术手段和应用场景。该文对写作智能评测的相关研究进行了梳理,首先对写作智能评测系统的发展历程进行了阶段性梳理;其次介绍了写作智能评测研究的任务模式、常用数据库、评估方式;再次梳理了写作智能评测的主要技术方法;再次以面向汉语母语者、面向汉语非母语者两个不同维度展开介绍中文写作智能评测研究的现状及面临的挑战;最后对未来写作智能评测研究发展进行展望。
展开更多
关键词
写话智能评测
汉语作文测评
语言智能技术
中文信息处理
在线阅读
下载PDF
职称材料
中文智能阅读的困境与突破
被引量:
8
10
作者
张文彦
张凯
《语言战略研究》
2018年第4期70-77,共8页
智能阅读作为当下教育领域发展的热点之一,无疑具有重要的社会意义和研究价值。和传统阅读方式相比,智能阅读将是改变中国阅读现状的有力手段。中国政府高度重视阅读推广工作。本文在人工智能时代背景下,通过调研当前各类型阅读平台的...
智能阅读作为当下教育领域发展的热点之一,无疑具有重要的社会意义和研究价值。和传统阅读方式相比,智能阅读将是改变中国阅读现状的有力手段。中国政府高度重视阅读推广工作。本文在人工智能时代背景下,通过调研当前各类型阅读平台的发展现状、社会意义等内容,分析目前中文智能阅读基础理论薄弱、技术难以借鉴等五大发展痛点,对智能阅读未来发展提出确立发展目标、确立国家标准等五项发展建议和理论完善、内容立体等三项走向预测。
展开更多
关键词
智能阅读
阅读分级标准
阅读能力评测理论
立体化阅读
在线阅读
下载PDF
职称材料
《数据论文出版元数据》国家标准研制与实践
被引量:
4
11
作者
高瑜蔚
朱艳华
+2 位作者
胡良霖
孔丽华
赵欢
《中国科学数据(中英文网络版)》
CSCD
2024年第1期69-78,共10页
2023年8月,《GB/T 42813-2023数据论文出版元数据》国家标准正式发布,该标准规定了数据论文出版元数据的内容与结构,包括数据集元数据、数据论文元数据及其描述方法、扩展原则与方法。适用于数据论文及其关联数据集的描述、保存、在线...
2023年8月,《GB/T 42813-2023数据论文出版元数据》国家标准正式发布,该标准规定了数据论文出版元数据的内容与结构,包括数据集元数据、数据论文元数据及其描述方法、扩展原则与方法。适用于数据论文及其关联数据集的描述、保存、在线出版和共享服务等。该标准的发布标志着首次从国家层面对数据论文出版这一科学数据开放共享新模式进行了总体约定,解决了数据出版领域缺少标准规范指导的问题。有助于数据出版机构快速地发布数据论文和关联数据,为科学数据确权、产权保护提供支撑,对于推动科学数据开放共享生态建设具有重要意义。自标准发布以后,一些数据期刊或科学数据出版平台开始使用标准规定的元素与定义,开展较为广泛的实践。
展开更多
关键词
开放科学
数据论文
科学数据出版
元数据
标准规范
科学数据集
在线阅读
下载PDF
职称材料
聚类标注和多粒度特征融合的基金新闻分类
12
作者
胡菊香
吕学强
+1 位作者
游新冬
周建设
《小型微型计算机系统》
CSCD
北大核心
2024年第2期257-264,共8页
针对人工标注类别耗时耗力、效率低,以及现有文本分类方法忽略词语、句子之间关系,未对文本分类关键特征赋予更高权重等问题,提出了一种基于聚类加权标注和多粒度特征融合的基金新闻分类方法.基于聚类加权的类别标注算法将K-Means和DBS...
针对人工标注类别耗时耗力、效率低,以及现有文本分类方法忽略词语、句子之间关系,未对文本分类关键特征赋予更高权重等问题,提出了一种基于聚类加权标注和多粒度特征融合的基金新闻分类方法.基于聚类加权的类别标注算法将K-Means和DBSCAN的聚类结果进行加权计算并自动标注基金文本数据,辅以少量人工校对,为后续基金新闻分类提供数据支撑.多粒度特征融合的分类算法首先从词粒度出发构建停用词表、扩展词典;其次从句粒度出发抽取新闻摘要,捕捉更具有语义关联的文本信息;最后将多头注意力机制嵌入BERT模型,对关键特征赋予更高权重,以提高分类的准确性.本文从多个角度进行了充分地实验,该方法具有高效的处理能力和有效性,其分类精确率可达到95.21%,优于现有方法.
展开更多
关键词
多粒度
特征融合
文本分类
深度学习
在线阅读
下载PDF
职称材料
我国科学数据标准规范实践与思考
被引量:
8
13
作者
朱艳华
高瑜蔚
+1 位作者
胡良霖
胡泊
《中国科学数据(中英文网络版)》
CSCD
2023年第1期158-167,共10页
科学数据标准规范是推动数据资源共享服务的重要基础,研究分析其需求变化和未来发展对充分发挥数据价值,提升我国科技创新竞争力具有重要意义。本文基于工作实践,调研分析我国科学数据标准研制现状,总结梳理现阶段数据标准研制的新需求...
科学数据标准规范是推动数据资源共享服务的重要基础,研究分析其需求变化和未来发展对充分发挥数据价值,提升我国科技创新竞争力具有重要意义。本文基于工作实践,调研分析我国科学数据标准研制现状,总结梳理现阶段数据标准研制的新需求。最后,文章提出我国科学数据标准规范工作思考与建议,包括充分发挥数据标准规范技术支撑作用,加强国际标准引领和团体标准研发,以及持续跟踪标准使用的效果和评价。
展开更多
关键词
科学数据
数据资源
标准规范体系
标准实践
在线阅读
下载PDF
职称材料
基于孪生神经网络的行文一致性测评研究
被引量:
2
14
作者
刘杰
张文轩
+2 位作者
李亚光
张逸超
周建设
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2022年第6期649-657,共9页
针对目前的篇章级行文一致性度量模型只考虑了待测作文的全文行文一致性,无法捕捉文本语义块的隐含语义特征及其之间的一致性问题,提出了一种通用的作文行文一致性测评模型.该模型借鉴孪生神经网络的思想,创新性地同时提取作文中核心人...
针对目前的篇章级行文一致性度量模型只考虑了待测作文的全文行文一致性,无法捕捉文本语义块的隐含语义特征及其之间的一致性问题,提出了一种通用的作文行文一致性测评模型.该模型借鉴孪生神经网络的思想,创新性地同时提取作文中核心人物的性格、形象特征以及故事情节特征并进行相似度度量,从而获取文本的中心思想以及行文一致性的匹配分数;使用无监督主题模型Biterm-LDA(Latent Dirichlet Allocation)对作文进行主题特征提取,解决了对手工标注的依赖。实验结果表明提出的模型评分与人工标注结果多数一致,且优于普通神经网络模型.
展开更多
关键词
作文测评
作文自动评分
行文一致性
孪生神经网络
在线阅读
下载PDF
职称材料
TIMR:模板图像匹配矫正
被引量:
5
15
作者
张祥祥
吕学强
+2 位作者
韩晶
游新冬
张凯
《小型微型计算机系统》
CSCD
北大核心
2022年第4期807-814,共8页
针对当前文档图像透视变形矫正算法抗干扰性差,矫正效果不佳等问题,本文提出一种基于BRISK特征点检测与匹配的文档图像矫正算法,称之为模板图像匹配矫正算法(Template Image Matching Rectification,TIMR).该算法仅需制作目标领域内的...
针对当前文档图像透视变形矫正算法抗干扰性差,矫正效果不佳等问题,本文提出一种基于BRISK特征点检测与匹配的文档图像矫正算法,称之为模板图像匹配矫正算法(Template Image Matching Rectification,TIMR).该算法仅需制作目标领域内的单张矫正模板图像,并结合BRISK算法与本文提出的双重特征点过滤算法实现该领域所有透视变形文档图像的矫正处理.其中,双重过滤算法包含特征点先验过滤(Prior Filtering,PF)与特征点迭代匹配过滤(Iterative Matching Filtering,IMF)算法,有效地过滤掉了矫正模板图像中的无关特征点与不稳定特征点,实现特征点匹配与TIMR算法的加速.在特定的医疗领域的检验单文档图像数据上进行矫正测试,并与当前主流矫正的算法与商业软件进行了比较.实验结果表明,本文算法具有使用简单方便,鲁棒性强,矫正效果好和矫正速度快等特点.
展开更多
关键词
图像处理
文档图像矫正
透视变换
图像匹配
在线阅读
下载PDF
职称材料
一种改进模糊C均值聚类的图像标注方法
被引量:
1
16
作者
李长磊
吕学强
+1 位作者
张凯
董志安
《小型微型计算机系统》
CSCD
北大核心
2018年第8期1860-1864,共5页
本文主要利用图像底层特征以及图像标签的语义信息对图像进行自动标注,在此基础上提出了改进模糊C均值(FCM)聚类的标注方法.首先结合图像特征以及同类、异类样本间的关系信息,融合聚类中心之间的距离,改善了算法中距离测度较为单一的问...
本文主要利用图像底层特征以及图像标签的语义信息对图像进行自动标注,在此基础上提出了改进模糊C均值(FCM)聚类的标注方法.首先结合图像特征以及同类、异类样本间的关系信息,融合聚类中心之间的距离,改善了算法中距离测度较为单一的问题.在目标函数中将传统的距离测度改为同类样本距离与异类样本距离之差,体现了同类样本的密度和异类样本的稀疏程度,提高了标注准确率.然后使用改进后的算法对每类图像进行聚类,计算待标注图像到各个聚类中心的平均距离来判断其类别.之后计算图像到各个子类的聚类中心的距离,并统计所属类内的标注词即为图像的标注词.利用Corel5K和iaprtc12来验证算法的可行性,通过实验对比不同测度以及分析不同标注模型的结果,表明该方法有效的提高了标注准确率.
展开更多
关键词
FCM聚类算法
同类异类样本
图像标注
聚类中心
距离测度
在线阅读
下载PDF
职称材料
像素特征与粘连人体分割结合的人数统计方法
被引量:
1
17
作者
杨林
吕学强
+1 位作者
张鑫
张凯
《计算机工程与设计》
北大核心
2019年第2期455-461,共7页
针对类似电影院、教室之类的人体间遮挡较少的场景,提出一种像素特征与粘连人体分割相结合的人数统计方法,为更好地处理粘连人体的分割问题,提出归一化距离度量的聚类算法与基于动态掩膜的投影法。当区域内人员较少时,通过建立区域内归...
针对类似电影院、教室之类的人体间遮挡较少的场景,提出一种像素特征与粘连人体分割相结合的人数统计方法,为更好地处理粘连人体的分割问题,提出归一化距离度量的聚类算法与基于动态掩膜的投影法。当区域内人员较少时,通过建立区域内归一化后像素数与区域人数间的对应关系实现间接人数统计;当区域内人数增多且高于一定程度时,借助简单场景中人员特定的位置信息,进行粘连人体分割并对分割结果进行计数统计。在处理粘连人体分割问题上,针对人体连通区域的不同特点,分别使用归一化距离度量的聚类算法和改进的投影法进行人体粘连区域的行列分割。通过在影院影厅进行实验验证了该算法的有效性。
展开更多
关键词
红外图像
归一化策略
人体遮挡
聚类算法
投影法
在线阅读
下载PDF
职称材料
SGNet:融合多特征的密集人群计数网络
被引量:
3
18
作者
韩晶
王希畅
+1 位作者
吕学强
张凯
《计算机工程与设计》
北大核心
2022年第11期3001-3007,共7页
为解决密集人群计数任务中多列卷积核独立训练的限制及缺少针对性优化的问题,提出融合多尺度特征的密集人群计数算法SGNet。通过设计一种围绕相同感受野SRF(same receptive field)的特征融合方法,达到强化不同特征列之间的关联性,获得...
为解决密集人群计数任务中多列卷积核独立训练的限制及缺少针对性优化的问题,提出融合多尺度特征的密集人群计数算法SGNet。通过设计一种围绕相同感受野SRF(same receptive field)的特征融合方法,达到强化不同特征列之间的关联性,获得更多的特征细节和特征信息的目的;融合网格赢家通吃GWTA(grid winner-take-all)的思想设计损失函数,通过计算区域损失值着重优化重要特征。实验结果表明,与基线模型相比SGNet在任一数据集上的检测效果均有一定程度的提升,验证了该模型具有较强的鲁棒性及可移植性。
展开更多
关键词
密集人群
人数估计
密度图生成
相同感受野
网格赢家通吃
在线阅读
下载PDF
职称材料
DPENet:轻量化文档姿态估计网络
被引量:
1
19
作者
韩晶
吕学强
+2 位作者
张祥祥
郝伟
张凯
《计算机工程与应用》
CSCD
北大核心
2022年第22期210-218,共9页
现有的用于矫正透视倾斜变形文档的深度学习模型存在空间泛化性差、模型参数量大、推理速度慢等问题。从姿态估计的角度出发,提出一种轻量化文档姿态估计网络DPENet(lightweight document pose estimation network),以优化上述问题。将...
现有的用于矫正透视倾斜变形文档的深度学习模型存在空间泛化性差、模型参数量大、推理速度慢等问题。从姿态估计的角度出发,提出一种轻量化文档姿态估计网络DPENet(lightweight document pose estimation network),以优化上述问题。将文档图像中的单一文档视为一个姿态估计对象,将文档的四个角点视为文档对象的四个姿态估计点,采用兼具全连接回归与高斯热图回归优点的DSNT(differentiable spatial to numerical transform)模块实现文档图像角点的高精度定位,并通过透视变换处理实现透视变形文档图像的高精度矫正。DPENet采用轻量化设计,以面向移动端的MobileNetV2为主干网络,模型体量只有10.6 MB。在SmartDoc-QA(仅取148张文档图像)数据集上与现有的三种主流网络进行了对比实验,实验结果表明,DPENet的矫正成功率(96.6%)和平均位移误差(mean displacement error,MDE)(1.28个像素)均优于其他三种网络,同时其平均矫正速度也有良好的表现。在保持轻量化和速度快的条件下,DPENet网络具有更高的变形文档矫正成功率和矫正精度。
展开更多
关键词
姿态估计
深度学习
文档图像矫正
轻量化网络
MobileNetV2
在线阅读
下载PDF
职称材料
题名
论语言智能教育
被引量:
10
1
作者
周建设
薛嗣媛
机构
首都师范大学
中国
语言
智能
研究
中心
出处
《语言战略研究》
CSSCI
北大核心
2023年第4期30-43,共14页
基金
科技部科技创新2030—重大项目“复杂版面手写图文识别及理解关键技术研究”(2020AAA0109700)
国家语委全球中文学习联盟研究专项“人工智能技术赋能中文学习研究——中文篇章逻辑结构表征和智能评估”(YB145–16)
+1 种基金
中国博士后科学基金项目“中文叙事语篇的表征和智能测评研究”(2022M722231)
国家语委重点项目“基于语言智能核心技术的国际中文教育与国际传播体系创新研究”(ZDI145–63)。
文摘
语言智能教育是数智时代出现的新事物,涉及三方面内容:以语言智能学科为对象的理论教育,以语言智能工程为对象的技术教育,以语言智能服务为对象的应用教育。语言智能学科是基于语言理论的交叉学科,主要涉及脑语智能和计算智能两大主体内容。基于基础理论研究、数据资源建设、关键技术研发和应用系统创新四大主要方向,形成语言智能教育新模式。智能语音、机器翻译、知识图谱、智能内容生成、主题聚合度计算、情感计算、人文基因计算、写作智能评测等语言智能关键技术,是实现语言智能工程的基础。由教学资源建设、智能教学设计、智能读写训练、语言能力评估组成的“四位一体”的语言智能教学平台是语言智能在赋能全社会教育中的应用实践。
关键词
数智时代
语言智能
智能教育
语言智能教育
技术应用
Keywords
digital intelligence era
language intelligence
intelligence education
language intelligence education
technology application
分类号
H002 [语言文字—语言学]
在线阅读
下载PDF
职称材料
题名
语言智能技术发展与语言数据治理技术模式构建
被引量:
10
2
作者
张凯
薛嗣媛
周建设
机构
首都师范大学
中国
语言
智能
研究
中心
出处
《语言战略研究》
CSSCI
北大核心
2022年第4期35-48,共14页
基金
国家语委“十四五”科研规划2021年度重大项目“我国语言文字治理体系现状及创新研究”(ZDA145-1)
国家语委科研项目“面向基础教育的语言文字运用能力提升——信息化条件下领域专用情感词库构建研究”(YB135-163)、“人工智能技术赋能中文学习研究——中文篇章逻辑结构表征和智能评估”(YB145-16)
科技部科技创新2030重大项目“复杂版面手写图文识别及理解关键技术研究”(2020AAA0109700)。
文摘
梳理近60年(1960~2019)语言智能技术专利申请文献,可以发现近5年语言智能技术进步显著,预计在未来较长一段时期内仍将处于技术爆发期。当下,语言数据治理的重要性日渐凸显。分析当前智能技术赋能下机器翻译、智能客服、网络舆情监测、多语言资源建设等语言数据热点服务,指出语言数据治理体系面临的技术困境:(1)语言数据的偏见现象;(2)经典语言治理模型的短板。为破解困境并弥补经典数据挖掘模式的短板,提出点状聚合、线性组合和多层事态3种语言数据治理模式并展开对比分析,以期对智能化数据治理提供参考。
关键词
专利文献分析
语言智能技术发展
语言数据治理
语言数据治理技术模式
Keywords
patent document analysis
language intelligence technology
language data governance
language data governance model
分类号
H002 [语言文字—语言学]
在线阅读
下载PDF
职称材料
题名
语言智能评测理论研究与技术应用——以英语作文智能评测系统为例
被引量:
8
3
作者
周建设
张凯
罗茵
娜仁图雅
张跃
刘小力
机构
首都师范大学
中国
语言
智能
研究
中心
出处
《语言战略研究》
2017年第5期12-19,共8页
基金
国家语委重大项目"语言文字使用规范化智能监测系统研发与应用"(ZDA125-26)
国家社科基金重大委托项目"语言大数据挖掘与文化价值发现"(14&ZH036)
+3 种基金
国家社科基金重大项目"语言
思维
文化层级的高阶认知研究"(15ZDB017)
北京成像技术高精尖创新中心项目(BAICIT-201619)支持
文摘
近些年,语言智能评测技术取得了重要突破并得到应用推广,拓展了中国语言产业发展的新领域。本文基于大数据背景,分析语言评测技术发展及相关理论模型,结合2017年"英语百万同题英语写作"数据,对比分析用户行为、效果提升等情况,印证评测技术的有效性和发展语言智能评测产业的重要性。
关键词
英语作文评测
评测技术
语言智能
语言产业
人工智能
Keywords
English Automated Essay Scoring
Automated Essay Testing Techniques
language intelligence
language industry
artifi cial intelligence
分类号
H319.3 [语言文字—英语]
在线阅读
下载PDF
职称材料
题名
教育、科技、人才协同发展背景下的语言人才培养
被引量:
2
4
作者
周建设
董苏
薛嗣媛
机构
首都师范大学
中国
语言
智能
研究
中心
中国
社会科学院
语言
研究所
出处
《外国语文》
北大核心
2024年第4期33-44,共12页
基金
国家语委“十四五”科研规划2023年度省部级重大项目“教育科技人才协同发展背景下的语言人才培养研究”(ZDA145-12)
重点项目“中文表达能力智能评测理论与关键技术研究”(ZDI145-92)
+1 种基金
中国教育技术协会重大项目“中文表达能力(CEA)标准研制及其智能测评应用创新研究”(XJJ202205003)
国家语委全球中文学习联盟专项“中文篇章逻辑结构表征和智能评估”(YB145-16)的阶段性成果。
文摘
大语言模型的出现对当代语言人才培养提出了挑战性要求,教育部提出了一系列关于教育、科技、人才的战略要求。必然地,探索语言人才培养已成为我国语言文字工作者的时代使命。本文顺应语言科技发展趋势,适应语言人才培养需求,结合教育数字化转型,全面了解国内外语言人才培养的研究基础和实践成果,分析语言人才培养政策,科学设计数智时代语言智能人才培养规格,完善语言智能培养方案,创新语言智能培养模式,实施语言智能培养战略。
关键词
语言人才培养
语言智能
语言智能教育
大语言模型
数智时代
Keywords
language talent development
language intelligence
language intelligence education
large language model
digital intelligence era
分类号
H087 [语言文字—语言学]
在线阅读
下载PDF
职称材料
题名
融合篇章成分识别的中文记叙文篇章结构测评
被引量:
1
5
作者
王晓艺
王锦丞
刘杰
机构
首都师范大学
中国
语言
智能
研究
中心
首都师范大学
文学院
北京控制与电子技术研究所
北方工业
大学
信息学院
出处
《小型微型计算机系统》
北大核心
2025年第1期55-63,共9页
基金
国家科技创新2030-“新一代人工智能”重大项目(2020AAA0109700)资助
国家自然科学基金项目(62076167)资助
国家语委十四五规划项目(YB145-16)资助。
文摘
篇章结构合理性是作文自动评测中的重要考量维度.当前针对记叙文篇章结构合理性自动评估的研究还处于起步阶段.该文通过与语文教学专家共同制定记叙文篇章结构评价标准与篇章成分标注规范,构建了具有一定规模的中文记叙文篇章结构测评语料库.基于该语料库,该文提出了融合篇章成分识别的记叙文篇章结构测评模型.模型利用深度学习算法和注意力机制从单词、句子、段落3个层次学习文章特征,从而提取篇章结构的重要信息,最后通过融合识别的篇章成分结果进行结构合理性评分.利用构建的记叙文篇章结构语料库进行实验,结果表明,该文提出的模型准确率达到79.6%,优于现有工作和基线模型.
关键词
篇章结构合理性
语料库
作文自动评分
层次注意力网络
BERT
Keywords
text structure
corpus
automatic essay scoring
hierarchical network
BERT
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于提示学习的记叙文篇章成分识别研究
6
作者
王晓艺
王炯
刘杰
周建设
机构
首都师范大学
中国
语言
智能
研究
中心
首都师范大学
信息工程学院
北方工业
大学
信息学院
出处
《计算机科学》
北大核心
2025年第6期330-335,共6页
基金
国家科技创新2030-“新一代人工智能”重大项目(2020AAA0109703)
国家自然科学基金(62076167,U23B2029)。
文摘
篇章结构分析是作文自动评分中的重要技术之一,也是自然语言处理领域中的重要研究内容。近年来,作文篇章结构分析的研究很少且主要集中于议论文,对记叙文的研究还较少,尤其是在记叙文篇章结构方面,研究方法和研究资源都相对有限。针对这些问题,文中构建了面向中小学记叙文篇章成分识别的数据集,使用基于BERT-BiLSTM的语料自动标注模型提高标注效率,并对内容分布以及语料标注的一致性进行了统计分析。提出了基于提示学习的记叙文篇章成分识别方法,通过自动构建识别篇章成分的前缀提示模板,利用层次注意力机制学习更为丰富的文本特征,从而提高记叙文篇章结构识别能力。在自建数据集下进行实验,结果表明,所提出的方法识别记叙文篇章结构的准确率提高到85.80%,优于对比的预训练语言模型。
关键词
数据集构建
篇章结构
作文自动评分
提示学习
Keywords
Dataset construction
Text structure
Automated essay scoring
Prompt learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
融合网络剪枝和动态扩展的终身文本分类方法
7
作者
张泽
王炯
王晓艺
聂凯峰
刘杰
周建设
机构
首都师范大学
信息工程学院
首都师范大学
中国
语言
智能
研究
中心
北方工业
大学
信息学院
出处
《小型微型计算机系统》
北大核心
2025年第6期1319-1325,共7页
基金
新一代人工智能国家科技重大专项项目(2020AAA0109703)资助
国家自然科学基金项目(62076167,U23B2029)资助.
文摘
随着互联网技术的发展,产生了大量的各种背景下的文本信息,包括新闻资料,科学文献等等,这些文本信息所包含的内容并不统一.对于神经网络而言,不断地增加新领域的训练数据必然会导致对旧信息的灾难遗忘.因此在实际应用中,训练出可以终身学习的文本分类器具有很高的应用价值.为此,该文提出了一种基于网络剪枝和动态扩展策略的终身文本分类方法,适用于知识背景不断增加的文本分类场景.具体而言,该文将网络剪枝、参数正则化更新和网络扩展相结合,保证神经网络可以在不遗忘旧任务知识的前提下更有效的学习新任务.通过使用不确定正则化参数更新策略防止旧领域信息的遗忘,实现任务之间的知识迁移.在5个流行的文本分类数据集上进行终身学习的实验设置下进行验证,实验结果表明本文的方法与BERT预训练模型相比高出约10%,并且均优于其他终身学习的方法.
关键词
文本分类
终身学习
动态网络扩展
正则化更新
Keywords
text classification
lifelong learning
dynamic network expansion
regularization updates
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
融合动态语义及静态结构特征的方面级情感分析
8
作者
尹文晓
周建设
马登豪
吕学强
机构
首都师范大学
中国
语言
智能
研究
中心
河北北方学院信息科学与工程学院
北京信息科技
大学
网络文化与数字传播北京市重点实验室
出处
《计算机工程与应用》
北大核心
2025年第12期177-186,共10页
基金
国家自然科学基金(62171043,62202061)
国家语委项目(ZDI145-10)
+1 种基金
国家语委重点项目(ZDI145-17)
北京市自然科学基金(4212020)。
文摘
方面级情感分析作为细粒度情感分析任务,其目标是判断给定句子中特定方面的情感极性。目前这项任务面临的主要挑战是能否准确地建模方面词与观点词之间的关系。为了解决这个问题,从获取句子的动态语义特征和静态结构特征两方面出发,对方面词与观点词之间的关系进行建模。该模型通过引入动态调整权重适配器,在结合上下文的基础上获取方面感知动态语义特征,同时按照短语-分句结构的句法层次与图注意力网络结合,从而利用更全面的句法信息来获取方面感知静态结构特征,通过融合动态语义特征和静态结构特征实现更准确的方面级情感极性预测。实验结果表明,该模型在Rest14、Laptop14、Twitter这3个公开数据集上,准确率和Macro-F1值相比于基线模型均有所提升,具有较好的方面级情感分析性能。
关键词
方面级情感分析
动态语义
静态结构
图注意力网络
Keywords
aspect-based sentiment analysis
dynamic semantics
static structure
graph attention network
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
写作智能评测研究综述和发展前景
被引量:
5
9
作者
薛嗣媛
周建设
任福继
机构
首都师范大学
中国
语言
智能
研究
中心
电子科技
大学
计算机科学与工程学院
出处
《中文信息学报》
CSCD
北大核心
2023年第2期1-14,共14页
基金
科技创新2030重大项目(2020AAA0109700)
国家语委项目(YB145-16,YB135-163)
+1 种基金
中国博士后科学基金(2022M722231)
国家社会科学基金(22CYY036)。
文摘
随着计算机技术的发展,写作智能评测研究有了更加丰富的技术手段和应用场景。该文对写作智能评测的相关研究进行了梳理,首先对写作智能评测系统的发展历程进行了阶段性梳理;其次介绍了写作智能评测研究的任务模式、常用数据库、评估方式;再次梳理了写作智能评测的主要技术方法;再次以面向汉语母语者、面向汉语非母语者两个不同维度展开介绍中文写作智能评测研究的现状及面临的挑战;最后对未来写作智能评测研究发展进行展望。
关键词
写话智能评测
汉语作文测评
语言智能技术
中文信息处理
Keywords
automated essay scoring
Chinese automated essay scoring
language intelligence technology
Chinese information processing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
中文智能阅读的困境与突破
被引量:
8
10
作者
张文彦
张凯
机构
首都师范大学
中国
语言
智能
研究
中心
出处
《语言战略研究》
2018年第4期70-77,共8页
基金
北京成像技术高精尖创新中心项目(BAICIT-201619)
国家语委项目"智能辅助阅读系统关键技术研究及应用"
中国博士后科学基金项目"叙事记叙文体的动词连续性语义研究"(2018M631523)
文摘
智能阅读作为当下教育领域发展的热点之一,无疑具有重要的社会意义和研究价值。和传统阅读方式相比,智能阅读将是改变中国阅读现状的有力手段。中国政府高度重视阅读推广工作。本文在人工智能时代背景下,通过调研当前各类型阅读平台的发展现状、社会意义等内容,分析目前中文智能阅读基础理论薄弱、技术难以借鉴等五大发展痛点,对智能阅读未来发展提出确立发展目标、确立国家标准等五项发展建议和理论完善、内容立体等三项走向预测。
关键词
智能阅读
阅读分级标准
阅读能力评测理论
立体化阅读
Keywords
intelligent reading
reading grading standards
reading ability evaluation theory
multidimensional reading
分类号
H002 [语言文字—语言学]
在线阅读
下载PDF
职称材料
题名
《数据论文出版元数据》国家标准研制与实践
被引量:
4
11
作者
高瑜蔚
朱艳华
胡良霖
孔丽华
赵欢
机构
中国
科学院计算机网络信息
中心
首都师范大学中国语言智能中心
国家基础学科公共科学数据
中心
出处
《中国科学数据(中英文网络版)》
CSCD
2024年第1期69-78,共10页
文摘
2023年8月,《GB/T 42813-2023数据论文出版元数据》国家标准正式发布,该标准规定了数据论文出版元数据的内容与结构,包括数据集元数据、数据论文元数据及其描述方法、扩展原则与方法。适用于数据论文及其关联数据集的描述、保存、在线出版和共享服务等。该标准的发布标志着首次从国家层面对数据论文出版这一科学数据开放共享新模式进行了总体约定,解决了数据出版领域缺少标准规范指导的问题。有助于数据出版机构快速地发布数据论文和关联数据,为科学数据确权、产权保护提供支撑,对于推动科学数据开放共享生态建设具有重要意义。自标准发布以后,一些数据期刊或科学数据出版平台开始使用标准规定的元素与定义,开展较为广泛的实践。
关键词
开放科学
数据论文
科学数据出版
元数据
标准规范
科学数据集
Keywords
open science
data paper
scientific data publication
metadata
standard
scientific dataset
分类号
H152.3 [语言文字—汉语]
F203 [经济管理—国民经济]
在线阅读
下载PDF
职称材料
题名
聚类标注和多粒度特征融合的基金新闻分类
12
作者
胡菊香
吕学强
游新冬
周建设
机构
首都师范大学
中国
语言
智能
研究
中心
北京信息科技
大学
网络文化与数字传播北京市重点实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2024年第2期257-264,共8页
基金
国家自然科学基金项目(62171043)资助
北京市自然科学基金项目(4212020)资助
+1 种基金
国家语委项目(ZDI145-10,YB145-3)资助
北京市教育委员会科学研究计划项目(KM202111232001)资助。
文摘
针对人工标注类别耗时耗力、效率低,以及现有文本分类方法忽略词语、句子之间关系,未对文本分类关键特征赋予更高权重等问题,提出了一种基于聚类加权标注和多粒度特征融合的基金新闻分类方法.基于聚类加权的类别标注算法将K-Means和DBSCAN的聚类结果进行加权计算并自动标注基金文本数据,辅以少量人工校对,为后续基金新闻分类提供数据支撑.多粒度特征融合的分类算法首先从词粒度出发构建停用词表、扩展词典;其次从句粒度出发抽取新闻摘要,捕捉更具有语义关联的文本信息;最后将多头注意力机制嵌入BERT模型,对关键特征赋予更高权重,以提高分类的准确性.本文从多个角度进行了充分地实验,该方法具有高效的处理能力和有效性,其分类精确率可达到95.21%,优于现有方法.
关键词
多粒度
特征融合
文本分类
深度学习
Keywords
multi-granularity
feature fusion
text classification
deep learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
我国科学数据标准规范实践与思考
被引量:
8
13
作者
朱艳华
高瑜蔚
胡良霖
胡泊
机构
中国
科学院计算机网络信息
中心
国家基础学科公共科学数据
中心
首都师范大学
中国
语言
智能
研究
中心
出处
《中国科学数据(中英文网络版)》
CSCD
2023年第1期158-167,共10页
基金
中国科协科技期刊支撑服务项目“科学数据开放共享标准研究”(2022KJQK005)
中国科学院基础学科公共科学数据中心运行维护(CAS-WX2022SDC-XK08)项目资助。
文摘
科学数据标准规范是推动数据资源共享服务的重要基础,研究分析其需求变化和未来发展对充分发挥数据价值,提升我国科技创新竞争力具有重要意义。本文基于工作实践,调研分析我国科学数据标准研制现状,总结梳理现阶段数据标准研制的新需求。最后,文章提出我国科学数据标准规范工作思考与建议,包括充分发挥数据标准规范技术支撑作用,加强国际标准引领和团体标准研发,以及持续跟踪标准使用的效果和评价。
关键词
科学数据
数据资源
标准规范体系
标准实践
Keywords
scientific data
data resource
standard and specification system
standard practice
分类号
G322 [文化科学]
在线阅读
下载PDF
职称材料
题名
基于孪生神经网络的行文一致性测评研究
被引量:
2
14
作者
刘杰
张文轩
李亚光
张逸超
周建设
机构
首都师范大学
信息工程学院
北方工业
大学
信息工程学院
首都师范大学
中国
语言
智能
研究
中心
出处
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2022年第6期649-657,共9页
基金
国家新一代人工智能(2030)重大项目(2020AAA0109700)
国家自然科学基金资助项目(62076167)
北京市教委-市自然基金联合资助项目(KZ201910028039)。
文摘
针对目前的篇章级行文一致性度量模型只考虑了待测作文的全文行文一致性,无法捕捉文本语义块的隐含语义特征及其之间的一致性问题,提出了一种通用的作文行文一致性测评模型.该模型借鉴孪生神经网络的思想,创新性地同时提取作文中核心人物的性格、形象特征以及故事情节特征并进行相似度度量,从而获取文本的中心思想以及行文一致性的匹配分数;使用无监督主题模型Biterm-LDA(Latent Dirichlet Allocation)对作文进行主题特征提取,解决了对手工标注的依赖。实验结果表明提出的模型评分与人工标注结果多数一致,且优于普通神经网络模型.
关键词
作文测评
作文自动评分
行文一致性
孪生神经网络
Keywords
composition evaluation
automated essay scoring
writing consistency
siamese neural network
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
TIMR:模板图像匹配矫正
被引量:
5
15
作者
张祥祥
吕学强
韩晶
游新冬
张凯
机构
北京信息科技
大学
网络文化与数字传播北京市重点实验室
首都师范大学
中国
语言
智能
研究
中心
出处
《小型微型计算机系统》
CSCD
北大核心
2022年第4期807-814,共8页
基金
国家自然科学基金项目(61671070)资助
国家重点研发计划项目(2017YFC0805006)资助
+1 种基金
北京信息科技大学“勤信人才”培育计划项目(QXTCPB201908)资助
北京成像技术高精尖创新中心项目(BAICIT-2016003)资助。
文摘
针对当前文档图像透视变形矫正算法抗干扰性差,矫正效果不佳等问题,本文提出一种基于BRISK特征点检测与匹配的文档图像矫正算法,称之为模板图像匹配矫正算法(Template Image Matching Rectification,TIMR).该算法仅需制作目标领域内的单张矫正模板图像,并结合BRISK算法与本文提出的双重特征点过滤算法实现该领域所有透视变形文档图像的矫正处理.其中,双重过滤算法包含特征点先验过滤(Prior Filtering,PF)与特征点迭代匹配过滤(Iterative Matching Filtering,IMF)算法,有效地过滤掉了矫正模板图像中的无关特征点与不稳定特征点,实现特征点匹配与TIMR算法的加速.在特定的医疗领域的检验单文档图像数据上进行矫正测试,并与当前主流矫正的算法与商业软件进行了比较.实验结果表明,本文算法具有使用简单方便,鲁棒性强,矫正效果好和矫正速度快等特点.
关键词
图像处理
文档图像矫正
透视变换
图像匹配
Keywords
image processing
document image rectification
perspective transformation
image matching
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种改进模糊C均值聚类的图像标注方法
被引量:
1
16
作者
李长磊
吕学强
张凯
董志安
机构
北京信息科技
大学
网络文化与数字传播北京市重点实验室
首都师范大学
中国
语言
智能
研究
中心
北京市朝阳区市政市容管理委员会
出处
《小型微型计算机系统》
CSCD
北大核心
2018年第8期1860-1864,共5页
基金
国家自然科学基金项目(61671070)资助
北京成像技术高精尖创新中心项目(BAICIT-2016003)资助
+2 种基金
国家社会科学基金重大项目(14@ZH036)资助
国家语委重点项目(ZDI135-53)资助
网络文化与数字传播北京市重点实验室开放课题项目(ICDD201603)资助
文摘
本文主要利用图像底层特征以及图像标签的语义信息对图像进行自动标注,在此基础上提出了改进模糊C均值(FCM)聚类的标注方法.首先结合图像特征以及同类、异类样本间的关系信息,融合聚类中心之间的距离,改善了算法中距离测度较为单一的问题.在目标函数中将传统的距离测度改为同类样本距离与异类样本距离之差,体现了同类样本的密度和异类样本的稀疏程度,提高了标注准确率.然后使用改进后的算法对每类图像进行聚类,计算待标注图像到各个聚类中心的平均距离来判断其类别.之后计算图像到各个子类的聚类中心的距离,并统计所属类内的标注词即为图像的标注词.利用Corel5K和iaprtc12来验证算法的可行性,通过实验对比不同测度以及分析不同标注模型的结果,表明该方法有效的提高了标注准确率.
关键词
FCM聚类算法
同类异类样本
图像标注
聚类中心
距离测度
Keywords
Fuzzy C-means
Intra class distance and inter class distance
image annotation
clustering center
distance measure
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
像素特征与粘连人体分割结合的人数统计方法
被引量:
1
17
作者
杨林
吕学强
张鑫
张凯
机构
北京信息科技
大学
网络文化与数字传播北京市重点实验室
中国
电影科学技术研究所
首都师范大学
中国
语言
智能
研究
中心
出处
《计算机工程与设计》
北大核心
2019年第2期455-461,共7页
基金
国家自然科学基金项目(61671070)
北京成像技术高精尖创新中心基金项目(BAICIT-2016003)
+1 种基金
国家社会科学基金重大基金项目(15ZDB017)
国家语委重点基金项目(ZDI135-53)
文摘
针对类似电影院、教室之类的人体间遮挡较少的场景,提出一种像素特征与粘连人体分割相结合的人数统计方法,为更好地处理粘连人体的分割问题,提出归一化距离度量的聚类算法与基于动态掩膜的投影法。当区域内人员较少时,通过建立区域内归一化后像素数与区域人数间的对应关系实现间接人数统计;当区域内人数增多且高于一定程度时,借助简单场景中人员特定的位置信息,进行粘连人体分割并对分割结果进行计数统计。在处理粘连人体分割问题上,针对人体连通区域的不同特点,分别使用归一化距离度量的聚类算法和改进的投影法进行人体粘连区域的行列分割。通过在影院影厅进行实验验证了该算法的有效性。
关键词
红外图像
归一化策略
人体遮挡
聚类算法
投影法
Keywords
infrared image
normalization strategy
body occlusion
clustering algorithm
projection
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
SGNet:融合多特征的密集人群计数网络
被引量:
3
18
作者
韩晶
王希畅
吕学强
张凯
机构
北京信息科技
大学
网络文化与数字传播北京市重点实验室
首都师范大学
中国
语言
智能
研究
中心
出处
《计算机工程与设计》
北大核心
2022年第11期3001-3007,共7页
基金
国家自然科学基金项目(61671070)
北京市自然科学基金项目(4212020)
北京市市教委科研计划基金项目(KM202111232001)。
文摘
为解决密集人群计数任务中多列卷积核独立训练的限制及缺少针对性优化的问题,提出融合多尺度特征的密集人群计数算法SGNet。通过设计一种围绕相同感受野SRF(same receptive field)的特征融合方法,达到强化不同特征列之间的关联性,获得更多的特征细节和特征信息的目的;融合网格赢家通吃GWTA(grid winner-take-all)的思想设计损失函数,通过计算区域损失值着重优化重要特征。实验结果表明,与基线模型相比SGNet在任一数据集上的检测效果均有一定程度的提升,验证了该模型具有较强的鲁棒性及可移植性。
关键词
密集人群
人数估计
密度图生成
相同感受野
网格赢家通吃
Keywords
dense crowd
population estimation
density map generation
same receptive field
grid winner-take-all
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
DPENet:轻量化文档姿态估计网络
被引量:
1
19
作者
韩晶
吕学强
张祥祥
郝伟
张凯
机构
北京信息科技
大学
网络文化与数字传播北京市重点实验室
首都师范大学
中国
语言
智能
研究
中心
出处
《计算机工程与应用》
CSCD
北大核心
2022年第22期210-218,共9页
基金
国家重点研发计划(2017YFC0805006)
北京市自然科学基金(4212020)
+1 种基金
北京市教委科研计划(KM202111232001)
北京信息科技大学网络文化与数字传播北京市重点实验室开放课题(20220010001)。
文摘
现有的用于矫正透视倾斜变形文档的深度学习模型存在空间泛化性差、模型参数量大、推理速度慢等问题。从姿态估计的角度出发,提出一种轻量化文档姿态估计网络DPENet(lightweight document pose estimation network),以优化上述问题。将文档图像中的单一文档视为一个姿态估计对象,将文档的四个角点视为文档对象的四个姿态估计点,采用兼具全连接回归与高斯热图回归优点的DSNT(differentiable spatial to numerical transform)模块实现文档图像角点的高精度定位,并通过透视变换处理实现透视变形文档图像的高精度矫正。DPENet采用轻量化设计,以面向移动端的MobileNetV2为主干网络,模型体量只有10.6 MB。在SmartDoc-QA(仅取148张文档图像)数据集上与现有的三种主流网络进行了对比实验,实验结果表明,DPENet的矫正成功率(96.6%)和平均位移误差(mean displacement error,MDE)(1.28个像素)均优于其他三种网络,同时其平均矫正速度也有良好的表现。在保持轻量化和速度快的条件下,DPENet网络具有更高的变形文档矫正成功率和矫正精度。
关键词
姿态估计
深度学习
文档图像矫正
轻量化网络
MobileNetV2
Keywords
pose estimation
deep learning
document image rectification
lightweight network
MobileNet V2
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
论语言智能教育
周建设
薛嗣媛
《语言战略研究》
CSSCI
北大核心
2023
10
在线阅读
下载PDF
职称材料
2
语言智能技术发展与语言数据治理技术模式构建
张凯
薛嗣媛
周建设
《语言战略研究》
CSSCI
北大核心
2022
10
在线阅读
下载PDF
职称材料
3
语言智能评测理论研究与技术应用——以英语作文智能评测系统为例
周建设
张凯
罗茵
娜仁图雅
张跃
刘小力
《语言战略研究》
2017
8
在线阅读
下载PDF
职称材料
4
教育、科技、人才协同发展背景下的语言人才培养
周建设
董苏
薛嗣媛
《外国语文》
北大核心
2024
2
在线阅读
下载PDF
职称材料
5
融合篇章成分识别的中文记叙文篇章结构测评
王晓艺
王锦丞
刘杰
《小型微型计算机系统》
北大核心
2025
1
在线阅读
下载PDF
职称材料
6
基于提示学习的记叙文篇章成分识别研究
王晓艺
王炯
刘杰
周建设
《计算机科学》
北大核心
2025
0
在线阅读
下载PDF
职称材料
7
融合网络剪枝和动态扩展的终身文本分类方法
张泽
王炯
王晓艺
聂凯峰
刘杰
周建设
《小型微型计算机系统》
北大核心
2025
0
在线阅读
下载PDF
职称材料
8
融合动态语义及静态结构特征的方面级情感分析
尹文晓
周建设
马登豪
吕学强
《计算机工程与应用》
北大核心
2025
0
在线阅读
下载PDF
职称材料
9
写作智能评测研究综述和发展前景
薛嗣媛
周建设
任福继
《中文信息学报》
CSCD
北大核心
2023
5
在线阅读
下载PDF
职称材料
10
中文智能阅读的困境与突破
张文彦
张凯
《语言战略研究》
2018
8
在线阅读
下载PDF
职称材料
11
《数据论文出版元数据》国家标准研制与实践
高瑜蔚
朱艳华
胡良霖
孔丽华
赵欢
《中国科学数据(中英文网络版)》
CSCD
2024
4
在线阅读
下载PDF
职称材料
12
聚类标注和多粒度特征融合的基金新闻分类
胡菊香
吕学强
游新冬
周建设
《小型微型计算机系统》
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
13
我国科学数据标准规范实践与思考
朱艳华
高瑜蔚
胡良霖
胡泊
《中国科学数据(中英文网络版)》
CSCD
2023
8
在线阅读
下载PDF
职称材料
14
基于孪生神经网络的行文一致性测评研究
刘杰
张文轩
李亚光
张逸超
周建设
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2022
2
在线阅读
下载PDF
职称材料
15
TIMR:模板图像匹配矫正
张祥祥
吕学强
韩晶
游新冬
张凯
《小型微型计算机系统》
CSCD
北大核心
2022
5
在线阅读
下载PDF
职称材料
16
一种改进模糊C均值聚类的图像标注方法
李长磊
吕学强
张凯
董志安
《小型微型计算机系统》
CSCD
北大核心
2018
1
在线阅读
下载PDF
职称材料
17
像素特征与粘连人体分割结合的人数统计方法
杨林
吕学强
张鑫
张凯
《计算机工程与设计》
北大核心
2019
1
在线阅读
下载PDF
职称材料
18
SGNet:融合多特征的密集人群计数网络
韩晶
王希畅
吕学强
张凯
《计算机工程与设计》
北大核心
2022
3
在线阅读
下载PDF
职称材料
19
DPENet:轻量化文档姿态估计网络
韩晶
吕学强
张祥祥
郝伟
张凯
《计算机工程与应用》
CSCD
北大核心
2022
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部