-
题名基于博主背景的博客倾向性检索归一化策略
被引量:3
- 1
-
-
作者
廖祥文
许洪波
钟尚平
-
机构
福州大学数学与计算机科学学院
中国科学院计算技术研究所
-
出处
《中文信息学报》
CSCD
北大核心
2010年第3期75-80,104,共7页
-
基金
福建省科技创新平台计划项目(2009J1007)
福州大学引进人才基金(022224)
-
文摘
博客倾向性检索的目标是检索出不仅与特定查询主题相关而且包含针对该主题的评论的博文单元,并依据倾向性强度进行排序。目前大多数研究工作仅仅通过单个博文单元包含的主题倾向性强弱对博文进行排序。然而,博客是博主表达自己观点情感的媒介,博主的个性风格很大程度上影响着倾向性强度,忽略博主因素仅仅使用单个博文单元获取倾向性评分,会给倾向性评分带来偏差。针对这个问题,该文首先分析博主背景因素对倾向性评分的影响并建立博主背景模型,然后提出基于博主背景的博客倾向性检索归一化策略,最后使用该策略对基于概率推理模型的博客倾向性检索算法进行归一化。实验结果表明,基于博主背景的倾向性检索归一化策略能够更加合理地对博主单元进行排序。
-
关键词
计算机应用
中文信息处理
博客倾向性检索
博主背景模型
归一化策略
-
Keywords
computer application
Chinese information processing
blog opinion retrieval
blogge
profile
normalization strategy
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名像素特征与粘连人体分割结合的人数统计方法
被引量:1
- 2
-
-
作者
杨林
吕学强
张鑫
张凯
-
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
中国电影科学技术研究所
首都师范大学中国语言智能研究中心
-
出处
《计算机工程与设计》
北大核心
2019年第2期455-461,共7页
-
基金
国家自然科学基金项目(61671070)
北京成像技术高精尖创新中心基金项目(BAICIT-2016003)
+1 种基金
国家社会科学基金重大基金项目(15ZDB017)
国家语委重点基金项目(ZDI135-53)
-
文摘
针对类似电影院、教室之类的人体间遮挡较少的场景,提出一种像素特征与粘连人体分割相结合的人数统计方法,为更好地处理粘连人体的分割问题,提出归一化距离度量的聚类算法与基于动态掩膜的投影法。当区域内人员较少时,通过建立区域内归一化后像素数与区域人数间的对应关系实现间接人数统计;当区域内人数增多且高于一定程度时,借助简单场景中人员特定的位置信息,进行粘连人体分割并对分割结果进行计数统计。在处理粘连人体分割问题上,针对人体连通区域的不同特点,分别使用归一化距离度量的聚类算法和改进的投影法进行人体粘连区域的行列分割。通过在影院影厅进行实验验证了该算法的有效性。
-
关键词
红外图像
归一化策略
人体遮挡
聚类算法
投影法
-
Keywords
infrared image
normalization strategy
body occlusion
clustering algorithm
projection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名GAT:用于自然语言理解的基于全局的对抗训练
被引量:2
- 3
-
-
作者
蔡坤钊
曾碧卿
陈鹏飞
-
机构
华南师范大学软件学院
-
出处
《中文信息学报》
CSCD
北大核心
2023年第3期27-35,共9页
-
基金
广东省普通高校人工智能重点领域专项(2019KZDZX1033)
广东省基础与应用基础研究基金(2021A1515011171)
广州市基础研究计划基础与应用基础研究项目(202102080282)
-
文摘
在自然语言处理领域中,基于梯度的对抗训练是一种能够有效提高神经网络鲁棒性的方法。首先,该文针对现有的对抗训练算法效率较低的问题,提出基于全局扰动表的初始化策略,在提高神经网络的训练效率的同时保证初始化扰动的有效性;其次,针对传统的归一化方法忽略了令牌之间的相对独立性问题,提出基于全局等权的归一化策略,保证令牌之间的相对独立性,避免少数样本主导对抗训练;最后,对于使用可学习的位置编码的预训练语言模型,提出基于全局多方面的扰动策略,使得神经网络更具鲁棒性。实验结果表明,该方法能有效提升神经网络的性能。
-
关键词
自然语言理解
对抗训练
初始化策略
归一化策略
扰动策略
-
Keywords
natural language understanding
adversarial training
initialization strategy
normalization strategy
perturbations strategy
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-