期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于K近邻的众包数据分类算法 被引量:4
1
作者 李佳烨 余浩 《计算机应用研究》 CSCD 北大核心 2020年第4期973-976,共4页
针对众包数据处理中的质量控制问题,提出了一种加权K近邻投票分类方法。该方法不单单只是考虑了某个样例的标记来返回一个答案,而是通过综合考虑样例的近邻来得到更加准确的答案。同时对样例的近邻加以适当的权重来进一步提高算法的性能... 针对众包数据处理中的质量控制问题,提出了一种加权K近邻投票分类方法。该方法不单单只是考虑了某个样例的标记来返回一个答案,而是通过综合考虑样例的近邻来得到更加准确的答案。同时对样例的近邻加以适当的权重来进一步提高算法的性能,并保持了传统多数投票分类的简单性。K近邻投票分类算法可以有效地解决缺乏标记的情况,通过对近邻加以权重可以解决不平衡标记造成的影响,从而使算法的泛化性更强。通过各种场景下的实验,结果表明加权K近邻投票分类方法取得了很好的效果。 展开更多
关键词 众包数据 质量控制 K近邻投票 多数投票
在线阅读 下载PDF
众包时空数据驱动的城市地理信息推测综述 被引量:5
2
作者 阮思捷 熊可钦 +3 位作者 王树良 耿晶 鲍捷 郑宇 《电子学报》 EI CAS CSCD 北大核心 2023年第8期2238-2259,共22页
对地理信息的准确掌握是城市中各种智能决策得以实现的基础.传统地理信息收集主要靠人工测绘、人工巡检或固定传感器感知,设备、人力成本高昂.近年来,随着移动互联网的发展,泛在的移动群体在城市中产生了海量的时空数据,他们有意或无意... 对地理信息的准确掌握是城市中各种智能决策得以实现的基础.传统地理信息收集主要靠人工测绘、人工巡检或固定传感器感知,设备、人力成本高昂.近年来,随着移动互联网的发展,泛在的移动群体在城市中产生了海量的时空数据,他们有意或无意间成为城市的传感器,使研究人员有机会利用众包的思路基于此类数据推测城市地理信息.基于众包时空数据推测城市地理信息具有成本低、空间覆盖广、更新及时等优点.但其具有严重的数据质量问题,对城市地理信息推测带来了巨大挑战.本文综述了根据轨迹、基于位置的社交网络、街景等众包时空数据,推测城市中以路段、兴趣点、兴趣面为代表的地理实体的位置和属性的方法.本文给出了众包时空数据和地理实体的定义,详细比较了众包时空数据驱动的推测方法与传统方法的优劣,说明了研究问题和挑战,然后讨论了地图匹配、名称提取、位置发现和统计属性推测四个研究问题的研究进展,最后展望了该领域未来的研究方向. 展开更多
关键词 自发地理信息 时空数据挖掘 低质量数据处理 机会式感知 城市计算
在线阅读 下载PDF
数字人文项目中的数据众包运作策略研究 被引量:9
3
作者 岑炅莲 欧阳剑 曾辉 《图书与情报》 CSSCI 北大核心 2020年第5期125-132,共8页
数据驱动研究成为人文学科研究的主流,数据是数字人文项目实施的基础和核心之一。文章分析了新网络环境下数字人文数据众包的概念和现状,从数据众包发起者的角度出发论述了数据众包项目的运作模式及任务,并针对性地提出数字人文数据众... 数据驱动研究成为人文学科研究的主流,数据是数字人文项目实施的基础和核心之一。文章分析了新网络环境下数字人文数据众包的概念和现状,从数据众包发起者的角度出发论述了数据众包项目的运作模式及任务,并针对性地提出数字人文数据众包的实施方式、数据管理、质量管理、激励政策、诚信问题和成果发布及版权等问题的应对策略。研究认为,数字人文数据众包对人文数据的建设是有益的补充,数据众包给数字人文工作提供了数据化的平台和工具,数字人文数据众包可以加深公众对文化和历史的理解。 展开更多
关键词 数字人文 数据 人文数据 策略
在线阅读 下载PDF
利用收益预测与策略梯度两阶段众包评论集成
4
作者 荣欢 马廷淮 《计算机科学与探索》 CSCD 北大核心 2021年第8期1476-1489,共14页
近年来随着互联网的飞速发展,人们频繁地在网络上发布关于某一特定对象的评论内容,快速掌握众包评论文本的关键信息对决策制定、服务调整有着重要作用,对众包评论文本集成进行深入研究亦显得十分必要。众包评论文本集成旨在将不同评论... 近年来随着互联网的飞速发展,人们频繁地在网络上发布关于某一特定对象的评论内容,快速掌握众包评论文本的关键信息对决策制定、服务调整有着重要作用,对众包评论文本集成进行深入研究亦显得十分必要。众包评论文本集成旨在将不同评论者对同一对象的评论内容以既定压缩率整合成较短的集成文本,从而根据大众认知形成关于特定对象较为匹配的内容描述。针对该问题提出了一种利用收益预测与策略梯度的两阶段众包评论集成方法。该方法不依赖于任何人工真值,仅提供源众包评论文档,由代理根据收益经验自行抽取关键语句形成众包评论集成文档。具体而言,第一阶段以语句相关性与冗余性衡量集成文档内容质量,以此作为收益,利用Q-值学习预测出从当前语句选择起直至评论集成结束时所产生的长期收益,由此指导代理学习最优语句选择策略;在此基础上,第二阶段以集成文档情感强度为收益,利用策略梯度(上升)进一步调整第一阶段代理习得的语句选择策略,使得代理所产生集成文本在具备一定内容质量同时,从客观角度突显文本情感强度,更明确反映出评论者所持有的情感态度。实验结果表明,与现有相关方法相比,所提出方法在评论文本集成内容质量与情感强度方面总体取得最优,且产生集成文档所耗费时长仍控制在可接受范围之内。 展开更多
关键词 众包数据集成 真值推测 深度学习 人工智能
在线阅读 下载PDF
新型数据管理系统研究进展与趋势 被引量:35
5
作者 崔斌 高军 +3 位作者 童咏昕 许建秋 张东祥 邹磊 《软件学报》 EI CSCD 北大核心 2019年第1期164-193,共30页
随着各类新型计算技术和新兴应用领域的浮现,传统数据库技术面临新的挑战,正在从适用常规应用的单一处理方法逐步转为面向各类特殊应用的多种数据处理方式.分析并展望了新型数据管理系统的研究进展和趋势,涵盖分布式数据库、图数据库、... 随着各类新型计算技术和新兴应用领域的浮现,传统数据库技术面临新的挑战,正在从适用常规应用的单一处理方法逐步转为面向各类特殊应用的多种数据处理方式.分析并展望了新型数据管理系统的研究进展和趋势,涵盖分布式数据库、图数据库、流数据库、时空数据库和众包数据库等多个领域.具体而言:分布式数据管理技术是支持可扩展的海量数据处理的关键技术;以社交网络为代表的大规模图结构数据的处理需求带来了图数据库技术的发展;流数据管理技术用来应对数据动态变化的管理需求;时空数据库主要用于支持移动对象管理;对多源、异构而且劣质数据源的集成需求催生出新型的众包数据库技术.最后讨论了新型数据库管理系统的未来发展趋势. 展开更多
关键词 分布式数据 数据 数据 时空数据 众包数据
在线阅读 下载PDF
基于NLP方法的城市公园生物多样性感知与影响因素
6
作者 苏畅 欧阳聿婧 +2 位作者 陈一秀 田雪 郭诗怡 《中国城市林业》 2025年第2期1-9,共9页
【目的】探讨公众在城市公园的生物多样性感知,厘清公园特征对其影响因素与公众情绪福祉的增益作用,为城市生物多样性保护提供实证与理论参考。【方法】以武汉市14座城市公园为研究对象,应用网络爬虫工具获取公园用户评论众包文本数据;... 【目的】探讨公众在城市公园的生物多样性感知,厘清公园特征对其影响因素与公众情绪福祉的增益作用,为城市生物多样性保护提供实证与理论参考。【方法】以武汉市14座城市公园为研究对象,应用网络爬虫工具获取公园用户评论众包文本数据;运用自然语言处理技术量化生物多样性感知、情绪福祉感知指标以及情感得分;进一步构建回归模型,探究生物多样性感知的主要影响因素及其对公众情绪福祉的影响特征。【结果】不同类型公园在生物多样性感知偏好上呈现显著差异。公众对植物多样性和景观类型感知普遍较高,对动物多样性感知相对较低,对生物多样性保护意识及外来物种和濒危植物识别能力不足。周边环境特征(如公交站点数量、公共服务设施数量等)能显著影响公众的生物多样性感知。生物多样性感知会影响公众的情感得分、身心健康感知与生态保护意欲,其中植物季相变化、自然声音等因素对公众情绪福祉具有积极影响。【结论】城市公园生物多样性感知呈现类型差异化特征;空间尺度与周边设施配置显著影响公众感知;植物季相变化和自然声音促进公众情绪福祉;湿地类公园在多感官体验和心理恢复功能方面具有显著优势。 展开更多
关键词 城市公园 生物多样性感知 自然语言处理 众包数据 情绪福祉
在线阅读 下载PDF
结合GAN与BiLSTM-Attention-CRF的领域命名实体识别 被引量:32
7
作者 张晗 郭渊博 李涛 《计算机研究与发展》 EI CSCD 北大核心 2019年第9期1851-1858,共8页
领域内命名实体识别通常面临领域内标注数据缺乏以及由于实体名称多样性导致的同一文档中实体标注不一致等问题.针对以上问题,利用生成式对抗网络(generative adversarial network, GAN)可以生成数据的特点,将生成式对抗网络与BiLSTM-At... 领域内命名实体识别通常面临领域内标注数据缺乏以及由于实体名称多样性导致的同一文档中实体标注不一致等问题.针对以上问题,利用生成式对抗网络(generative adversarial network, GAN)可以生成数据的特点,将生成式对抗网络与BiLSTM-Attention-CRF模型相结合.首先以BiLSTM-Attention作为生成式对抗网络的生成器模型,以CNN作为判别器模型,从众包标注数据集中整合出与专家标注数据分布一致的正样本标注数据来解决领域内标注数据缺乏的问题;然后通过在BiLSTM-Attention-CRF模型中引入文档层面的全局向量,计算每个单词与该全局向量的关系得出其新的特征表示以解决由于实体名称多样化造成的同一文档中实体标注不一致问题;最后,在基于信息安全领域众包标注数据集上的实验结果表明,该模型在各项指标上显著优于同类其他模型方法. 展开更多
关键词 领域命名实体识别 生成式对抗网络 标注数据 实体标注一致 BiLSTM-Attention-CRF模型
在线阅读 下载PDF
一种基于稀疏自编码器的WiFi指纹库更新方法 被引量:3
8
作者 毛永毅 王志祥 《导航定位学报》 CSCD 2022年第3期137-144,共8页
在基于无线保真(WiFi)指纹的室内定位系统中,指纹库是否能及时更新对于精确定位有着至关重要影响。针对无线接入点(AP)移动所带来的定位误差过大的问题,提出了一种利用稀疏自动编码器(SAE)进行指纹库更新的方法。通过对众包数据进行稀... 在基于无线保真(WiFi)指纹的室内定位系统中,指纹库是否能及时更新对于精确定位有着至关重要影响。针对无线接入点(AP)移动所带来的定位误差过大的问题,提出了一种利用稀疏自动编码器(SAE)进行指纹库更新的方法。通过对众包数据进行稀疏自编码,提取众包数据中所包含的隐藏特征用于原始指纹库的重构,期间引入均方误差MSE,有效地识别了AP的移动并对原始指纹库进行更新。实验结果表明,本方法有效降低了由于AP移动所带来的定位误差,在移动2个AP、4个AP、6个AP的情况下,相较于原始指纹库的平均定位精度分别提高了66.1%,75.3%,72.4%,且适用于移动不同AP数量下指纹库的更新,为室内WiFi指纹库的更新提供了一种切实可行的方案。 展开更多
关键词 室内定位 众包数据 指纹库更新 无线接入点 稀疏自动编码器
在线阅读 下载PDF
基于城市轨道交通的群智感知任务分发方法 被引量:5
9
作者 蒋伟进 吕斯健 +2 位作者 刘跃华 陈君鹏 张婉清 《电子与信息学报》 EI CSCD 北大核心 2021年第10期3035-3042,共8页
随着当前移动终端设备的发展和5G技术的普及,移动群智感知的需求越来越大。但是目前感知任务的分发方法依然存在着传输效率低下、代价高且不稳定等问题,极大地限制了感知终端任务的完成。为此,该文利用城市轨道交通对于各大城区良好的... 随着当前移动终端设备的发展和5G技术的普及,移动群智感知的需求越来越大。但是目前感知任务的分发方法依然存在着传输效率低下、代价高且不稳定等问题,极大地限制了感知终端任务的完成。为此,该文利用城市轨道交通对于各大城区良好的覆盖性和轨道交通的可预测性,提出了面向激励成本的任务分发模型(ICTDM)和面向用户数量的任务分发模型(UNTDM)。通过轨道交通对聚集式人流的疏导性,实现感知任务在城市不同区域的选择性分发。并以任务所需人数和移动距离的最小化作为手段,完成降低系统总激励成本的目的。实验结果表明,该算法与同类算法相比,可以在完成相同任务集合的前提下,通过优化任务分发过程实现更少的任务参与者分发方案,以达到降低感知任务成本的目的。 展开更多
关键词 数据 移动物联网 群智感知 任务分发 城市轨道交通
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部