-
题名神经网络技术在电信服务领域的应用
- 1
-
-
作者
王鉴良
邬武凯
潘笑芳
-
机构
杭州三汇数字信息技术有限公司
-
出处
《中国高新技术企业》
2007年第8期131-131,133,共2页
-
文摘
本文针对电信数据仓库和数据挖掘技术进行研究,重点应用聚类分析和神经网络算法,通过对异常点的查找,从电信数据中挖掘出特殊用户群,为提供更好的电信服务奠定基础。
-
关键词
电信
数据仓库
数据挖掘
神经网络
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于实体关联的消歧算法研究
被引量:2
- 2
-
-
作者
周国民
宣鑫乐
沈佳琪
陈光宣
-
机构
浙江警察学院
杭州三汇数字信息技术有限公司
杭州电子科技大学
浙江工业大学
-
出处
《中国电子科学研究院学报》
北大核心
2020年第3期271-277,共7页
-
基金
“十三五”国家重点研发计划项目(2017YFC0820503)
NSFC-浙江两化融合联合基金重点支持项目(U1509219)。
-
文摘
随着移动互联网和云储存技术的高速发展,个人行为数据的多源性导致实体关联变得更加复杂。对于实体歧义问题,传统方法是通过文本向量或图节点的相似度计算实现消歧。本文把消歧问题转化成二分类问题,结合信令数据和ID-Mapping算法进行实体关联,依据实体关联的时空位置信息进行特征提取,最后采用机器学习模型进行实体消歧。通过准确率和查全率评估模型性能,实验结果表明模型的准确率最高可达79.01%,模型的查全率最高可达78.18%。
-
关键词
实体关联
实体歧义
特征提取
机器学习
实体消歧
-
Keywords
entity association
entity ambiguity
feature extraction
machine learning
entity disambiguation
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于手机信令数据的地铁乘客路径识别研究
被引量:6
- 3
-
-
作者
丁敬安
张欣海
-
机构
杭州三汇数字信息技术有限公司
安徽工业大学管理科学与工程学院
中国电子科学研究院
社会安全风险感知与防控大数据应用国家工程实验室
-
出处
《中国电子科学研究院学报》
北大核心
2019年第11期1194-1201,共8页
-
基金
“十三五”国家重点研发计划(2017YFC0820503)
-
文摘
随着轨道交通网络的发展,客流诱导与预警、应急管理、票务清分等问题变得更加棘手。传统方法是基于最短路径进行票务清分和断面客流预测,可结果与实际往往存在较大差异。票务清分的不合理会影响运营商利益,断面客流计算的不准确会影响地铁应急管理方案。现阶段部分学者基于位置数据识别乘客路径等特征,通过乘客实际路径解决票务清分、断面客流预测等问题,但都存在一定局限性。本文首先基于用户信令数据和站点经纬度数据识别地铁基站,再结合地铁基站过滤出乘客轨道交通系统内的位置数据,把站点作为图的节点,站点间的时间差作为权重,切分乘客当天全部轨道交通行程,利用节点的最短路径计算行程的进出站点、换乘点和时间,最终给出乘客完整路径。基于真实数据集进行实验,结果表明:基站识别算法对商A、运营商B、运营商C站点基站识别准确率分别为:79.197%、72.941%、92.893%;乘客路径识别算法对运营商A用户、运营商B用户、运营商C用户识别准确率为70%、70%、85%。
-
关键词
轨道交通网络
票务清分
断面客流预测
信令数据
图计算
路径识别
-
Keywords
Rail Transit Network
Ticket Income Distribution
Passenger Flow Forecast
Signaling Data
Graph Calculation
Path Identification
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名基于集成学习的不完备数据补全算法研究
被引量:5
- 4
-
-
作者
丁敬安
张欣海
胡博
周国民
-
机构
杭州三汇数字信息技术有限公司
安徽工业大学管理科学与工程学院
中国电子科技集团公司电子科学研究院
社会安全风险感知与防控大数据应用国家工程实验室
浙江警察学院
-
出处
《中国电子科学研究院学报》
北大核心
2020年第1期78-83,91,共7页
-
基金
“十三五”国家重点研发计划(2017YFC0820503)。
-
文摘
在数据挖掘领域中,对不完备数据进行补全,能够有效修复残缺的信息,提高挖掘效率和建模成功率。在大数据场景下,数据缺失机制的复杂性和数据的多源互补性得以呈现,以往单纯通过数据分布分析或关联分析进行分离修补的算法效果有限。文中结合数据分布和属性关联两种角度,提出一种以EM、KNN、RF等8种算法为基学习器的异质集成学习数据补全算法模型HELITW,在Iris、Boston等5种UCI机器学习标准数据集为基础,分别以10%、20%和30%比例建立的随机缺失机制数据集上,将HELITW与其他8种算法进行数据补全实验对比研究,实验结果表明:随着数据残缺比例的增加,9种模型的修补效果总体上都随之降低;但在相同实验条件下,HELITW模型补全效果优于其它8种模型。
-
关键词
不完备数据
UCI数据集
异质集成学习
HELITW
-
Keywords
incomplete data
UCI dataset
heterogeneous ensembled learning
HELITW
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-