- 
                题名大数据环境下基于贝叶斯推理的中文地名地址匹配方法
                    被引量:12
            
- 1
- 
                
            
- 
                
                            作者
                                许普乐
                                王杨
                                黄亚坤
                                黄少芬
                                赵传信
                                陈付龙
                
            
- 
                    机构
                    
                            安徽师范大学数学计算机科学学院
                    
                
- 
                出处
                
                
                    《计算机科学》
                    
                            CSCD
                            北大核心
                    
                2017年第9期266-271,共6页
            
- 
                        基金
                        
                                    国家自然科学基金(61572036)
                                    安徽省自然科学基金(1708085MF156)
                                    安徽省重大人文社科基金项目(SK2014ZD033)资助
                        
                    
- 
                    文摘
                        传统的中文地名地址匹配技术难以处理大数据环境下海量、多样和异构的智慧城市地理信息空间中的中文地名地址快速匹配问题。提出了一种Spark计算平台下基于中文地名地址要素的匹配框架及应用智能决策的匹配算法(An Intelligent Decision Matching Algorithm,AIDMA)。首先,从中文地名地址中富含的语义性和中文字符串、数字与字母之间的自然分隔性两个方面进行地址要素解析,构建了融合多距离信息的贝叶斯推理网络,从而提出了基于多准则评判的中文地名地址匹配决策方法。然后,利用芜湖市514967条脱敏后的燃气开户中文地名地址信息库与1770979条网格化社区中的中文地名地址信息库(包含网格化地址的地理空间信息)进行实验与分析。实验结果表明,在处理大规模中文地名地址信息时,相比于传统的中文地名地址匹配方法,该方法能够有效提高单条中文地名地址的匹配效率,同时在匹配度与精确度两个指标上匹配结果更加均衡。
                        
                    
            
- 
                    关键词
                    
                            大数据
                            SPARK
                            中文地名地址匹配技术
                            贝叶斯推理
                    
                
- 
                    Keywords
                    
                            Big data,Spark,Matching technologies of Chinese place-name address,Bayesian decision
                    
                
- 
                    分类号
                    
                            
                                
                                    TP391
[自动化与计算机技术—计算机应用技术]                                
                            
                    
                
- 
                
            
            - 
                题名非均权-动态规划地址匹配算法设计与实现
                    被引量:1
            
- 2
- 
                
            
- 
                
                            作者
                                徐嘉康
                                张晨
                                王柳静
                                张贵军
                
            
- 
                    机构
                    
                            浙江工业大学信息工程学院
                    
                
- 
                出处
                
                
                    《小型微型计算机系统》
                    
                            CSCD
                            北大核心
                    
                2022年第3期530-535,共6页
            
- 
                        基金
                        
                                    国家自然科学基金项目(61573317)资助。
                        
                    
- 
                    文摘
                        传统的地址匹配方法往往难以胜任中文地址匹配问题.首先,每个中文单字都是独立整体,在纠错上难度大于英文,其次中文地址体系结构复杂,缺乏一个统一的标准.本文结合生物信息领域的序列比对思想,提出了一种基于动态规划的中文地址匹配方法.该方法将中文单字看成字符单元,对中文地址进行序列化,改进Smith-waterman算法进行序列匹配.针对中文的单字特点,统计区分文字的重要性差异,构建非均权打分策略;引入空分罚分策略,解决错误匹配及其过度拟合问题;使用排序均一化策略,优化了排序效率,增加了结果集的多样性.最后,将本算法应用于杭州市实际路网(1:30万),实验结果表明,该算法可以有效提升中文地址匹配精度.
                        
                    
            
- 
                    关键词
                    
                            动态规划
                            中文地址匹配
                            地址树
                            空位罚分
                            置换矩阵
                            序列比对
                    
                
- 
                    Keywords
                    
                            dynamic programming
                            Chinese address matching
                            address tree
                            gap penalty
                            permutation matrix
                            sequence alignment
                    
                
- 
                    分类号
                    
                            
                                
                                    TP301
[自动化与计算机技术—计算机系统结构]                                
                            
                    
                
-