期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
中文维基百科的结构化信息抽取及词语相关度计算方法 被引量:24
1
作者 涂新辉 张红春 +1 位作者 周琨峰 何婷婷 《中文信息学报》 CSCD 北大核心 2012年第3期109-115,共7页
维基百科作为一个以开放和用户协作编辑为特点的Web 2.0知识库系统,具有知识面覆盖度广,结构化程度高,信息更新速度快等优点。然而,维基百科的官方仅提供一些半结构化的数据文件,很多有用的结构化信息和数据,并不能直接地获取和利用。因... 维基百科作为一个以开放和用户协作编辑为特点的Web 2.0知识库系统,具有知识面覆盖度广,结构化程度高,信息更新速度快等优点。然而,维基百科的官方仅提供一些半结构化的数据文件,很多有用的结构化信息和数据,并不能直接地获取和利用。因此,该文首先从这些数据文件中抽取整理出多种结构化信息;然后,对维基百科中的各种信息建立了对象模型,并提供了一套开放的应用程序接口,大大降低了利用维基百科信息的难度;最后,利用维基百科中获取的信息,该文提出了一种基于链接所对应主题页面所属类别的词语语义相关度计算方法。 展开更多
关键词 语义相关度 中文维基百科 结构化信息
在线阅读 下载PDF
基于中文维基百科的词语语义相关度计算 被引量:9
2
作者 万富强 吴云芳 《中文信息学报》 CSCD 北大核心 2013年第6期31-37,109,共8页
语义相关度计算在信息检索、词义消歧、自动文摘、拼写校正等自然语言处理中均扮演着重要的角色。该文采用基于维基百科的显性语义分析方法计算汉语词语之间的语义相关度。基于中文维基百科,将词表示为带权重的概念向量,进而将词之间相... 语义相关度计算在信息检索、词义消歧、自动文摘、拼写校正等自然语言处理中均扮演着重要的角色。该文采用基于维基百科的显性语义分析方法计算汉语词语之间的语义相关度。基于中文维基百科,将词表示为带权重的概念向量,进而将词之间相关度的计算转化为相应的概念向量的比较。进一步,引入页面的先验概率,利用维基百科页面之间的链接信息对概念向量各分量的值进行修正。实验结果表明,使用该方法计算汉语语义相关度,与人工标注标准的斯皮尔曼等级相关系数可以达到0.52,显著改善了相关度计算的结果。 展开更多
关键词 语义相关度 显性语义分析 中文维基百科 先验概率 概念向量
在线阅读 下载PDF
面向中文维基百科的检索模型研究
3
作者 王娟 姜灵敏 +2 位作者 胡青 彭碧涛 李碧 《情报杂志》 CSSCI 北大核心 2014年第10期179-183,共5页
越来越多的研究者认识到维基百科是知识获取的有效知识源,然而维基百科站点内部现有的搜索引擎没有充分利用其丰富的语义信息,因此,本文对面向中文维基百科的检索模式进行了对比研究。实验表明,本文提出的基于分类体系的语义检索模式在... 越来越多的研究者认识到维基百科是知识获取的有效知识源,然而维基百科站点内部现有的搜索引擎没有充分利用其丰富的语义信息,因此,本文对面向中文维基百科的检索模式进行了对比研究。实验表明,本文提出的基于分类体系的语义检索模式在检准率、检全率以及检索速度方面能取得更好的效果,让用户更充分地利用到中文维基百科这个大规模知识库。 展开更多
关键词 中文维基百科 检索模型 分类体系 语义检索
在线阅读 下载PDF
协同过滤在中文维基百科类别推荐上的应用
4
作者 王静 何婷婷 衣马木艾山.阿布都力克木 《计算机应用》 CSCD 北大核心 2013年第3期838-840,844,共4页
针对传统人工编辑导致大量类别信息重复和不规范的问题,提出了应用协同过滤技术为中文维基百科文章自动推荐类别。利用中文维基百科中的四个重要语义特征即链入、链出、链入的类别和链出的类别来表示维基百科文章,得到与目标文章相似的... 针对传统人工编辑导致大量类别信息重复和不规范的问题,提出了应用协同过滤技术为中文维基百科文章自动推荐类别。利用中文维基百科中的四个重要语义特征即链入、链出、链入的类别和链出的类别来表示维基百科文章,得到与目标文章相似的前若干篇文章的所有类别后,通过查询返回的相似度值计算各个类别的权重,选择前面的若干个类别作为推荐结果返回给目标文章。实验结果表明了这四个语义特征能较好地表征一篇维基百科文章,同时也验证了协同过滤方法在中文维基百科自动推荐类别中的有效性。 展开更多
关键词 协同过滤 中文维基百科 类别推荐 语义特征
在线阅读 下载PDF
中文维基百科演化趋势与政策环境结构研究 被引量:9
5
作者 李小宇 罗志成 《情报杂志》 CSSCI 北大核心 2009年第2期160-166,共7页
以中文维基百科为研究对象,分析了其页面更新和用户行为的演化过程,得出用户与词条编辑增长的四个趋势。通过页面链接分析,揭示了中文维基百科政策环境的三层结构。结合对政策制定、施行和维护过程的定性分析,基于社会科学理论探讨了中... 以中文维基百科为研究对象,分析了其页面更新和用户行为的演化过程,得出用户与词条编辑增长的四个趋势。通过页面链接分析,揭示了中文维基百科政策环境的三层结构。结合对政策制定、施行和维护过程的定性分析,基于社会科学理论探讨了中文维基百科政策环境制定与运行原则。 展开更多
关键词 中文维基百科 演化 政策环境 链接分析
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部