期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于同义词词林的中文文本主题词提取 被引量:11
1
作者 程涛 施水才 +1 位作者 王霞 吕学强 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第2期145-148,共4页
中文文本主题词的提取可以浓缩一篇文章,可以提炼一个中文网页,还可以帮助实现网上广告与网页的精确匹配。提出了一种基于同义词词林的中文文本主题词提取方法,不仅考虑了传统的影响主题词语权重的因素,还考虑到了同义词、相关词以及下... 中文文本主题词的提取可以浓缩一篇文章,可以提炼一个中文网页,还可以帮助实现网上广告与网页的精确匹配。提出了一种基于同义词词林的中文文本主题词提取方法,不仅考虑了传统的影响主题词语权重的因素,还考虑到了同义词、相关词以及下位词的出现对于词语权重的影响。实验表明。 展开更多
关键词 主题词提取 同义词词林 权值 同义词
在线阅读 下载PDF
基于网页内容的广告推介研究 被引量:1
2
作者 施水才 程涛 +1 位作者 王霞 吕学强 《中文信息学报》 CSCD 北大核心 2007年第4期42-47,54,共7页
网页与广告关联是基于网页内容的网络广告的核心技术,本文提出了一种基于语义的、以实现网页和广告精确匹配为目标的广告推介方法。首先对一个Web网页进行主题信息提取,获得网页的主题词;然后再对这些主题词语作同义词扩展、上位词扩展... 网页与广告关联是基于网页内容的网络广告的核心技术,本文提出了一种基于语义的、以实现网页和广告精确匹配为目标的广告推介方法。首先对一个Web网页进行主题信息提取,获得网页的主题词;然后再对这些主题词语作同义词扩展、上位词扩展、下位词扩展和相关词扩展,最后从待匹配的广告中选择匹配度最高的广告。对该方法进行了模型系统实现并进行了测试运行,结果表明该方法是行之有效的。 展开更多
关键词 计算机应用 中文信息处理 同义词词林 主题词 网页数据抽取 关联度
在线阅读 下载PDF
基于新闻语料的流行语量化分析
3
作者 施水才 吕学强 +2 位作者 俞鸿魁 王霞 李渝勤 《现代电子技术》 2007年第2期154-156,共3页
通过对1947~2002年,共计56年的《人民日报》新闻语料进行统计分析,按照流行语的时间属性,将流行语分为新流行语、持续流行语、历史流行语以度周期流行语,分析了新词语、流行语与高频有意义串的异同,列举《人民日报》中的实例,定... 通过对1947~2002年,共计56年的《人民日报》新闻语料进行统计分析,按照流行语的时间属性,将流行语分为新流行语、持续流行语、历史流行语以度周期流行语,分析了新词语、流行语与高频有意义串的异同,列举《人民日报》中的实例,定性定量地分析了流行语的特点。 展开更多
关键词 流行语 新词 统计 新闻语料
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部