期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于词频逆文档频统计的词汇时间分布层次 被引量:1
1
作者 饶高琦 李宇明 《中文信息学报》 CSCD 北大核心 2019年第11期31-38,共8页
汉语演变过程中,词语使用受时间影响的程度差异很大。这体现为词汇时间分布的不同。该文基于70年跨度历时语料库,使用TF-IDF方法对词汇的时间分布进行了统计,并尝试对词汇系统的时间分布层次进行划分。通过对历时文本分类性能、词类分... 汉语演变过程中,词语使用受时间影响的程度差异很大。这体现为词汇时间分布的不同。该文基于70年跨度历时语料库,使用TF-IDF方法对词汇的时间分布进行了统计,并尝试对词汇系统的时间分布层次进行划分。通过对历时文本分类性能、词类分布、词长分布、覆盖率和词语生命力五方面的考察和分析,建立了由基干层、过渡层、时间敏感层(时敏层)和逸散层构成的词汇时间分布四分层体系。 展开更多
关键词 词频逆文档频 时间分布 历时 分层 汉语史
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部