期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于自然标注信息和隐含主题模型的无监督文本特征抽取 被引量:4
1
作者 饶高琦 于东 荀恩东 《中文信息学报》 CSCD 北大核心 2015年第6期141-149,共9页
术语和惯用短语可以体现文本特征。无监督的抽取特征词语对诸多自然语言处理工作起到支持作用。该文提出了"聚类-验证"过程,使用主题模型对文本中的字符进行聚类,并采用自然标注信息对提取出的字符串进行验证和过滤,从而实现... 术语和惯用短语可以体现文本特征。无监督的抽取特征词语对诸多自然语言处理工作起到支持作用。该文提出了"聚类-验证"过程,使用主题模型对文本中的字符进行聚类,并采用自然标注信息对提取出的字符串进行验证和过滤,从而实现了从未分词领域语料中无监督获得词语表的方法。通过优化和过滤,我们可以进一步获得了富含有术语信息和特征短语的高置信度特征词表。在对计算机科学等六类不同领域语料的实验中,该方法抽取的特征词表具有较好的文体区分度和领域区分度。 展开更多
关键词 自然标注信息 自然语块 隐含主题模型 领域特征 文体特征
在线阅读 下载PDF
“别解”造词理据及规范问题分析 被引量:2
2
作者 刘楚群 《江西师范大学学报(哲学社会科学版)》 2013年第6期52-56,共5页
别解造词是近年来新出现的一种修辞造词的方式。其存在并流行的理据主要涉及两方面:语言本身内在的理据、社会文化方面的外在理据。语言理据包括语义别解、语法别解、语音别解、字形别解,其社会文化理据包括一定的逻辑基础、"陌生... 别解造词是近年来新出现的一种修辞造词的方式。其存在并流行的理据主要涉及两方面:语言本身内在的理据、社会文化方面的外在理据。语言理据包括语义别解、语法别解、语音别解、字形别解,其社会文化理据包括一定的逻辑基础、"陌生化"的美学特征、凸显个性的时代文化以及网络媒介的助推。在新词语规范中要注意避免别解造词的低俗化和随意性。 展开更多
关键词 新词语 别解 修辞造词 词语规范
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部