期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于多层面文体特征的博客作者身份识别研究
被引量:
16
1
作者
祁瑞华
杨德礼
+1 位作者
郭旭
刘彩虹
《情报学报》
CSSCI
北大核心
2015年第6期628-634,共7页
传统的文体风格特征模型不适用于当前大量涌现的网络文本。本文针对以博客为代表的网络文本篇幅短小、表达方式丰富灵活的特点,以内容无关为原则,分别抽取字符特征、词汇特征、句法特征和文本布局等特征,建立了由词汇特征、浅层句法...
传统的文体风格特征模型不适用于当前大量涌现的网络文本。本文针对以博客为代表的网络文本篇幅短小、表达方式丰富灵活的特点,以内容无关为原则,分别抽取字符特征、词汇特征、句法特征和文本布局等特征,建立了由词汇特征、浅层句法特征、深层句法特征和结构特征组成的多层面文体风格特征模型,并选取朴素贝叶斯、决策树、序列最小优化支持向量机和大规模线性分类支持向量机算法在公开博客语料上进行对照实验。实验结果验证了各个层面特征在作者身份识别中的作用,表明了本文方法的准确性、通用性及其在短文本上的鲁棒性。
展开更多
关键词
文体特征
博客
作者身份
在线阅读
下载PDF
职称材料
题名
基于多层面文体特征的博客作者身份识别研究
被引量:
16
1
作者
祁瑞华
杨德礼
郭旭
刘彩虹
机构
大连理工大学管理与经济学部
大连外国语大学计算机教研部
出处
《情报学报》
CSSCI
北大核心
2015年第6期628-634,共7页
基金
教育部人文社会科学研究规划青年基金项目“基于多层面特征分析的在线信息作者身份识别研究”(项目编号:11YJCZH131)
辽宁省高等学校优秀人才支持计划(项目编号:WJQ2013017)
大连外国语大学科研项目“基于语言学特征的网络舆情信息挖掘”的研究成果之一
文摘
传统的文体风格特征模型不适用于当前大量涌现的网络文本。本文针对以博客为代表的网络文本篇幅短小、表达方式丰富灵活的特点,以内容无关为原则,分别抽取字符特征、词汇特征、句法特征和文本布局等特征,建立了由词汇特征、浅层句法特征、深层句法特征和结构特征组成的多层面文体风格特征模型,并选取朴素贝叶斯、决策树、序列最小优化支持向量机和大规模线性分类支持向量机算法在公开博客语料上进行对照实验。实验结果验证了各个层面特征在作者身份识别中的作用,表明了本文方法的准确性、通用性及其在短文本上的鲁棒性。
关键词
文体特征
博客
作者身份
Keywords
stylistic features
,
blogger
,
identification
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
G206 [文化科学—传播学]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于多层面文体特征的博客作者身份识别研究
祁瑞华
杨德礼
郭旭
刘彩虹
《情报学报》
CSSCI
北大核心
2015
16
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部