期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于“中文新闻信息分类与代码”文本分类
被引量:
5
1
作者
张志平
《太原理工大学学报》
CAS
北大核心
2010年第4期402-405,411,共5页
基于中文新闻信息分类体系,探索了中文新闻信息分类与代码的自动分类方法。根据中文新闻信息分类与代码的特点以及初始主题词满足的规则获得分类的初始主题词。
关键词
文本
分类
中文新闻信息分类与代码
新闻
文本
在线阅读
下载PDF
职称材料
基于机器学习的网络新闻评论情感分类研究
被引量:
28
2
作者
周杰
林琛
李弼程
《计算机应用》
CSCD
北大核心
2010年第4期1011-1014,共4页
首先对网络新闻评论数据的特点进行归纳总结,选取不同的特征集、特征维度、权重计算方法和词性等因素进行分类测试,并对实验结果进行分析比较。对比结果表明:情感词和论据词语搭配效果优于仅使用情感词作为评论特征;另外该类数据中特征...
首先对网络新闻评论数据的特点进行归纳总结,选取不同的特征集、特征维度、权重计算方法和词性等因素进行分类测试,并对实验结果进行分析比较。对比结果表明:情感词和论据词语搭配效果优于仅使用情感词作为评论特征;另外该类数据中特征维度对分类准确率的影响减小,且TF-IDF权重计算方法仍优于布尔型权重;在词性选择上,名词和动词词性比形容词和副词取得更好的分类效果。
展开更多
关键词
网络
新闻
评论
中文
信息
处理
情感
分类
机器学习
口语化评论
在线阅读
下载PDF
职称材料
基于事件抽取的网络新闻多文档自动摘要
被引量:
15
3
作者
韩永峰
许旭阳
+2 位作者
李弼程
朱武斌
陈刚
《中文信息学报》
CSCD
北大核心
2012年第1期58-66,共9页
目前,有代表性的自动摘要方法是根据文本片段进行聚类,较传统方法避免了信息冗余,但网络新闻文本中有些文本片段和主题无关,影响了聚类的效果,导致最终生成的摘要不够简洁。为此,该文引入事件抽取技术,提出了一种基于事件抽取的网络新...
目前,有代表性的自动摘要方法是根据文本片段进行聚类,较传统方法避免了信息冗余,但网络新闻文本中有些文本片段和主题无关,影响了聚类的效果,导致最终生成的摘要不够简洁。为此,该文引入事件抽取技术,提出了一种基于事件抽取的网络新闻多文档自动摘要方法。该方法首先通过二元分类器辨析出文本中的事件和非事件;然后通过聚类将文档原来以段落或句子为单位的物理划分转化为以事件为单位的内容逻辑划分,最后通过主旨事件抽取、排序及润色,生成摘要。实验结果表明,该方法是有效的,显著提高了生成摘要的质量。
展开更多
关键词
事件抽取
中文
信息
处理
分类
新闻
文档
聚类
自动摘要
在线阅读
下载PDF
职称材料
基于多词表的自动标引技术研究——新华社新闻稿自动标引的实验
被引量:
18
4
作者
查贵庭
侯汉清
《情报学报》
CSSCI
北大核心
2002年第3期273-277,共5页
避开汉语分词中的技术特点 ,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略 ,也是最为可行的方法。本文以新华社新闻稿中的题名和导语为对象 ,详细介绍了基于多词表自动标引技术中的词表构建、自...
避开汉语分词中的技术特点 ,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略 ,也是最为可行的方法。本文以新华社新闻稿中的题名和导语为对象 ,详细介绍了基于多词表自动标引技术中的词表构建、自动抽词、主题标引和自动分类等技术。并成功设计了新闻信息自动标引的实验系统 ,取得了较好的效果。
展开更多
关键词
新闻
标引
自动标引
自动
分类
词表技术
自然语言标引
词表构建
自动抽词
中文
信息
处理
在线阅读
下载PDF
职称材料
基于类别层次结构的多层文本分类样本扩展策略
被引量:
17
5
作者
李保利
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2015年第2期357-366,共10页
针对大规模多层文本分类训练样本获取代价高、类别分布不均衡等问题,提出并比较几种基于类别层次结构的大规模多层文本分类样本扩展策略,即利用类别层次体系中蕴含的类别名称、描述以及类别间的层次结构关系,从内涵和外延两方面入手构...
针对大规模多层文本分类训练样本获取代价高、类别分布不均衡等问题,提出并比较几种基于类别层次结构的大规模多层文本分类样本扩展策略,即利用类别层次体系中蕴含的类别名称、描述以及类别间的层次结构关系,从内涵和外延两方面入手构造或扩展类别训练样本。在首次大规模中文新闻信息多层分类评测数据集上,基于外延的局部样本扩展策略取得较好的性能。参测系统在第一级类别和第二级类别上宏平均F1分别为0.8413和0.7139,在10个参赛系统中位列第二。
展开更多
关键词
多层文本
分类
大规模
中文
新闻
分类
中文
新闻
信息
分类
类别层次体系
在线阅读
下载PDF
职称材料
题名
基于“中文新闻信息分类与代码”文本分类
被引量:
5
1
作者
张志平
机构
北京语言大学应用语言研究所
出处
《太原理工大学学报》
CAS
北大核心
2010年第4期402-405,411,共5页
基金
国家自然科学基金项目(60663008)
国家语言资源监测与研究中心平面媒体语言分中心项目:基于"中文新闻信息分类和代码"的分类语料库建设方法研究资助
文摘
基于中文新闻信息分类体系,探索了中文新闻信息分类与代码的自动分类方法。根据中文新闻信息分类与代码的特点以及初始主题词满足的规则获得分类的初始主题词。
关键词
文本
分类
中文新闻信息分类与代码
新闻
文本
Keywords
text classification
Chinese-language news classification and code
news texts
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于机器学习的网络新闻评论情感分类研究
被引量:
28
2
作者
周杰
林琛
李弼程
机构
信息工程大学信息工程学院
出处
《计算机应用》
CSCD
北大核心
2010年第4期1011-1014,共4页
基金
国家863计划项目(2007AA01Z439)
文摘
首先对网络新闻评论数据的特点进行归纳总结,选取不同的特征集、特征维度、权重计算方法和词性等因素进行分类测试,并对实验结果进行分析比较。对比结果表明:情感词和论据词语搭配效果优于仅使用情感词作为评论特征;另外该类数据中特征维度对分类准确率的影响减小,且TF-IDF权重计算方法仍优于布尔型权重;在词性选择上,名词和动词词性比形容词和副词取得更好的分类效果。
关键词
网络
新闻
评论
中文
信息
处理
情感
分类
机器学习
口语化评论
Keywords
netnews comments
Chinese information processing
sentiment analysis
machine learning
oral comments
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于事件抽取的网络新闻多文档自动摘要
被引量:
15
3
作者
韩永峰
许旭阳
李弼程
朱武斌
陈刚
机构
解放军信息工程大学信息工程学院
出处
《中文信息学报》
CSCD
北大核心
2012年第1期58-66,共9页
基金
国家社科重大基金项目(09&ZD014)
国家"863"计划资助项目(2007AA01Z439)
文摘
目前,有代表性的自动摘要方法是根据文本片段进行聚类,较传统方法避免了信息冗余,但网络新闻文本中有些文本片段和主题无关,影响了聚类的效果,导致最终生成的摘要不够简洁。为此,该文引入事件抽取技术,提出了一种基于事件抽取的网络新闻多文档自动摘要方法。该方法首先通过二元分类器辨析出文本中的事件和非事件;然后通过聚类将文档原来以段落或句子为单位的物理划分转化为以事件为单位的内容逻辑划分,最后通过主旨事件抽取、排序及润色,生成摘要。实验结果表明,该方法是有效的,显著提高了生成摘要的质量。
关键词
事件抽取
中文
信息
处理
分类
新闻
文档
聚类
自动摘要
Keywords
event extraction
Chinese information processing
classification
news text
clustering
automatic summarization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于多词表的自动标引技术研究——新华社新闻稿自动标引的实验
被引量:
18
4
作者
查贵庭
侯汉清
机构
南京农业大学信息管理系
出处
《情报学报》
CSSCI
北大核心
2002年第3期273-277,共5页
基金
国家社科基金资助
课题编号 :98BTQ0 0 7
文摘
避开汉语分词中的技术特点 ,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略 ,也是最为可行的方法。本文以新华社新闻稿中的题名和导语为对象 ,详细介绍了基于多词表自动标引技术中的词表构建、自动抽词、主题标引和自动分类等技术。并成功设计了新闻信息自动标引的实验系统 ,取得了较好的效果。
关键词
新闻
标引
自动标引
自动
分类
词表技术
自然语言标引
词表构建
自动抽词
中文
信息
处理
Keywords
news database
automatic indexing,automatic classifying,word-extracting,vocabulary construction.
分类号
G254.3 [文化科学—图书馆学]
在线阅读
下载PDF
职称材料
题名
基于类别层次结构的多层文本分类样本扩展策略
被引量:
17
5
作者
李保利
机构
河南工业大学计算机科学系
出处
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2015年第2期357-366,共10页
基金
河南省基础与前沿技术研究项目(112300410007)
河南工业大学高层次人才基金(2012BS027)资助
文摘
针对大规模多层文本分类训练样本获取代价高、类别分布不均衡等问题,提出并比较几种基于类别层次结构的大规模多层文本分类样本扩展策略,即利用类别层次体系中蕴含的类别名称、描述以及类别间的层次结构关系,从内涵和外延两方面入手构造或扩展类别训练样本。在首次大规模中文新闻信息多层分类评测数据集上,基于外延的局部样本扩展策略取得较好的性能。参测系统在第一级类别和第二级类别上宏平均F1分别为0.8413和0.7139,在10个参赛系统中位列第二。
关键词
多层文本
分类
大规模
中文
新闻
分类
中文
新闻
信息
分类
类别层次体系
Keywords
hierarchical text classification
large scale Chinese news categorization
classification of news in Chinese
class hierarchy
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于“中文新闻信息分类与代码”文本分类
张志平
《太原理工大学学报》
CAS
北大核心
2010
5
在线阅读
下载PDF
职称材料
2
基于机器学习的网络新闻评论情感分类研究
周杰
林琛
李弼程
《计算机应用》
CSCD
北大核心
2010
28
在线阅读
下载PDF
职称材料
3
基于事件抽取的网络新闻多文档自动摘要
韩永峰
许旭阳
李弼程
朱武斌
陈刚
《中文信息学报》
CSCD
北大核心
2012
15
在线阅读
下载PDF
职称材料
4
基于多词表的自动标引技术研究——新华社新闻稿自动标引的实验
查贵庭
侯汉清
《情报学报》
CSSCI
北大核心
2002
18
在线阅读
下载PDF
职称材料
5
基于类别层次结构的多层文本分类样本扩展策略
李保利
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2015
17
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部