期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
一种模仿人类的自动文本分类算法 被引量:5
1
作者 王树梅 戴保存 +1 位作者 黄河燕 陈肇雄 《计算机科学》 CSCD 北大核心 2003年第3期44-45,53,共3页
An algorithm of text classification is given that imitates human's in this paper. On one hand, the algorithmenhances weight of theme when feature vector is processed, because of the assumption that the title of a ... An algorithm of text classification is given that imitates human's in this paper. On one hand, the algorithmenhances weight of theme when feature vector is processed, because of the assumption that the title of a document canproject its content. On the other hand,a weight parameter o vector is designed to simulate human's skimming andskipping behavior for calculating method of a document cluster center, and a weight of the feature that there are morepositive examples than negative ones is enhanced . The experiment shows that the algorithm greatly improves the per-formance of a text classification system. 展开更多
关键词 自动文本分类算法 文本信息处理 文档分类 自然语言处理 INTERNET
在线阅读 下载PDF
一种人机结合的文本特征词集生成方法
2
作者 雷育生 甘仞初 杜顶 《情报学报》 CSSCI 北大核心 2005年第4期445-448,共4页
运用复杂系统理论分析了向量空间模型(VSM)法进行大规模文本信息处理过程中自动生成特征词集方法的局限性.指出人机结合、定性定量综合集成的方法才是当前解决特征词集生成问题的根本途径.给出了一种人机结合的文本特征词集生成方法,并... 运用复杂系统理论分析了向量空间模型(VSM)法进行大规模文本信息处理过程中自动生成特征词集方法的局限性.指出人机结合、定性定量综合集成的方法才是当前解决特征词集生成问题的根本途径.给出了一种人机结合的文本特征词集生成方法,并进行了实例验证. 展开更多
关键词 文本信息处理 特征抽取 定性定量综合集成 人机结合 生成方法 文本特征 词集 向量空间模型 复杂系统理论 自动生成
在线阅读 下载PDF
基于复杂句式短文本情感分类研究 被引量:2
3
作者 李毅捷 段利国 李爱萍 《现代电子技术》 北大核心 2018年第22期182-186,共5页
目前,网络文本中主观内容的情感倾向性识别成为文本信息处理的研究热点。针对汉语中复杂句式的结构特点以及对多种复杂句式的有效分析,基于word2vec进行情感词典的扩建,将扩充后的情感词典、关联词表、否定词表进行特征提取,得到有效的... 目前,网络文本中主观内容的情感倾向性识别成为文本信息处理的研究热点。针对汉语中复杂句式的结构特点以及对多种复杂句式的有效分析,基于word2vec进行情感词典的扩建,将扩充后的情感词典、关联词表、否定词表进行特征提取,得到有效的特征词序列,构建新的复杂句式模型并结合SVM进行训练和预测,完成复杂句式情感分类。实验结果表明,提出的复杂句式情感分类模型在处理精度方面比传统的句子级情感分类方法有了明显的提高,获得良好的情感分析效果。 展开更多
关键词 文本信息处理 情感分析 复杂句式 word2vec 情感分类模型 SVM
在线阅读 下载PDF
K特征线法在文本分类上的应用 被引量:1
4
作者 杨昂 《计算机科学》 CSCD 北大核心 2002年第1期47-48,56,共3页
1.引言随着Internet的迅速发展,网上信息成几何级数不断增长,如何从中找出人们需要的文献是信息检索要处理的重要问题.
关键词 文本信息处理 K特征线法 机器学习 模式识别 文本分类
在线阅读 下载PDF
无词典高频字串快速提取和统计算法研究 被引量:36
5
作者 韩客松 王永成 陈桂林 《中文信息学报》 CSCD 北大核心 2001年第2期23-30,共8页
本文提出了一种快速的高频字串提取和统计方法。使用Hash技术 ,该方法不需要词典 ,也不需要语料库的训练 ,不进行分词操作 ,依靠统计信息 ,提取高频字串。用语言学知识进行前缀后缀等处理后 ,得到的高频字串可以作为未登录词处理、歧义... 本文提出了一种快速的高频字串提取和统计方法。使用Hash技术 ,该方法不需要词典 ,也不需要语料库的训练 ,不进行分词操作 ,依靠统计信息 ,提取高频字串。用语言学知识进行前缀后缀等处理后 ,得到的高频字串可以作为未登录词处理、歧义消解和加权处理等的辅助信息。实验显示了该方法速度较快且不受文章本身的限制 。 展开更多
关键词 Hash技术 高频字串 统计 算法 提取 文本信息处理 语料库 前缀处理 后缀处理
在线阅读 下载PDF
命名实体识别研究 被引量:67
6
作者 张晓艳 王挺 陈火旺 《计算机科学》 CSCD 北大核心 2005年第4期44-48,共5页
命名实体识别是文本信息处理的重要基础,已经逐步成为自然语言处理的一项关键技术。其基于规则、统计、机器学习的研究方法及成果,都推动了自然语言处理研究的发展,促进了自然语言研究与应用的紧密结合。本文回顾了命名实体识别技术的... 命名实体识别是文本信息处理的重要基础,已经逐步成为自然语言处理的一项关键技术。其基于规则、统计、机器学习的研究方法及成果,都推动了自然语言处理研究的发展,促进了自然语言研究与应用的紧密结合。本文回顾了命名实体识别技术的发展过程,分析了主要的方法和技术,并展望了未来的发展趋势。 展开更多
关键词 命名实体 自然语言处理 文本信息处理 关键技术 基于规则 研究方法 机器学习 紧密结合 发展过程 识别技术 发展趋势
在线阅读 下载PDF
基于改进线图分析算法的浅层汉语句法分析器的设计与实现 被引量:4
7
作者 吴江宁 朱国华 《计算机应用研究》 CSCD 北大核心 2007年第9期164-167,共4页
针对传统的汉语句法分析算法进行改进,采用了自底向上与自顶向下相结合的线图分析方法,分析、设计和实现了一个汉语句法分析原型系统。该系统实现了基于最大词长匹配算法的分词模块、基于统计方法的词性标注模块和基于改进的线图分析算... 针对传统的汉语句法分析算法进行改进,采用了自底向上与自顶向下相结合的线图分析方法,分析、设计和实现了一个汉语句法分析原型系统。该系统实现了基于最大词长匹配算法的分词模块、基于统计方法的词性标注模块和基于改进的线图分析算法的句法分析模块。最后对系统进行小规模中文文本试验测试,测试结果表明利用改进的分析算法,使得句法分析效率和分析结果的准确率均有一定程度的提高。 展开更多
关键词 文本信息处理 汉语句法分析 线图分析法 句法解析器 句法结构
在线阅读 下载PDF
多篇摘要的自动生成算法 被引量:1
8
作者 傅伟鹏 何清 +1 位作者 贸自艳 史忠植 《计算机科学》 CSCD 北大核心 2002年第5期85-88,共4页
1.引言 Internet的迅猛的发展,使人们能方便快捷地获取众多的信息和服务.但是,面对Internet上浩瀚纷繁的信息海洋,人们常常会陷入窘迫的境地:一方面收到太多的信息无从选择和消化,淹没在繁杂的信息中;另一方面是信息的迷失,人们难于找... 1.引言 Internet的迅猛的发展,使人们能方便快捷地获取众多的信息和服务.但是,面对Internet上浩瀚纷繁的信息海洋,人们常常会陷入窘迫的境地:一方面收到太多的信息无从选择和消化,淹没在繁杂的信息中;另一方面是信息的迷失,人们难于找到真正所需的信息.因此,信息社会对能够有效浓缩文本信息的网络自动文摘有着迫切的要求. 展开更多
关键词 自然语言理解 自动文摘 文本信息处理 摘要自动生成算法 机械文摘
在线阅读 下载PDF
学生阅读理解过程的多维分析 被引量:2
9
作者 王洋 陈旭远 《教育理论与实践》 CSSCI 北大核心 2018年第29期54-56,共3页
学生的阅读过程是一个复杂的理解过程,它是教师、学生、作者、文本等多方面因素相互作用的结果。学生的阅读理解过程既是学生对文本信息进行处理的过程,这一过程包括字词的辨识、提取文本信息、组织文本信息及对文本信息做出自己的解释... 学生的阅读过程是一个复杂的理解过程,它是教师、学生、作者、文本等多方面因素相互作用的结果。学生的阅读理解过程既是学生对文本信息进行处理的过程,这一过程包括字词的辨识、提取文本信息、组织文本信息及对文本信息做出自己的解释四个阶段。同时,将学生的阅读理解过程放到课堂教学情境中去考察,学生的阅读理解过程也是一个师生互动、生生互动的过程。从不同的维度对学生阅读理解过程进行分析,使人们对学生阅读理解过程有了新的理解。 展开更多
关键词 学生 教师 阅读理解过程 文本信息处理 学生自身经验改造 师生互动 生生互动
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部