-
题名基于概念的文本结构分析方法
被引量:36
- 1
-
-
作者
林鸿飞
战学刚
姚天顺
-
机构
东北大学计算机科学系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2000年第3期324-328,共5页
-
基金
国家自然科学基金!项目编号69675019
国家教委博士点基金
-
文摘
文本结构分析是文本处理领域中的重要内容,它可以有效地改进文本摘要、文本检索以及文本过滤的精度.文中简要描述了文本的物理结构和逻辑结构以及文本分析的背景,提出了文本结构分析中的层次分析方法.该方法保证了层次划分的有序性,可操作性强,便于解释,不依赖于具体领域.其基本思想是对于输入文本,首先识别出文本的物理结构;然后在概念映射、概念密度和概念消歧的基础上,将文本依据主题划分为若干层次;最终获得文本的逻辑结构.
-
关键词
文本结构分析
概念
信息处理
文本处理
计算机
-
Keywords
vector space model, text structure analysis, text hierarchical analysis, concept mapping, concept density, concept disambiguation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名文本结构分析与基于示例的文本过滤
被引量:23
- 2
-
-
作者
林鸿飞
战学刚
姚天顺
-
机构
东北大学计算机系
-
出处
《小型微型计算机系统》
EI
CSCD
北大核心
2000年第4期422-425,共4页
-
基金
自然科学基金资助项目
国家教委博士点基金
-
文摘
本文简要介绍了文本过滤的背景和发展 ,提出了基于示例的中文文本过滤模型 .其基本思想是首先对于用户提出的示例文本进行文本结构分析 ,采用本文提出的文本层次分析方法 ,提取文本特征 ,形成主题词表示的用户模版 (user profile) ,然后进行文本过滤 ,同时引进段落匹配机制 ,提高过滤效率 .通过用户反馈 。
-
关键词
文本过滤
文本结构分析
文本层次分析
信息过滤
-
Keywords
Text Filtering, Text Structure Analysis
Text Hierarchical Analysis
User Profiles Mechanism of Paragraph Matching
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名汉语文本形式结构分析及其标引算法
被引量:5
- 3
-
-
作者
单永明
-
机构
山西大学计算机科学系
-
出处
《中文信息学报》
CSCD
北大核心
2002年第2期14-19,26,共7页
-
文摘
本文从形式化的角度讨论了汉语文本的形式结构及有关的基本概念 ,给出了文本的标题、子标题、段落及其层次结构的一种划分与标记方法 ,提出了规范的与准规范的文本等概念 ,并以此为基础讨论了文本形式结构的标引问题 ,给出了两个标引算法。
-
关键词
中文信息处理
文本结构分析
标引树
自动标引算法
汉语文本分析
文本形式结构
-
Keywords
Chinese information processing
text structure analyses
indexing tree
automatic indexing algorithm
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
-
-
题名文本层次分析与文本浏览
被引量:12
- 4
-
-
作者
林鸿飞
战学刚
姚天顺
-
机构
东北大学计算机科学研究所
-
出处
《中文信息学报》
CSCD
北大核心
1999年第4期7-15,共9页
-
基金
国家自然科学基金
国家教委博士点基金
-
文摘
本文简要描述了文本的物理结构和逻辑结构以及相应的向量空间模型。研制了具有导航机制的文本浏览系统。提出了文本结构分析中的层次分析方法,它采用有序划分层次的方法。并在此基础上,给出了文本结构中各单元的标记信息,由此形成了文本的可视化表示。利用文本、层次、段落的超文本连接,根据浏览的需要,逐级展现文本细节,帮助用户有目的、有选择地浏览文本。最后给出评价的结果。
-
关键词
向量空间
文本结构分析
文本浏览
文本层次分析
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于用户本体模型的文本信息过滤方法研究
- 5
-
-
作者
刘中原
张博锋
潘建国
王洋
-
机构
上海大学计算机工程与科学学院
-
出处
《计算机应用与软件》
CSCD
2009年第5期43-45,84,共4页
-
基金
国家自然科学基金重大研究计划(90612010)
-
文摘
随着互联网信息的快速剧增,文本过滤技术成为互联网内容处理的关键技术,对海量信息处理具有很重要的意义。目前研究热点是基于语义的过滤方法,但是这些方法一般都需要大量规则和领域知识的支持,可用性不是很好。为了使机器更好地理解用户需求和文本内容,使过滤结果更能反映用户的真正需求,提高文本过滤的准确率和召回率,提出了基于用户本体模型UOM的文本信息过滤方法。该方法主要包括UOM构建、文本结构分析、文本概念提取和语义相关度计算等。基于UOM(User Ontology Model)的过滤方法,不仅可以表示复杂的用户需求,而且还避免了领域本体的构建,因而其有效性和实用性得到了很大的提高。通过在网络教学资源的智能按需服务系统中的实际运用,表明此方法能更有效地为用户提供过滤服务。
-
关键词
文本过滤
用户本体模型
虚关系
文本结构分析
-
Keywords
Text filtering User ontology model Virtual relationship Text structure analysis
-
分类号
TP393.098
[自动化与计算机技术—计算机应用技术]
TP391
[自动化与计算机技术—计算机应用技术]
-