期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
中文信息处理中自动分词技术的研究与展望 被引量:68
1
作者 刘迁 贾惠波 《计算机工程与应用》 CSCD 北大核心 2006年第3期175-177,182,共4页
汉语自动分词是中文信息处理的关键技术,已经成为中文信息处理发展的瓶颈。文章介绍了当前自动分词技术的研究状况,对各种分词算法进行了介绍,并对各种算法进行了比较和讨论。最后,对汉语自动分词技术的发展进行了展望。
关键词 汉语自动分词 中文信息处理 分词技术 分词算法
在线阅读 下载PDF
结合分词技术与语句相似度的主观题自动判分算法 被引量:9
2
作者 李玉红 柴林燕 张琪 《计算机工程与设计》 CSCD 北大核心 2010年第11期2663-2666,共4页
针对网络考试系统中主观题自动评分面临的困难和问题,提出一种基于中文分词技术结合语句相似度的主观题自动判分算法。该算法利用字典与统计相结合技术将语句切分成具有独立意义的单词,通过计算词与词之间的相似度,并结合词形、词序和... 针对网络考试系统中主观题自动评分面临的困难和问题,提出一种基于中文分词技术结合语句相似度的主观题自动判分算法。该算法利用字典与统计相结合技术将语句切分成具有独立意义的单词,通过计算词与词之间的相似度,并结合词形、词序和语句长度等多层次相似度计算得到整句的相似度。利用语句相似度计算结合改进关键字匹配算法得到最终分值。经课题中多媒体简答题的测试,结果表明了该算法的有效性。 展开更多
关键词 分词技术 语句相似度 主观题 自动判分 关键字匹配
在线阅读 下载PDF
中文信息检索引擎中的分词与检索技术 被引量:48
3
作者 吴栋 滕育平 《计算机应用》 CSCD 北大核心 2004年第7期128-131,共4页
文中论述了在开发中文信息检索系统中所涉及到的两项关键技术 ,即中文分词技术和检索技术。针对中文分词技术 ,介绍了一种改进的正向最大匹配切分算法 ,以及为消除歧义引入的校正策略 ,并在此基础上结合统计方法处理未登录词。针对检索... 文中论述了在开发中文信息检索系统中所涉及到的两项关键技术 ,即中文分词技术和检索技术。针对中文分词技术 ,介绍了一种改进的正向最大匹配切分算法 ,以及为消除歧义引入的校正策略 ,并在此基础上结合统计方法处理未登录词。针对检索技术 ,综述了几种最常用的检索模型的原理 ,并对每种模型的优缺点进行了简要分析。最后对给出的分词算法进行了测试 。 展开更多
关键词 信息检索 搜索引擎 分词技术 检索技术
在线阅读 下载PDF
开发中文搜索引擎汉语处理的关键技术 被引量:24
4
作者 严威 赵政 《计算机工程》 CAS CSCD 北大核心 1999年第6期5-6,8,共3页
论述了开发中文搜索引擎在语言方面的两项关键技术,即中文分词技术和汉化问题,介绍了几种解决方案。并在结尾展望了中文搜索引擎的未来。
关键词 中文探索引擎 分词技术 汉语处理 中文信息处理
在线阅读 下载PDF
基于全文搜索的中文搜索引擎设计技术 被引量:10
5
作者 陈燕娜 邵志清 《计算机工程与应用》 CSCD 北大核心 2002年第17期196-198,共3页
随着Internet应用的逐步普及,WWW已成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。但由于中文信息处理的复杂性和特殊性,中文搜索引擎的功能仍不够完善。该文提出了一个基于全文搜索的中文搜索引擎的实现方案,并对... 随着Internet应用的逐步普及,WWW已成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。但由于中文信息处理的复杂性和特殊性,中文搜索引擎的功能仍不够完善。该文提出了一个基于全文搜索的中文搜索引擎的实现方案,并对信息处理中的关键技术进行了探讨。 展开更多
关键词 全文搜索 中文搜索引擎设计 技术 WWW 中文分词技术 文档相关性 Internet
在线阅读 下载PDF
自然语言处理技术的探讨 被引量:1
6
作者 王新梅 《南方农机》 2017年第24期135-135,共1页
首先阐述自然语言处理的概念和意义,探讨中文信息处理的概况与发展,最后总结自动分词是自然语言处理的基础。
关键词 语言处理 自动分词技术 信息技术
在线阅读 下载PDF
基于历史事故案例的瓦斯爆炸情景要素提取及情景构建方法研究
7
作者 国汉君 赵伟 +4 位作者 宋亚楠 郭小芳 赵志虎 周爱桃 王凯 《矿业安全与环保》 CAS 北大核心 2024年第3期43-49,共7页
为深入探究煤矿瓦斯爆炸事故发展规律,提出一种基于中文分词技术对瓦斯爆炸事故情景要素进行分析和提取的方法。通过煤矿安全网等途径搜集统计了1978—2020年间的733起瓦斯爆炸事故报告,在此基础上进行数据预处理,剔除不完整的事故报告... 为深入探究煤矿瓦斯爆炸事故发展规律,提出一种基于中文分词技术对瓦斯爆炸事故情景要素进行分析和提取的方法。通过煤矿安全网等途径搜集统计了1978—2020年间的733起瓦斯爆炸事故报告,在此基础上进行数据预处理,剔除不完整的事故报告,最终选取255起瓦斯爆炸事故报告进行要素分析与提取;将事故等级、事故经过、事故原因等内容进行整理储存,形成待挖掘文本语料库;基于Jieba分词算法提取瓦斯爆炸事故情景关键词,并采用TF-IDF算法进行权重计算,将情景划分为事故体、致灾体、承灾体、抗灾体4个维度和24个要素,为后续瓦斯爆炸事故的情景表示和事故未来的可能性组合提供了参考依据。 展开更多
关键词 安全工程 瓦斯爆炸 情景分析 中文分词 Jieba分词技术
在线阅读 下载PDF
搜索引擎用户接口设计 被引量:2
8
作者 何友全 徐小乐 +2 位作者 徐澄 栾红玉 唐华姣 《重庆理工大学学报(自然科学)》 CAS 2010年第9期63-68,共6页
介绍了搜索引擎中用户界面的实现技术,包括抓取网页、索引和检索。在此基础上,应用Ajax技术实现用户接口的设计,利用Lucene技术,在建立好的索引库中检索出用户感兴趣的网页,并给出设计过程中部分关键代码。
关键词 搜索引擎 中文分词技术 LUCENE 用户界面 AJAX技术
在线阅读 下载PDF
军用词典库的设计 被引量:2
9
作者 姜文志 蒋伟俊 +1 位作者 张金乙 王迪 《兵工自动化》 2007年第8期50-51,65,共3页
军用词典库的设计,关键是对装备有词类进行"类分"和"组分"。其数据结构由常用的位置代码改为父级代码,同时记录本层次的代码。词处理模块选用中科院的多层隐马模型分词系统ICTCLAS及哈工大的统计分词系统HIT_IRLab... 军用词典库的设计,关键是对装备有词类进行"类分"和"组分"。其数据结构由常用的位置代码改为父级代码,同时记录本层次的代码。词处理模块选用中科院的多层隐马模型分词系统ICTCLAS及哈工大的统计分词系统HIT_IRLab,并设计判决器及其判决规则。理论值和实际统计所得数据仿真比较表明,该词典库有利于提高装备信息管理的自动化水平。 展开更多
关键词 军用词典库 词类 数据结构 分词技术 判决规则
在线阅读 下载PDF
基于自动文本分类的关键词抽取算法 被引量:18
10
作者 张虹 《计算机工程》 CAS CSCD 北大核心 2009年第12期145-147,共3页
分析现有几种中文分词方法,提出一种关键词抽取算法。以词语的权重公式为中心,利用遗传算法训练、优化公式中的参数,得到一组适合中文文本的参数,提高文章子主题划分的精度。实验分析表明,该算法能将抽取系统中的命名实体有效地切分出来... 分析现有几种中文分词方法,提出一种关键词抽取算法。以词语的权重公式为中心,利用遗传算法训练、优化公式中的参数,得到一组适合中文文本的参数,提高文章子主题划分的精度。实验分析表明,该算法能将抽取系统中的命名实体有效地切分出来,准确完成抽取关键词的工作,并具有一定的通用性。 展开更多
关键词 文本分类 分词技术 关键词抽取 遗传算法
在线阅读 下载PDF
基于中文题名的计算机辅助标引 被引量:2
11
作者 陈雷霆 张宁 《计算机应用》 CSCD 1999年第6期9-11,共3页
本文阐述了基于中文文献题名的计算机辅助标引系统的组成结构,并讨论了其中的一些关键技术问题。文章从系统结构设计方面,对该系统的建表模块、目录模块、分词标引模块、校对模块、选号打印模块和系统管理模块进行了讨论,并着重讨论... 本文阐述了基于中文文献题名的计算机辅助标引系统的组成结构,并讨论了其中的一些关键技术问题。文章从系统结构设计方面,对该系统的建表模块、目录模块、分词标引模块、校对模块、选号打印模块和系统管理模块进行了讨论,并着重讨论了分词标引技术。 展开更多
关键词 计算机辅助标引 分词技术 数据库 中文题名
在线阅读 下载PDF
搜索引擎的设计剖析 被引量:15
12
作者 张汛涞 《计算机工程与科学》 CSCD 2002年第4期18-20,共3页
本文介绍了搜索引擎的四个组成部分 :搜索器、索引器、检索器和用户接口 ,并分析其工作原理 ;给出搜索引擎中包含的关键技术算法 :分词技术、多路归并算法和大文件处理技术 ;最后结合当前最新的几种搜索引擎 ,探讨搜索引擎在多语言处理... 本文介绍了搜索引擎的四个组成部分 :搜索器、索引器、检索器和用户接口 ,并分析其工作原理 ;给出搜索引擎中包含的关键技术算法 :分词技术、多路归并算法和大文件处理技术 ;最后结合当前最新的几种搜索引擎 ,探讨搜索引擎在多语言处理、专业化和有效性等方面的技术改进目标。 展开更多
关键词 搜索引擎 设计 搜索器 索引器 检索器 分词技术 互联网 信息检索
在线阅读 下载PDF
基于改进型最大匹配法的教学资源自然语义查询 被引量:1
13
作者 曾立胜 刘志勤 《计算机工程与设计》 CSCD 北大核心 2008年第6期1559-1561,1564,共4页
中文智能信息检索中的关键是自然语言处理技术,汉语自动分词技术是中文自然语言处理的基础。基于机械匹配的分词方法简洁、实用,但该方法切分精度不高且无法有效克服切分歧义。针对机械匹配最大匹配算法的应用进行了改进,并将相似串应... 中文智能信息检索中的关键是自然语言处理技术,汉语自动分词技术是中文自然语言处理的基础。基于机械匹配的分词方法简洁、实用,但该方法切分精度不高且无法有效克服切分歧义。针对机械匹配最大匹配算法的应用进行了改进,并将相似串应用于教学资源自然语义查询。 展开更多
关键词 汉语分词技术 相似串 自然查询 最大匹配算法 教学资源 信息检索
在线阅读 下载PDF
改进型答疑系统的设计与实现
14
作者 邓灵丽 覃聪 《现代制造工程》 CSCD 2005年第11期130-132,共3页
针对目前自动答疑系统只是一个简单的数据库检索系统,从分词、数据库的构建和查询扩展等,对现有答疑系统提出一个改进的模型,较好地解决了查询的快速定位,具有一定的智能化和个性化,有良好的可扩性与推广性。
关键词 远程教育 自动答疑系统 分词技术 模糊匹配 扩展查询
在线阅读 下载PDF
基于大数据分析挖掘的地质文献推荐方法研究 被引量:10
15
作者 张戈一 胡博然 +2 位作者 常力恒 朱月琴 吕鹏飞 《中国矿业》 北大核心 2017年第9期92-97,共6页
地质图书馆书籍多,数据资料庞大,然而却存在数据资料增长过快和难以发现读者兴趣点的问题。实现高效的图书馆借阅数据挖掘分析与推荐,是提高效率的重要手段。为此本文提出了基于大数据地质文献分析挖掘平台,包括聚类分析,中文分词,推荐... 地质图书馆书籍多,数据资料庞大,然而却存在数据资料增长过快和难以发现读者兴趣点的问题。实现高效的图书馆借阅数据挖掘分析与推荐,是提高效率的重要手段。为此本文提出了基于大数据地质文献分析挖掘平台,包括聚类分析,中文分词,推荐系统,关联分析功能,再通过Hadoop集群多节点进行推荐,从而提高了工作的效率。 展开更多
关键词 大数据技术 分词技术 推荐系统 并行计算
在线阅读 下载PDF
基于知识图谱的低压配电网拓扑结构辨识方法 被引量:69
16
作者 高泽璞 赵云 +3 位作者 余伊兰 罗永建 徐紫薇 张莲梅 《电力系统保护与控制》 EI CSCD 北大核心 2020年第2期34-43,共10页
低压配电网中正确的拓扑关系是至关重要的。低压配电网实际拓扑结构因运维需要变动频繁且巨大,配电网信息系统中的数据更新不及时、流通性低以及质量差等不能正确反映低压配电网的实际拓扑结构,有必要进行拓扑辨识。知识图谱技术可以清... 低压配电网中正确的拓扑关系是至关重要的。低压配电网实际拓扑结构因运维需要变动频繁且巨大,配电网信息系统中的数据更新不及时、流通性低以及质量差等不能正确反映低压配电网的实际拓扑结构,有必要进行拓扑辨识。知识图谱技术可以清晰地反映出数据间的现有关系,推理挖掘出隐藏知识,适用于低压配电网的拓扑辨识。因此应用知识图谱技术于拓扑辨识中,首先分析知识图谱构建方法,运用知识图谱技术,对多个低压配电网信息系统中的数据进行整合,推理出缺失数据,挖掘出各数据之间的关系。然后构建出低压配电网拓扑结构的知识图谱。最后结合《低压配电网基建工程典型设计规范》以及语义分词技术,对低压配电网信息系统中的户变关系进行辨识。算例实验效果良好,表明所提出的辨识方法具有理论价值和实际应用价值。 展开更多
关键词 知识图谱 语义分词技术 知识推理 户变关系 拓扑辨识
在线阅读 下载PDF
基于网络微博的地震宏观异常信息提取研究——以芦山地震为例 被引量:1
17
作者 张群燕 黄健熙 +2 位作者 张晓东 苏晓慧 张旭 《震灾防御技术》 CSCD 2013年第4期459-467,共9页
微博平台有用户群大、公众参与性强、实时性等优点,同时微博平台信息又具有信息真伪难辨、地址信息模糊等缺点。本文以芦山地震为例,针对微博内容如何提取和地址如何定位两方面进行了分析研究,对于如何在网络微博平台中及时的提取地震... 微博平台有用户群大、公众参与性强、实时性等优点,同时微博平台信息又具有信息真伪难辨、地址信息模糊等缺点。本文以芦山地震为例,针对微博内容如何提取和地址如何定位两方面进行了分析研究,对于如何在网络微博平台中及时的提取地震宏观异常信息,提出了聚焦爬虫技术,并对微博地址进行了分类,同时将正向最大匹配和特征词地址分词的中文地址匹配模型应用于地址信息的提取和地址匹配中;最后将不同的地址类别定位为不同的行政级别,使微博平台和微博信息得到了充分的利用。通过研究认识到微博信息在反应震前异常的发生趋势方面有一定的参考价值(动物异常和气象异常所占比例较大),是不能被忽略的;地址方面可以看出异常随着时间的逼近有向震中聚集的趋势,有一定的参考价值。 展开更多
关键词 微博平台 聚焦爬虫 地震宏观异常 分词技术 地址匹配
在线阅读 下载PDF
《计算机工程与设计》1992年总目录
18
《计算机工程与设计》 CSCD 北大核心 1992年第6期65-66,共2页
关键词 夏鹏 UNIX 实时调度算法 面向对象的分析 数据库语言 计算机动画 数据库结构 驱动程序设计 分词技术 管理信息系统
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部