期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
18
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
中文信息处理中自动分词技术的研究与展望
被引量:
68
1
作者
刘迁
贾惠波
《计算机工程与应用》
CSCD
北大核心
2006年第3期175-177,182,共4页
汉语自动分词是中文信息处理的关键技术,已经成为中文信息处理发展的瓶颈。文章介绍了当前自动分词技术的研究状况,对各种分词算法进行了介绍,并对各种算法进行了比较和讨论。最后,对汉语自动分词技术的发展进行了展望。
关键词
汉语自动
分词
中文信息处理
分词技术
分词
算法
在线阅读
下载PDF
职称材料
结合分词技术与语句相似度的主观题自动判分算法
被引量:
9
2
作者
李玉红
柴林燕
张琪
《计算机工程与设计》
CSCD
北大核心
2010年第11期2663-2666,共4页
针对网络考试系统中主观题自动评分面临的困难和问题,提出一种基于中文分词技术结合语句相似度的主观题自动判分算法。该算法利用字典与统计相结合技术将语句切分成具有独立意义的单词,通过计算词与词之间的相似度,并结合词形、词序和...
针对网络考试系统中主观题自动评分面临的困难和问题,提出一种基于中文分词技术结合语句相似度的主观题自动判分算法。该算法利用字典与统计相结合技术将语句切分成具有独立意义的单词,通过计算词与词之间的相似度,并结合词形、词序和语句长度等多层次相似度计算得到整句的相似度。利用语句相似度计算结合改进关键字匹配算法得到最终分值。经课题中多媒体简答题的测试,结果表明了该算法的有效性。
展开更多
关键词
分词技术
语句相似度
主观题
自动判分
关键字匹配
在线阅读
下载PDF
职称材料
中文信息检索引擎中的分词与检索技术
被引量:
48
3
作者
吴栋
滕育平
《计算机应用》
CSCD
北大核心
2004年第7期128-131,共4页
文中论述了在开发中文信息检索系统中所涉及到的两项关键技术 ,即中文分词技术和检索技术。针对中文分词技术 ,介绍了一种改进的正向最大匹配切分算法 ,以及为消除歧义引入的校正策略 ,并在此基础上结合统计方法处理未登录词。针对检索...
文中论述了在开发中文信息检索系统中所涉及到的两项关键技术 ,即中文分词技术和检索技术。针对中文分词技术 ,介绍了一种改进的正向最大匹配切分算法 ,以及为消除歧义引入的校正策略 ,并在此基础上结合统计方法处理未登录词。针对检索技术 ,综述了几种最常用的检索模型的原理 ,并对每种模型的优缺点进行了简要分析。最后对给出的分词算法进行了测试 。
展开更多
关键词
信息检索
搜索引擎
分词技术
检索
技术
在线阅读
下载PDF
职称材料
开发中文搜索引擎汉语处理的关键技术
被引量:
24
4
作者
严威
赵政
《计算机工程》
CAS
CSCD
北大核心
1999年第6期5-6,8,共3页
论述了开发中文搜索引擎在语言方面的两项关键技术,即中文分词技术和汉化问题,介绍了几种解决方案。并在结尾展望了中文搜索引擎的未来。
关键词
中文探索引擎
分词技术
汉语处理
中文信息处理
在线阅读
下载PDF
职称材料
基于全文搜索的中文搜索引擎设计技术
被引量:
10
5
作者
陈燕娜
邵志清
《计算机工程与应用》
CSCD
北大核心
2002年第17期196-198,共3页
随着Internet应用的逐步普及,WWW已成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。但由于中文信息处理的复杂性和特殊性,中文搜索引擎的功能仍不够完善。该文提出了一个基于全文搜索的中文搜索引擎的实现方案,并对...
随着Internet应用的逐步普及,WWW已成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。但由于中文信息处理的复杂性和特殊性,中文搜索引擎的功能仍不够完善。该文提出了一个基于全文搜索的中文搜索引擎的实现方案,并对信息处理中的关键技术进行了探讨。
展开更多
关键词
全文搜索
中文搜索引擎设计
技术
WWW
中文
分词技术
文档相关性
Internet
在线阅读
下载PDF
职称材料
自然语言处理技术的探讨
被引量:
1
6
作者
王新梅
《南方农机》
2017年第24期135-135,共1页
首先阐述自然语言处理的概念和意义,探讨中文信息处理的概况与发展,最后总结自动分词是自然语言处理的基础。
关键词
语言处理
自动
分词技术
信息
技术
在线阅读
下载PDF
职称材料
基于历史事故案例的瓦斯爆炸情景要素提取及情景构建方法研究
7
作者
国汉君
赵伟
+4 位作者
宋亚楠
郭小芳
赵志虎
周爱桃
王凯
《矿业安全与环保》
CAS
北大核心
2024年第3期43-49,共7页
为深入探究煤矿瓦斯爆炸事故发展规律,提出一种基于中文分词技术对瓦斯爆炸事故情景要素进行分析和提取的方法。通过煤矿安全网等途径搜集统计了1978—2020年间的733起瓦斯爆炸事故报告,在此基础上进行数据预处理,剔除不完整的事故报告...
为深入探究煤矿瓦斯爆炸事故发展规律,提出一种基于中文分词技术对瓦斯爆炸事故情景要素进行分析和提取的方法。通过煤矿安全网等途径搜集统计了1978—2020年间的733起瓦斯爆炸事故报告,在此基础上进行数据预处理,剔除不完整的事故报告,最终选取255起瓦斯爆炸事故报告进行要素分析与提取;将事故等级、事故经过、事故原因等内容进行整理储存,形成待挖掘文本语料库;基于Jieba分词算法提取瓦斯爆炸事故情景关键词,并采用TF-IDF算法进行权重计算,将情景划分为事故体、致灾体、承灾体、抗灾体4个维度和24个要素,为后续瓦斯爆炸事故的情景表示和事故未来的可能性组合提供了参考依据。
展开更多
关键词
安全工程
瓦斯爆炸
情景分析
中文
分词
Jieba
分词技术
在线阅读
下载PDF
职称材料
搜索引擎用户接口设计
被引量:
2
8
作者
何友全
徐小乐
+2 位作者
徐澄
栾红玉
唐华姣
《重庆理工大学学报(自然科学)》
CAS
2010年第9期63-68,共6页
介绍了搜索引擎中用户界面的实现技术,包括抓取网页、索引和检索。在此基础上,应用Ajax技术实现用户接口的设计,利用Lucene技术,在建立好的索引库中检索出用户感兴趣的网页,并给出设计过程中部分关键代码。
关键词
搜索引擎
中文
分词技术
LUCENE
用户界面
AJAX
技术
在线阅读
下载PDF
职称材料
军用词典库的设计
被引量:
2
9
作者
姜文志
蒋伟俊
+1 位作者
张金乙
王迪
《兵工自动化》
2007年第8期50-51,65,共3页
军用词典库的设计,关键是对装备有词类进行"类分"和"组分"。其数据结构由常用的位置代码改为父级代码,同时记录本层次的代码。词处理模块选用中科院的多层隐马模型分词系统ICTCLAS及哈工大的统计分词系统HIT_IRLab...
军用词典库的设计,关键是对装备有词类进行"类分"和"组分"。其数据结构由常用的位置代码改为父级代码,同时记录本层次的代码。词处理模块选用中科院的多层隐马模型分词系统ICTCLAS及哈工大的统计分词系统HIT_IRLab,并设计判决器及其判决规则。理论值和实际统计所得数据仿真比较表明,该词典库有利于提高装备信息管理的自动化水平。
展开更多
关键词
军用词典库
词类
数据结构
分词技术
判决规则
在线阅读
下载PDF
职称材料
基于自动文本分类的关键词抽取算法
被引量:
18
10
作者
张虹
《计算机工程》
CAS
CSCD
北大核心
2009年第12期145-147,共3页
分析现有几种中文分词方法,提出一种关键词抽取算法。以词语的权重公式为中心,利用遗传算法训练、优化公式中的参数,得到一组适合中文文本的参数,提高文章子主题划分的精度。实验分析表明,该算法能将抽取系统中的命名实体有效地切分出来...
分析现有几种中文分词方法,提出一种关键词抽取算法。以词语的权重公式为中心,利用遗传算法训练、优化公式中的参数,得到一组适合中文文本的参数,提高文章子主题划分的精度。实验分析表明,该算法能将抽取系统中的命名实体有效地切分出来,准确完成抽取关键词的工作,并具有一定的通用性。
展开更多
关键词
文本分类
分词技术
关键词抽取
遗传算法
在线阅读
下载PDF
职称材料
基于中文题名的计算机辅助标引
被引量:
2
11
作者
陈雷霆
张宁
《计算机应用》
CSCD
1999年第6期9-11,共3页
本文阐述了基于中文文献题名的计算机辅助标引系统的组成结构,并讨论了其中的一些关键技术问题。文章从系统结构设计方面,对该系统的建表模块、目录模块、分词标引模块、校对模块、选号打印模块和系统管理模块进行了讨论,并着重讨论...
本文阐述了基于中文文献题名的计算机辅助标引系统的组成结构,并讨论了其中的一些关键技术问题。文章从系统结构设计方面,对该系统的建表模块、目录模块、分词标引模块、校对模块、选号打印模块和系统管理模块进行了讨论,并着重讨论了分词标引技术。
展开更多
关键词
计算机辅助标引
分词技术
数据库
中文题名
在线阅读
下载PDF
职称材料
搜索引擎的设计剖析
被引量:
15
12
作者
张汛涞
《计算机工程与科学》
CSCD
2002年第4期18-20,共3页
本文介绍了搜索引擎的四个组成部分 :搜索器、索引器、检索器和用户接口 ,并分析其工作原理 ;给出搜索引擎中包含的关键技术算法 :分词技术、多路归并算法和大文件处理技术 ;最后结合当前最新的几种搜索引擎 ,探讨搜索引擎在多语言处理...
本文介绍了搜索引擎的四个组成部分 :搜索器、索引器、检索器和用户接口 ,并分析其工作原理 ;给出搜索引擎中包含的关键技术算法 :分词技术、多路归并算法和大文件处理技术 ;最后结合当前最新的几种搜索引擎 ,探讨搜索引擎在多语言处理、专业化和有效性等方面的技术改进目标。
展开更多
关键词
搜索引擎
设计
搜索器
索引器
检索器
分词技术
互联网
信息检索
在线阅读
下载PDF
职称材料
基于改进型最大匹配法的教学资源自然语义查询
被引量:
1
13
作者
曾立胜
刘志勤
《计算机工程与设计》
CSCD
北大核心
2008年第6期1559-1561,1564,共4页
中文智能信息检索中的关键是自然语言处理技术,汉语自动分词技术是中文自然语言处理的基础。基于机械匹配的分词方法简洁、实用,但该方法切分精度不高且无法有效克服切分歧义。针对机械匹配最大匹配算法的应用进行了改进,并将相似串应...
中文智能信息检索中的关键是自然语言处理技术,汉语自动分词技术是中文自然语言处理的基础。基于机械匹配的分词方法简洁、实用,但该方法切分精度不高且无法有效克服切分歧义。针对机械匹配最大匹配算法的应用进行了改进,并将相似串应用于教学资源自然语义查询。
展开更多
关键词
汉语
分词技术
相似串
自然查询
最大匹配算法
教学资源
信息检索
在线阅读
下载PDF
职称材料
改进型答疑系统的设计与实现
14
作者
邓灵丽
覃聪
《现代制造工程》
CSCD
2005年第11期130-132,共3页
针对目前自动答疑系统只是一个简单的数据库检索系统,从分词、数据库的构建和查询扩展等,对现有答疑系统提出一个改进的模型,较好地解决了查询的快速定位,具有一定的智能化和个性化,有良好的可扩性与推广性。
关键词
远程教育
自动答疑系统
分词技术
模糊匹配
扩展查询
在线阅读
下载PDF
职称材料
基于大数据分析挖掘的地质文献推荐方法研究
被引量:
10
15
作者
张戈一
胡博然
+2 位作者
常力恒
朱月琴
吕鹏飞
《中国矿业》
北大核心
2017年第9期92-97,共6页
地质图书馆书籍多,数据资料庞大,然而却存在数据资料增长过快和难以发现读者兴趣点的问题。实现高效的图书馆借阅数据挖掘分析与推荐,是提高效率的重要手段。为此本文提出了基于大数据地质文献分析挖掘平台,包括聚类分析,中文分词,推荐...
地质图书馆书籍多,数据资料庞大,然而却存在数据资料增长过快和难以发现读者兴趣点的问题。实现高效的图书馆借阅数据挖掘分析与推荐,是提高效率的重要手段。为此本文提出了基于大数据地质文献分析挖掘平台,包括聚类分析,中文分词,推荐系统,关联分析功能,再通过Hadoop集群多节点进行推荐,从而提高了工作的效率。
展开更多
关键词
大数据
技术
分词技术
推荐系统
并行计算
在线阅读
下载PDF
职称材料
基于知识图谱的低压配电网拓扑结构辨识方法
被引量:
69
16
作者
高泽璞
赵云
+3 位作者
余伊兰
罗永建
徐紫薇
张莲梅
《电力系统保护与控制》
EI
CSCD
北大核心
2020年第2期34-43,共10页
低压配电网中正确的拓扑关系是至关重要的。低压配电网实际拓扑结构因运维需要变动频繁且巨大,配电网信息系统中的数据更新不及时、流通性低以及质量差等不能正确反映低压配电网的实际拓扑结构,有必要进行拓扑辨识。知识图谱技术可以清...
低压配电网中正确的拓扑关系是至关重要的。低压配电网实际拓扑结构因运维需要变动频繁且巨大,配电网信息系统中的数据更新不及时、流通性低以及质量差等不能正确反映低压配电网的实际拓扑结构,有必要进行拓扑辨识。知识图谱技术可以清晰地反映出数据间的现有关系,推理挖掘出隐藏知识,适用于低压配电网的拓扑辨识。因此应用知识图谱技术于拓扑辨识中,首先分析知识图谱构建方法,运用知识图谱技术,对多个低压配电网信息系统中的数据进行整合,推理出缺失数据,挖掘出各数据之间的关系。然后构建出低压配电网拓扑结构的知识图谱。最后结合《低压配电网基建工程典型设计规范》以及语义分词技术,对低压配电网信息系统中的户变关系进行辨识。算例实验效果良好,表明所提出的辨识方法具有理论价值和实际应用价值。
展开更多
关键词
知识图谱
语义
分词技术
知识推理
户变关系
拓扑辨识
在线阅读
下载PDF
职称材料
基于网络微博的地震宏观异常信息提取研究——以芦山地震为例
被引量:
1
17
作者
张群燕
黄健熙
+2 位作者
张晓东
苏晓慧
张旭
《震灾防御技术》
CSCD
2013年第4期459-467,共9页
微博平台有用户群大、公众参与性强、实时性等优点,同时微博平台信息又具有信息真伪难辨、地址信息模糊等缺点。本文以芦山地震为例,针对微博内容如何提取和地址如何定位两方面进行了分析研究,对于如何在网络微博平台中及时的提取地震...
微博平台有用户群大、公众参与性强、实时性等优点,同时微博平台信息又具有信息真伪难辨、地址信息模糊等缺点。本文以芦山地震为例,针对微博内容如何提取和地址如何定位两方面进行了分析研究,对于如何在网络微博平台中及时的提取地震宏观异常信息,提出了聚焦爬虫技术,并对微博地址进行了分类,同时将正向最大匹配和特征词地址分词的中文地址匹配模型应用于地址信息的提取和地址匹配中;最后将不同的地址类别定位为不同的行政级别,使微博平台和微博信息得到了充分的利用。通过研究认识到微博信息在反应震前异常的发生趋势方面有一定的参考价值(动物异常和气象异常所占比例较大),是不能被忽略的;地址方面可以看出异常随着时间的逼近有向震中聚集的趋势,有一定的参考价值。
展开更多
关键词
微博平台
聚焦爬虫
地震宏观异常
分词技术
地址匹配
在线阅读
下载PDF
职称材料
《计算机工程与设计》1992年总目录
18
《计算机工程与设计》
CSCD
北大核心
1992年第6期65-66,共2页
关键词
夏鹏
UNIX
实时调度算法
面向对象的分析
数据库语言
计算机动画
数据库结构
驱动程序设计
分词技术
管理信息系统
在线阅读
下载PDF
职称材料
题名
中文信息处理中自动分词技术的研究与展望
被引量:
68
1
作者
刘迁
贾惠波
机构
清华大学精密仪器与机械学系
清华大学光盘国家工程研究中心
出处
《计算机工程与应用》
CSCD
北大核心
2006年第3期175-177,182,共4页
文摘
汉语自动分词是中文信息处理的关键技术,已经成为中文信息处理发展的瓶颈。文章介绍了当前自动分词技术的研究状况,对各种分词算法进行了介绍,并对各种算法进行了比较和讨论。最后,对汉语自动分词技术的发展进行了展望。
关键词
汉语自动
分词
中文信息处理
分词技术
分词
算法
Keywords
Chinese information disposal,Chlnese word automatic segmentation,segmentation methods
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
结合分词技术与语句相似度的主观题自动判分算法
被引量:
9
2
作者
李玉红
柴林燕
张琪
机构
承德医学院数学教研室
中国医学科学院北京协和医学院生物医学工程研究所
出处
《计算机工程与设计》
CSCD
北大核心
2010年第11期2663-2666,共4页
基金
河北省教育厅指令性课题基金项目(2007301)
文摘
针对网络考试系统中主观题自动评分面临的困难和问题,提出一种基于中文分词技术结合语句相似度的主观题自动判分算法。该算法利用字典与统计相结合技术将语句切分成具有独立意义的单词,通过计算词与词之间的相似度,并结合词形、词序和语句长度等多层次相似度计算得到整句的相似度。利用语句相似度计算结合改进关键字匹配算法得到最终分值。经课题中多媒体简答题的测试,结果表明了该算法的有效性。
关键词
分词技术
语句相似度
主观题
自动判分
关键字匹配
Keywords
segmentation technology
sentence similarity
subjective questions
automated correcting
keywords matching
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
中文信息检索引擎中的分词与检索技术
被引量:
48
3
作者
吴栋
滕育平
机构
南开大学组合数学研究中心核心数学与组合数学教育部重点实验室
出处
《计算机应用》
CSCD
北大核心
2004年第7期128-131,共4页
文摘
文中论述了在开发中文信息检索系统中所涉及到的两项关键技术 ,即中文分词技术和检索技术。针对中文分词技术 ,介绍了一种改进的正向最大匹配切分算法 ,以及为消除歧义引入的校正策略 ,并在此基础上结合统计方法处理未登录词。针对检索技术 ,综述了几种最常用的检索模型的原理 ,并对每种模型的优缺点进行了简要分析。最后对给出的分词算法进行了测试 。
关键词
信息检索
搜索引擎
分词技术
检索
技术
Keywords
information retrieval
search engine
word segmentation
search technique
分类号
TP317.2 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
开发中文搜索引擎汉语处理的关键技术
被引量:
24
4
作者
严威
赵政
机构
天津大学计算机系
出处
《计算机工程》
CAS
CSCD
北大核心
1999年第6期5-6,8,共3页
文摘
论述了开发中文搜索引擎在语言方面的两项关键技术,即中文分词技术和汉化问题,介绍了几种解决方案。并在结尾展望了中文搜索引擎的未来。
关键词
中文探索引擎
分词技术
汉语处理
中文信息处理
Keywords
Chinese search engine
syncopation
Chinesization
Java
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于全文搜索的中文搜索引擎设计技术
被引量:
10
5
作者
陈燕娜
邵志清
机构
华东理工大学信息学院
出处
《计算机工程与应用》
CSCD
北大核心
2002年第17期196-198,共3页
基金
上海市青年科技启明星计划(编号:99QD14038)
文摘
随着Internet应用的逐步普及,WWW已成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。但由于中文信息处理的复杂性和特殊性,中文搜索引擎的功能仍不够完善。该文提出了一个基于全文搜索的中文搜索引擎的实现方案,并对信息处理中的关键技术进行了探讨。
关键词
全文搜索
中文搜索引擎设计
技术
WWW
中文
分词技术
文档相关性
Internet
Keywords
WWW,search engine,full-text retrieval,Chinese word segmentation,documental relativity
分类号
TP393.4 [自动化与计算机技术—计算机应用技术]
G354.4 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
自然语言处理技术的探讨
被引量:
1
6
作者
王新梅
机构
吉林省安全生产教育中心
出处
《南方农机》
2017年第24期135-135,共1页
文摘
首先阐述自然语言处理的概念和意义,探讨中文信息处理的概况与发展,最后总结自动分词是自然语言处理的基础。
关键词
语言处理
自动
分词技术
信息
技术
分类号
G623.58 [文化科学—教育学]
在线阅读
下载PDF
职称材料
题名
基于历史事故案例的瓦斯爆炸情景要素提取及情景构建方法研究
7
作者
国汉君
赵伟
宋亚楠
郭小芳
赵志虎
周爱桃
王凯
机构
国家能源集团
中国矿业大学应急管理与安全工程学院
出处
《矿业安全与环保》
CAS
北大核心
2024年第3期43-49,共7页
基金
国家自然科学基金面上项目(52374250)
国家自然科学基金重点项目(52130409)
北京市自然科学基金面上项目(8222070)。
文摘
为深入探究煤矿瓦斯爆炸事故发展规律,提出一种基于中文分词技术对瓦斯爆炸事故情景要素进行分析和提取的方法。通过煤矿安全网等途径搜集统计了1978—2020年间的733起瓦斯爆炸事故报告,在此基础上进行数据预处理,剔除不完整的事故报告,最终选取255起瓦斯爆炸事故报告进行要素分析与提取;将事故等级、事故经过、事故原因等内容进行整理储存,形成待挖掘文本语料库;基于Jieba分词算法提取瓦斯爆炸事故情景关键词,并采用TF-IDF算法进行权重计算,将情景划分为事故体、致灾体、承灾体、抗灾体4个维度和24个要素,为后续瓦斯爆炸事故的情景表示和事故未来的可能性组合提供了参考依据。
关键词
安全工程
瓦斯爆炸
情景分析
中文
分词
Jieba
分词技术
Keywords
safety engineering
gas explosion
scenario analysis
Chinese word segmentation
Jieba word segmentation technology
分类号
TD712.7 [矿业工程—矿井通风与安全]
X913 [环境科学与工程—安全科学]
在线阅读
下载PDF
职称材料
题名
搜索引擎用户接口设计
被引量:
2
8
作者
何友全
徐小乐
徐澄
栾红玉
唐华姣
机构
重庆交通大学信息科学与工程学院
重庆交通大学管理学院
出处
《重庆理工大学学报(自然科学)》
CAS
2010年第9期63-68,共6页
基金
重庆市科委攻关项目(CSTC
2010AC6074)
+1 种基金
重庆交通大学研究生教育创新基金资助项目
重庆交通大学实验教学改革与研究基金资助项目(SYJ200922)
文摘
介绍了搜索引擎中用户界面的实现技术,包括抓取网页、索引和检索。在此基础上,应用Ajax技术实现用户接口的设计,利用Lucene技术,在建立好的索引库中检索出用户感兴趣的网页,并给出设计过程中部分关键代码。
关键词
搜索引擎
中文
分词技术
LUCENE
用户界面
AJAX
技术
Keywords
Search Engine
Chinese Word Segmentation
lucene
User Interface
Ajax Technology
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
军用词典库的设计
被引量:
2
9
作者
姜文志
蒋伟俊
张金乙
王迪
机构
海军航空工程学院兵器科学与技术系
出处
《兵工自动化》
2007年第8期50-51,65,共3页
基金
军队重点实验室建设项目(2110201)
文摘
军用词典库的设计,关键是对装备有词类进行"类分"和"组分"。其数据结构由常用的位置代码改为父级代码,同时记录本层次的代码。词处理模块选用中科院的多层隐马模型分词系统ICTCLAS及哈工大的统计分词系统HIT_IRLab,并设计判决器及其判决规则。理论值和实际统计所得数据仿真比较表明,该词典库有利于提高装备信息管理的自动化水平。
关键词
军用词典库
词类
数据结构
分词技术
判决规则
Keywords
Militarily dictionary base
Word-class
Data organization structure
Lexical technology
Judgment rule
分类号
TP311.131 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于自动文本分类的关键词抽取算法
被引量:
18
10
作者
张虹
机构
潍坊学院计算机与通信工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第12期145-147,共3页
文摘
分析现有几种中文分词方法,提出一种关键词抽取算法。以词语的权重公式为中心,利用遗传算法训练、优化公式中的参数,得到一组适合中文文本的参数,提高文章子主题划分的精度。实验分析表明,该算法能将抽取系统中的命名实体有效地切分出来,准确完成抽取关键词的工作,并具有一定的通用性。
关键词
文本分类
分词技术
关键词抽取
遗传算法
Keywords
text categorization
word segmentation technology
keywords extraction
genetic algorithm
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于中文题名的计算机辅助标引
被引量:
2
11
作者
陈雷霆
张宁
机构
电子科技大学计算机学院
出处
《计算机应用》
CSCD
1999年第6期9-11,共3页
文摘
本文阐述了基于中文文献题名的计算机辅助标引系统的组成结构,并讨论了其中的一些关键技术问题。文章从系统结构设计方面,对该系统的建表模块、目录模块、分词标引模块、校对模块、选号打印模块和系统管理模块进行了讨论,并着重讨论了分词标引技术。
关键词
计算机辅助标引
分词技术
数据库
中文题名
Keywords
Computer aided indexing, Word segmentation, Database, System structure
分类号
G254-39 [文化科学—图书馆学]
在线阅读
下载PDF
职称材料
题名
搜索引擎的设计剖析
被引量:
15
12
作者
张汛涞
机构
解放军体育学院计算机教研室
出处
《计算机工程与科学》
CSCD
2002年第4期18-20,共3页
文摘
本文介绍了搜索引擎的四个组成部分 :搜索器、索引器、检索器和用户接口 ,并分析其工作原理 ;给出搜索引擎中包含的关键技术算法 :分词技术、多路归并算法和大文件处理技术 ;最后结合当前最新的几种搜索引擎 ,探讨搜索引擎在多语言处理、专业化和有效性等方面的技术改进目标。
关键词
搜索引擎
设计
搜索器
索引器
检索器
分词技术
互联网
信息检索
Keywords
search engine
spider
indexer
searcher
word split algorithm
分类号
TP393.4 [自动化与计算机技术—计算机应用技术]
G354.4 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
基于改进型最大匹配法的教学资源自然语义查询
被引量:
1
13
作者
曾立胜
刘志勤
机构
西南科技大学计算机科学与技术学院
出处
《计算机工程与设计》
CSCD
北大核心
2008年第6期1559-1561,1564,共4页
基金
国家863高技术研究发展计划基金项目(2003AA116060)
四川省科技攻关基金项目(05GG07-006)
文摘
中文智能信息检索中的关键是自然语言处理技术,汉语自动分词技术是中文自然语言处理的基础。基于机械匹配的分词方法简洁、实用,但该方法切分精度不高且无法有效克服切分歧义。针对机械匹配最大匹配算法的应用进行了改进,并将相似串应用于教学资源自然语义查询。
关键词
汉语
分词技术
相似串
自然查询
最大匹配算法
教学资源
信息检索
Keywords
Chinese word segmentation technology
similar string
natural language retrieval
maximum matching method
teaching resources
information retrieval
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
改进型答疑系统的设计与实现
14
作者
邓灵丽
覃聪
机构
广东岭南职业技术学院信息工程分院
出处
《现代制造工程》
CSCD
2005年第11期130-132,共3页
文摘
针对目前自动答疑系统只是一个简单的数据库检索系统,从分词、数据库的构建和查询扩展等,对现有答疑系统提出一个改进的模型,较好地解决了查询的快速定位,具有一定的智能化和个性化,有良好的可扩性与推广性。
关键词
远程教育
自动答疑系统
分词技术
模糊匹配
扩展查询
Keywords
Distance education
Auto-answer system
Participle technique
Obscure matching
Query expansion
分类号
TP311.1 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于大数据分析挖掘的地质文献推荐方法研究
被引量:
10
15
作者
张戈一
胡博然
常力恒
朱月琴
吕鹏飞
机构
中国矿业大学(北京)
国土资源部地质信息技术重点实验室
中国地质调查局发展研究中心
中国地质大学(北京)
中国地质图书馆
中国科学院大学
出处
《中国矿业》
北大核心
2017年第9期92-97,共6页
基金
国土资源部公益性行业科研专项项目资助(编号:201511079)
文摘
地质图书馆书籍多,数据资料庞大,然而却存在数据资料增长过快和难以发现读者兴趣点的问题。实现高效的图书馆借阅数据挖掘分析与推荐,是提高效率的重要手段。为此本文提出了基于大数据地质文献分析挖掘平台,包括聚类分析,中文分词,推荐系统,关联分析功能,再通过Hadoop集群多节点进行推荐,从而提高了工作的效率。
关键词
大数据
技术
分词技术
推荐系统
并行计算
Keywords
big date technology
word segmentation technology
recommended system
parallel computing
分类号
P208 [天文地球—地图制图学与地理信息工程]
在线阅读
下载PDF
职称材料
题名
基于知识图谱的低压配电网拓扑结构辨识方法
被引量:
69
16
作者
高泽璞
赵云
余伊兰
罗永建
徐紫薇
张莲梅
机构
武汉大学电气与自动化学院
南方电网科学研究院
出处
《电力系统保护与控制》
EI
CSCD
北大核心
2020年第2期34-43,共10页
基金
南方电网公司专项课题资助(ZBKJXM20170078)
国家自然科学基金项目资助(51277134)“智能电网海量电物理量数据轻型传输机理与方法研究”~~
文摘
低压配电网中正确的拓扑关系是至关重要的。低压配电网实际拓扑结构因运维需要变动频繁且巨大,配电网信息系统中的数据更新不及时、流通性低以及质量差等不能正确反映低压配电网的实际拓扑结构,有必要进行拓扑辨识。知识图谱技术可以清晰地反映出数据间的现有关系,推理挖掘出隐藏知识,适用于低压配电网的拓扑辨识。因此应用知识图谱技术于拓扑辨识中,首先分析知识图谱构建方法,运用知识图谱技术,对多个低压配电网信息系统中的数据进行整合,推理出缺失数据,挖掘出各数据之间的关系。然后构建出低压配电网拓扑结构的知识图谱。最后结合《低压配电网基建工程典型设计规范》以及语义分词技术,对低压配电网信息系统中的户变关系进行辨识。算例实验效果良好,表明所提出的辨识方法具有理论价值和实际应用价值。
关键词
知识图谱
语义
分词技术
知识推理
户变关系
拓扑辨识
Keywords
knowledge graph
semantic word segmentation technology
knowledge reasoning
household relationship
topology identification
分类号
TM727 [电气工程—电力系统及自动化]
在线阅读
下载PDF
职称材料
题名
基于网络微博的地震宏观异常信息提取研究——以芦山地震为例
被引量:
1
17
作者
张群燕
黄健熙
张晓东
苏晓慧
张旭
机构
中国农业大学信息与电气工程学院
出处
《震灾防御技术》
CSCD
2013年第4期459-467,共9页
基金
国家"十二五"科技支撑计划课题(2012BAK19B04-03)
文摘
微博平台有用户群大、公众参与性强、实时性等优点,同时微博平台信息又具有信息真伪难辨、地址信息模糊等缺点。本文以芦山地震为例,针对微博内容如何提取和地址如何定位两方面进行了分析研究,对于如何在网络微博平台中及时的提取地震宏观异常信息,提出了聚焦爬虫技术,并对微博地址进行了分类,同时将正向最大匹配和特征词地址分词的中文地址匹配模型应用于地址信息的提取和地址匹配中;最后将不同的地址类别定位为不同的行政级别,使微博平台和微博信息得到了充分的利用。通过研究认识到微博信息在反应震前异常的发生趋势方面有一定的参考价值(动物异常和气象异常所占比例较大),是不能被忽略的;地址方面可以看出异常随着时间的逼近有向震中聚集的趋势,有一定的参考价值。
关键词
微博平台
聚焦爬虫
地震宏观异常
分词技术
地址匹配
Keywords
Micro-blog
Focused crawling technique
Earthquake macro-anomalies
Word segmentationalgorithm
Address matching
分类号
TP393.092 [自动化与计算机技术—计算机应用技术]
P315.7 [天文地球—地震学]
在线阅读
下载PDF
职称材料
题名
《计算机工程与设计》1992年总目录
18
出处
《计算机工程与设计》
CSCD
北大核心
1992年第6期65-66,共2页
关键词
夏鹏
UNIX
实时调度算法
面向对象的分析
数据库语言
计算机动画
数据库结构
驱动程序设计
分词技术
管理信息系统
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
中文信息处理中自动分词技术的研究与展望
刘迁
贾惠波
《计算机工程与应用》
CSCD
北大核心
2006
68
在线阅读
下载PDF
职称材料
2
结合分词技术与语句相似度的主观题自动判分算法
李玉红
柴林燕
张琪
《计算机工程与设计》
CSCD
北大核心
2010
9
在线阅读
下载PDF
职称材料
3
中文信息检索引擎中的分词与检索技术
吴栋
滕育平
《计算机应用》
CSCD
北大核心
2004
48
在线阅读
下载PDF
职称材料
4
开发中文搜索引擎汉语处理的关键技术
严威
赵政
《计算机工程》
CAS
CSCD
北大核心
1999
24
在线阅读
下载PDF
职称材料
5
基于全文搜索的中文搜索引擎设计技术
陈燕娜
邵志清
《计算机工程与应用》
CSCD
北大核心
2002
10
在线阅读
下载PDF
职称材料
6
自然语言处理技术的探讨
王新梅
《南方农机》
2017
1
在线阅读
下载PDF
职称材料
7
基于历史事故案例的瓦斯爆炸情景要素提取及情景构建方法研究
国汉君
赵伟
宋亚楠
郭小芳
赵志虎
周爱桃
王凯
《矿业安全与环保》
CAS
北大核心
2024
0
在线阅读
下载PDF
职称材料
8
搜索引擎用户接口设计
何友全
徐小乐
徐澄
栾红玉
唐华姣
《重庆理工大学学报(自然科学)》
CAS
2010
2
在线阅读
下载PDF
职称材料
9
军用词典库的设计
姜文志
蒋伟俊
张金乙
王迪
《兵工自动化》
2007
2
在线阅读
下载PDF
职称材料
10
基于自动文本分类的关键词抽取算法
张虹
《计算机工程》
CAS
CSCD
北大核心
2009
18
在线阅读
下载PDF
职称材料
11
基于中文题名的计算机辅助标引
陈雷霆
张宁
《计算机应用》
CSCD
1999
2
在线阅读
下载PDF
职称材料
12
搜索引擎的设计剖析
张汛涞
《计算机工程与科学》
CSCD
2002
15
在线阅读
下载PDF
职称材料
13
基于改进型最大匹配法的教学资源自然语义查询
曾立胜
刘志勤
《计算机工程与设计》
CSCD
北大核心
2008
1
在线阅读
下载PDF
职称材料
14
改进型答疑系统的设计与实现
邓灵丽
覃聪
《现代制造工程》
CSCD
2005
0
在线阅读
下载PDF
职称材料
15
基于大数据分析挖掘的地质文献推荐方法研究
张戈一
胡博然
常力恒
朱月琴
吕鹏飞
《中国矿业》
北大核心
2017
10
在线阅读
下载PDF
职称材料
16
基于知识图谱的低压配电网拓扑结构辨识方法
高泽璞
赵云
余伊兰
罗永建
徐紫薇
张莲梅
《电力系统保护与控制》
EI
CSCD
北大核心
2020
69
在线阅读
下载PDF
职称材料
17
基于网络微博的地震宏观异常信息提取研究——以芦山地震为例
张群燕
黄健熙
张晓东
苏晓慧
张旭
《震灾防御技术》
CSCD
2013
1
在线阅读
下载PDF
职称材料
18
《计算机工程与设计》1992年总目录
《计算机工程与设计》
CSCD
北大核心
1992
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部