期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于网页上下文的Deep Web数据库分类 被引量:31
1
作者 马军 宋玲 +1 位作者 韩晓晖 闫泼 《软件学报》 EI CSCD 北大核心 2008年第2期267-274,共8页
讨论了提高Deep Web数据库分类准确性的若干新技术,其中包括利用HTML网页的内容文本作为理解数据库内容的上下文和把数据库表的属性标记词归一的过程.其中对网页中的内容文本的发现算法是基于对网页文本块的多种统计特征.而对数据库属... 讨论了提高Deep Web数据库分类准确性的若干新技术,其中包括利用HTML网页的内容文本作为理解数据库内容的上下文和把数据库表的属性标记词归一的过程.其中对网页中的内容文本的发现算法是基于对网页文本块的多种统计特征.而对数据库属性标记词的归一过程是把同义标记词用代表词进行替代的过程.给出了采用分层模糊集合对给定学习实例所发现的领域和语言知识进行表示和基于这些知识对标记词归一化算法.基于上述预处理,给出了计算Deep Web数据库的K-NN(k nearest neighbors)分类算法,其中对数据库之间语义距离计算综合了数据库表之间和含有数据库表的网页的内容文本之间的语义距离.分类实验给出算法对未预处理的网页和经过预处理后的网页在数据库分类精度、查全率和综合F1等测度上的分类结果比较. 展开更多
关键词 DEEP Web 隐式Web 数据库分类 内容文本抽取 语义分类
在线阅读 下载PDF
多数据库挖掘中独立于应用的数据库分类研究 被引量:3
2
作者 唐懿芳 牛力 +1 位作者 钟智 张成奇 《广西师范大学学报(自然科学版)》 CAS 2003年第4期32-36,共5页
目前的数据挖掘技术大多只针对单一数据库进行挖掘。当数据库有多个时,需要用到多数据库挖掘技术。应用聚类思想,提出一种独立于应用的数据库分类方法,并给出了相关的算法,最后用实验证明了该方法的正确性和有效性。
关键词 数据库挖掘 数据库分类 聚类 算法
在线阅读 下载PDF
DIALOG数据库分类及常用功能 被引量:3
3
作者 张瑞芳 徐惠珍 《情报杂志》 CSSCI 北大核心 2001年第5期67-68,共2页
介绍了DIALOG数据库蓝页和数据库的分类以及笔者在实践中总结的几种常用检索功能:数据库扫描、免 费贮存、多重数据库一次检索、对检索结果的再处理、多种显示和提取检索结果以及在线帮助功能。
关键词 联机检索 DIALOG数据库 数据库蓝页 数据库分类 检索功能
在线阅读 下载PDF
云计算中基于Session和内容等级的数据库请求分类算法 被引量:5
4
作者 赵涓涓 刘涛 +1 位作者 强彦 卢军佐 《计算机科学》 CSCD 北大核心 2013年第2期177-179,共3页
云计算是当今世界IT行业的研究热点,在云计算实例中存在各种各样的用户对于数据库的请求,并且这些请求是海量的,如果不对这些数据库请求进行合理的分类,必然会对系统的性能造成很大的影响。如何对这些请求进行分类以达到Web QoS的标准,... 云计算是当今世界IT行业的研究热点,在云计算实例中存在各种各样的用户对于数据库的请求,并且这些请求是海量的,如果不对这些数据库请求进行合理的分类,必然会对系统的性能造成很大的影响。如何对这些请求进行分类以达到Web QoS的标准,是云计算研究的一大难点和关键点。原来基于先来先服务的请求模式不仅不能满足客户优先级的要求,不能达到利益的最大化,而且不能使服务资源得到充分利用。因此,提出了基于Session和内容等级的数据库请求分类算法,该算法提出了基于Session和内容等级的性能函数,充分考虑了客户的优先级,使得优先级高的客户的请求优先得到服务资源;而对于优先级较低的请求,由于在算法中加入了时间函数,其优先级会随着等待时间的加长而变成优先级较高的请求,从而也会得到处理,不至于无限期地等待。因此,该算法既保证了优先级高的请求优先得到处理,又保证了优先级低的请求不至于由于优先级较低而得不到处理,是一种动态的数据库自适应的数据库请求分类。 展开更多
关键词 云计算 SESSION 内容等级 数据库请求分类 数据库自适应
在线阅读 下载PDF
色谱柱分类数据库用于指导天然药物化学对照品色谱纯度测定时色谱柱理性选择(英文) 被引量:3
5
作者 王明娟 戴忠 +3 位作者 马双成 金红宇 HOOGMARTENS Jos ADAMS Erwin 《色谱》 CAS CSCD 北大核心 2017年第2期196-202,共7页
由于中药化学对照品多数来源于动植物药材,很容易混有结构类似物,故有机杂质测定是可能影响其化学对照品赋值准确性的关键风险因素。中药化学对照品的有机杂质测定通常采用药典收载或文献报道的高效液相色谱法,这些方法通常仅规定"... 由于中药化学对照品多数来源于动植物药材,很容易混有结构类似物,故有机杂质测定是可能影响其化学对照品赋值准确性的关键风险因素。中药化学对照品的有机杂质测定通常采用药典收载或文献报道的高效液相色谱法,这些方法通常仅规定"以十八烷基硅烷键合硅胶为填充剂",无适宜色谱柱的品牌信息,或者实验室无文献所用的色谱柱品牌,而目前市场上已有800多种品牌的C18柱,生产工艺的不同导致不同品牌C18柱的选择性有差异,甚至差异显著。这很容易出现由于色谱柱选择不适宜而导致测定结果不准确的风险。该文采用国外色谱柱分类数据库指导对照品纯度考察时色谱柱的理性选择,尽可能减少色谱柱盲选可能导致的纯度结果不准确的风险。首先,用数据库挑选2根选择性差异显著的色谱柱(选择性因子F≥6)进行平行实验,以尽可能反映采用不同品牌色谱柱可能出现的分离效果差异。如果这2根色谱柱的分离效果及纯度测定结果无显著性差异,则可以交叉验证该对照品纯度测定的准确性。否则需要从数据库中选择另外1根与之前试验中分离效果更好、选择性相似的色谱柱进行纯度结果验证。在N-反式-p-对香豆酰基酪胺和表儿茶素没食子酸酯首批对照品的纯度考察中,使用了上述策略并验证了其有效性和科学性,计划推广应用至更多的中药化学对照品,特别当其可能含碱性或弱酸性化合物时,更应该尝试采用本文推荐的色谱柱选择策略交叉验证其纯度测定结果的准确性。 展开更多
关键词 中药化学对照品 色谱纯度 色谱柱理性选择策略 色谱柱分类数据库 N-反式-P-对香豆酰基酪胺 表儿茶素没食子酸酯
在线阅读 下载PDF
高校图书馆数据库评估指标体系构建 被引量:3
6
作者 阮建海 何官峰 +3 位作者 阎勇 李春艳 李启任 秦廷伟 《现代情报》 2009年第12期148-151,共4页
在探讨数据库评估现状的基础上,从"用户中心"的视角,将数据库划分为学习型、研究型和学习研究型3种类型。针对这3种类型数据库,提出并构建了适用于高校图书馆的数据库评估指标体系,对数据库评估指标体系中各一级指标从定性和... 在探讨数据库评估现状的基础上,从"用户中心"的视角,将数据库划分为学习型、研究型和学习研究型3种类型。针对这3种类型数据库,提出并构建了适用于高校图书馆的数据库评估指标体系,对数据库评估指标体系中各一级指标从定性和定量两个方面进行了阐释和探讨。 展开更多
关键词 数据库 评估指标体系 数据库分类 用户中心
在线阅读 下载PDF
基于分类模板数据库的电气铭牌识别 被引量:5
7
作者 胡洋 石煌雄 +1 位作者 蒋作 潘文林 《现代电子技术》 2021年第2期96-100,共5页
电气铭牌文本行多,识别难度较大,当前技术均难以实现有效准确的识别。为解决这一问题,提出一种基于分类模板数据库的方法辅助电气铭牌识别。根据电气铭牌文本行分布情况,将识别分为不可变区域和可变区域识别。每类铭牌不可变区域相当于... 电气铭牌文本行多,识别难度较大,当前技术均难以实现有效准确的识别。为解决这一问题,提出一种基于分类模板数据库的方法辅助电气铭牌识别。根据电气铭牌文本行分布情况,将识别分为不可变区域和可变区域识别。每类铭牌不可变区域相当于一张图像,所以将文字识别转化为图像分类问题。通过对不可变区域建立分类模板数据库,引进卷积神经网络对电气铭牌图像进行分类。经实验验证,该方法能准确高效地识别电气铭牌的不可变区域,从而大幅提升了电气铭牌识别的准确度。 展开更多
关键词 电气铭牌识别 分类模板数据库 文本行 文字识别 辅助识别 图像分类
在线阅读 下载PDF
蛋白质结构分类数据库
8
作者 于晓丽 《重庆理工大学学报(自然科学)》 CAS 2010年第11期61-65,共5页
对最具代表性,应用最为广泛的3个结构分类数据库SCOP、CATH、FSSP进行了描述和评价。针对目前的分类数据库普遍存在的不足,介绍了一种基于多结构比对的蛋白质结构分类的方法。
关键词 蛋白质结构数据库 结构分类数据库 多结构比对
在线阅读 下载PDF
基于应用的分布式数据库挖掘算法研究 被引量:2
9
作者 陈钰芳 王晓峰 《计算机工程与科学》 CSCD 北大核心 2009年第6期119-120,135,共3页
本文基于实际应用的考虑,对现有分布式数据库的挖掘算法进行了一些改进,提出按边界支持度对各局部数据库进行二次挖掘,从而提高了全局模式的挖全率;并从应用的角度,提出基于各局部数据库挖出的局部模式对局部数据库进行分类,为企业的物... 本文基于实际应用的考虑,对现有分布式数据库的挖掘算法进行了一些改进,提出按边界支持度对各局部数据库进行二次挖掘,从而提高了全局模式的挖全率;并从应用的角度,提出基于各局部数据库挖出的局部模式对局部数据库进行分类,为企业的物流配送提供决策依据。 展开更多
关键词 分布式数据库 边界支持度 二次挖掘 全局模式 数据库分类 权重
在线阅读 下载PDF
岩心光谱扫描仪数据处理应用研究 被引量:5
10
作者 陈春霞 修连存 高扬 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2019年第5期1630-1636,共7页
钻探是地质勘探的重要手段之一,近年来,随着我国地质事业的发展,大量岩心的存放和共享成了亟待解决的问题,研制岩心光谱扫描仪,实现岩心数字化解决了这一问题。然而,岩心光谱数据和图像数据的大量产生,对数据处理又提出了新要求。根据... 钻探是地质勘探的重要手段之一,近年来,随着我国地质事业的发展,大量岩心的存放和共享成了亟待解决的问题,研制岩心光谱扫描仪,实现岩心数字化解决了这一问题。然而,岩心光谱数据和图像数据的大量产生,对数据处理又提出了新要求。根据光谱学原理和光谱分析方法,对岩心扫描仪的光谱数据进行光谱分析和蚀变矿物填图,可以为地质科研、矿床分析和外围找矿提供依据。岩心图像也是岩心信息不可缺少的部分,由于岩心扫描仪探测器的局限性、光照条件以及岩心圆柱形的影响,会造成采集到的岩心图像光照不均和辐射畸变。使用非线性的双边滤波法来锐化图像,然后用黑白板定标的方法校正岩心图像,使岩心图像更加接近真实状况。用角点检测法进行特征点检测,完成了图像自动拼接工作,把一张张岩心图像按照岩心钻孔的顺序拼接成岩心柱和岩心盘,使岩心图像显示更直观。矿物的光谱分析是岩心扫描技术的核心,矿物不同,其特征吸收峰的位置也不同。常采用的矿物检索方法是吸收峰位匹配法,该方法适合混合矿物光谱检索。峰位匹配的依据是标准数据库,提出了分类数据库检索法,即根据矿物类型的不同,把标准数据库分为泥化蚀变矿物库、斑岩型蚀变矿物库、绢云母化蚀变矿物库等子数据库,根据样品图像及所处地质环境判断,选择合适的子数据库进行检索分析。文中进行两个实验,分别使用标准数据库和分类数据库分析同一样品,其分析结果表明准确率后者更高;使用标准数据库和分类数据库对同一批样品(141个样品)进行处理,用时分别是231和44 s。实验证明:分类数据库法不仅可以提高检索的准确度,还能大大加快检索速度,是准确、快速检索海量数据的有效方法。该方法是光谱检索中新颖、独特、有效的方法,是本文的创新之处。矿物光谱含有丰富的信息,其特征峰的峰强度、峰强比、峰位移、半高宽和反射率分别反应矿物的相对含量、相对温度、阳离子交换情况、结晶度和颜色等信息,提取同一批矿物的这些信息,对比分析,可获得成矿模型,揭示成矿规律。以安徽宣城一个钻孔为例,对岩心光谱扫描仪的数据进行自动图像拼接、光谱分析和蚀变矿物填图。从蚀变矿物信息提取图分析看出,该地区是酸性、低温的地质环境,低温区岩石颜色较深,在低温区中间也有高岭石、蒙脱石,说明具有良好的储油环境。经实践证明,该方法不仅效率高,能节省大量人工工作量,还能得到高质量的岩心盘拼接图、岩心柱状拼接和蚀变矿物信息提取图,是地质工作者处理岩心数据实用、可靠的方法。 展开更多
关键词 岩心扫描 信息提取 图像拼接 数据处理 分类数据库
在线阅读 下载PDF
一种基于互联处理器网络的并行分类算法 被引量:1
11
作者 张冰 朱明程 《计算机应用》 CSCD 北大核心 2003年第7期9-12,共4页
文中提出一个IPBPS(InterconnectedProcessor BasedParallelSorting)并行分类算法,运行在由独立处理器构成的计算机网络上,以解决网络分布式数据库的分类计算问题。基于并行算法应与并行计算的拓扑结构相匹配的思想,设计了一种旨在减小... 文中提出一个IPBPS(InterconnectedProcessor BasedParallelSorting)并行分类算法,运行在由独立处理器构成的计算机网络上,以解决网络分布式数据库的分类计算问题。基于并行算法应与并行计算的拓扑结构相匹配的思想,设计了一种旨在减小处理器间通信开销的网络结构。在此并行计算环境中,每个处理器执行同样的程序,计算负载均匀分布在每个处理器中,具有较高的加速比。同时,这种基本的处理器互联结构可灵活扩展,且随着网络的扩大,算法的并行加速比更高。 展开更多
关键词 并行分类 分类算法 分布式数据库分类运算
在线阅读 下载PDF
结合位点进化距离与支持向量机的蛋白质分类方法 被引量:2
12
作者 李玉岗 张法 刘志勇 《计算机学报》 EI CSCD 北大核心 2008年第1期43-50,共8页
生物信息学的一个关键的研究课题是理解细胞的分子机制,这依赖于对基因所决定的每一条蛋白质的含义或者功能的理解.一般通过与一条或多条功能已知的蛋白质的相似性比较来推测未知蛋白质的功能,其中,基于支持向量机的一些算法取得了很好... 生物信息学的一个关键的研究课题是理解细胞的分子机制,这依赖于对基因所决定的每一条蛋白质的含义或者功能的理解.一般通过与一条或多条功能已知的蛋白质的相似性比较来推测未知蛋白质的功能,其中,基于支持向量机的一些算法取得了很好的成果.SVM-pairwise算法是当前最好的基于支持向量机的算法中的一个,该方法利用两条序列的相似性来将蛋白质序列转化为固定长度的向量.文中提出了一种新的利用支持向量机算法对蛋白质序列进行分类的方法,这种方法使用位点进化距离代替两条序列的比对得分,该方法比SVM-pairwise有着显著的改善,在蛋白质结构分类数据库(SCOP)上进行的实验表明,该方法具有比SVM-pairwise更好的分类性能. 展开更多
关键词 生物信息学 内核 位点进化距离 支持向量机 蛋白质结构分类数据库
在线阅读 下载PDF
K近邻快速匹配的WiFi指纹定位方法 被引量:6
13
作者 罗宇锋 刘艳辉 王国东 《传感器与微系统》 CSCD 2018年第8期22-24,28,共4页
为解决室内Wi Fi指纹定位速度慢及定位波动大的问题,采用高斯拟合和多次测量取平均值的方法对接收的信号进行平滑处理;以距离为相似性测度,规定一个阈值对建立指纹数据库进行分类;改进K近邻算法,并在分类的基础上实现K近邻快速匹配。实... 为解决室内Wi Fi指纹定位速度慢及定位波动大的问题,采用高斯拟合和多次测量取平均值的方法对接收的信号进行平滑处理;以距离为相似性测度,规定一个阈值对建立指纹数据库进行分类;改进K近邻算法,并在分类的基础上实现K近邻快速匹配。实验结果表明:经过分类处理过的定位系统耗时有很大程度的改善,平均降幅62.8%;Wi Fi指纹定位精度的平均误差从4.17 m降到了2.12 m。 展开更多
关键词 高斯拟合 多次测量取平均值 数据库分类 K近邻快速匹配
在线阅读 下载PDF
地下管网信息管理系统架构探讨
14
作者 高建民 《档案管理》 北大核心 2012年第5期51-52,共2页
通过对国内外地下管网档案管理的现状和发展趋势研究,结合鹤壁市地下管网的现状,根据鹤壁市淇滨新区管线普查的实际情况,参照现有的国家标准和行业标准,对鹤壁市管线数据库分类与编码进行研究,制定鹤壁市地下管线信息系统的数据库... 通过对国内外地下管网档案管理的现状和发展趋势研究,结合鹤壁市地下管网的现状,根据鹤壁市淇滨新区管线普查的实际情况,参照现有的国家标准和行业标准,对鹤壁市管线数据库分类与编码进行研究,制定鹤壁市地下管线信息系统的数据库分类编码原则与方法,对地下管网档案数据库的建设进行了分析研究,为实现地下管线的科学管理提供基础信息。 展开更多
关键词 地下管网 系统架构 信息管理 数据库分类 地下管线 分类编码 原则与方法 档案数据库
在线阅读 下载PDF
基于网络模块性的蛋白质序列聚类 被引量:5
15
作者 梅娟 何胜 +2 位作者 王正祥 石贵阳 李炜疆 《食品与生物技术学报》 CAS CSCD 北大核心 2010年第1期123-127,共5页
蛋白质的远同源性探测是结构基因组学和功能基因组学的主要研究任务之一。一些具有一定相似结构和功能、但序列相似性却较低的蛋白质组成蛋白质超家族,则远同源性探测问题等价于对蛋白质超家族的识别问题。作者提出了一种基于模块性的... 蛋白质的远同源性探测是结构基因组学和功能基因组学的主要研究任务之一。一些具有一定相似结构和功能、但序列相似性却较低的蛋白质组成蛋白质超家族,则远同源性探测问题等价于对蛋白质超家族的识别问题。作者提出了一种基于模块性的聚类算法ModuleFind,该方法通过最大化蛋白质网络的模块性来寻找具有较强集团结构的划分。在蛋白质结构分类数据库(SCOP)超家族层次上进行的实验表明,该方法得到的聚类结果更接近分类基准,且具有较高的F-测度值。 展开更多
关键词 蛋白质网络 序列相似性 远同源性 模块性 聚类 蛋白质结构分类数据库
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部