题名 图书馆智能化管理与决策支持系LIMDS
被引量:5
1
作者
胡运发
葛家翔
于玉
蒋瓅
朱立
刘耀东
钱放
机构
复旦大学计算机科学系
空军政治学院信息管理系
出处
《计算机工程》
CAS
CSCD
北大核心
1996年第S1期340-346,共7页
基金
国家863发展计划资助
863十周年成果展示项目
文摘
主要介绍用人工智能专家系统技术开发的LIMDS系统的构成、功能和主要特点,及其自动标引原理、分类技术、智能检索的原理和各种方法等.
关键词
图书馆管理
自动标引
智能检索
专家系统
分类号
TP399
[自动化与计算机技术—计算机应用技术]
题名 面向社区信息服务的一种新型信息服务模式i-bus
被引量:6
2
作者
胡运发
王法骥
竺亚
机构
复旦大学计算机科学系
上海市劳动和社会保障局信息中心
上海市社区服务中心
出处
《计算机工程》
CAS
CSCD
北大核心
2001年第1期80-83,共4页
基金
国家863项目课题!(863-Z06-01-7)
文摘
文章介绍了从面向城市社区信息服务需求出发,提出了一种新型的信息服务模式-城市信息直通车模式i-bus,它是一种信息资源分布,信息整合集中,以知识型信息服务为主的信息服务模型.文章还叙述相关的关键技术,与ICP、ISP、ASP的不同以及良开产业发展前景.
关键词
信息服务
知识型信息
信息服务模式
I-BUS
INTERNET
信息产业
Keywords
Information service
Knowledge information
KSP network station
Personalized consumption endpoint
分类号
F719
[经济管理—产业经济]
F49
[经济管理—产业经济]
题名 网络图书馆中系统集成与安全认证技术研究
3
作者
胡运发
汪保友
张锦
许爱华
周益群
胡金化
机构
复旦大学计算机科学系
出处
《小型微型计算机系统》
CSCD
北大核心
2002年第8期930-934,共5页
基金
国家 8 6 3计划智能计算机主题资助 (课题编号为 86 3-30 6 -ZT0 4-0 2 -2 )
文摘
数字图书馆是当前计算机界研究的一个热点 ,本文以“上海市高校网络图书馆”为背景 ,介绍网络图书馆中所采用的系统集成技术和安全认证技术 .首先从系统集成的角度看 ,我们的方案有两个优点 :一是不影响各高校图书馆现有系统的正常运行 ,保持原有系统的独立性 ,在此基础上实现往新系统平滑集成 ;二是面对现实存在的困难情况 ,在软硬件平台异构性的环境中 ,实现良好的互操作、开放性和可扩展性 .其次 ,面对 Internet中“信任 "这一错综复杂的问题 ,我们采用基于 PKI的安全认证技术 ,完成对用户公用密钥的信任和对用户的身份的确认 .
关键词
网络图书馆
系统集成
安全认证
数字图书馆
Keywords
digital Library
authentication
system integration
分类号
G250.78
[文化科学—图书馆学]
题名 差异度方法在CBR事例库组织中的应用
4
作者
胡运发
葛家翔
机构
复旦大学计算机系
出处
《软件学报》
EI
CSCD
北大核心
1997年第A00期274-280,共7页
文摘
如何针对CBR的特点,有效地组织事例库,提高管理效率,将是CBR系统的主要研究方向之一,多重索引、邻近值集等是较为常见的一种事例库的组织方式。但当事例库规模不断增大时,系统的知识与检索管管理的时空代价都随之增长。
关键词
CBR
差异度
事例库
人工智能
专家系统
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 图书馆智能化管理与辅助决策方法
5
作者
胡运发
葛家翔
机构
复旦大学计算机系
出处
《软件学报》
EI
CSCD
北大核心
1997年第A00期296-300,共5页
文摘
本文主要介绍大型图书馆智能化管理与辅助决策中有关自动标引原理,类比分类,智能检索等方法。
关键词
图书馆
智能化管理
决策支持系统
分类号
G251
[文化科学—图书馆学]
题名 逻辑语言中启发式控制
6
作者
胡运发
胡子昂
高洪奎
卢肇川
机构
长沙工学院
出处
《软件学报》
EI
CSCD
北大核心
1990年第4期14-23,共10页
文摘
本文论述从逻辑程序本身提取启发式控制信息,以克服由于逻辑语言系统中控制策略的机械性所带来的不完备性和低效性。具体地给出若干启发式控制规则,并证明了这些规则的正确性。运用这些控制规则可以大大地提高系统的运行效率或改善逻辑程序的语义性质。文章最后给出启发式WAM(记作HWAM),并且用实例说明HWAM比WAM更有效,更完善。
关键词
逻辑语言
启发式
控制信息
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
题名 GKD-PROLOG/VAX780系统设计
7
作者
胡运发
高洪奎
机构
国防科学技术大学计算机研究所
出处
《计算机研究与发展》
EI
CSCD
北大核心
1991年第3期13-16,共4页
文摘
本文介绍了GKD-PROLOG/VAX 780系统性能。它是一个实用的,有效的,可扩充的,可移植的,中西文、符号处理与图形处理兼容的系统,使用方便,时空效率较高(例如用国际上标准测试题证明GKD-PROLOG/VAX 780计算速度是Edinburgh 大学C-PROLOG 的1.25倍,是Waterloo 大学WUP-PROLOG 的两倍)。同时还简要地介绍了GKD-PROLOG/VAX 780系统所采用的先进的设计技术。
关键词
PROLOG语言
GKD-PROLOG
解释系统
分类号
TP314
[自动化与计算机技术—计算机软件与理论]
题名 知识程序设计语言的研究
8
作者
胡运发
陈火旺
机构
国防科技大学计算机系
出处
《计算机科学》
CSCD
北大核心
1990年第4期5-10,共6页
文摘
本文提出了知识程序设计语言概念,即有实际效率能进行知识推理的知识表示语言,它有统一的逻辑基础又有当前若干有代表性人工智能语言的本质特征。本文还给出一种知识程序设计语言的有关研究内容和实际取得的进展。
关键词
知识
程序设计语言
人工智能
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
题名 求解带等词的逻辑的目标类型驱动法
9
作者
胡运发
机构
长沙工学院计算机系
出处
《计算机学报》
EI
CSCD
北大核心
1990年第5期349-356,共8页
文摘
本文提出一种处理带等词的Horn逻辑的新方法——目标类型驱动法,它显式地把一致化操作看作目标,并且一致化操作并入归结过程之中。本方法的优点有:(1)把归结和一致化看作多类型目标的求解过程,减化了控制问题,可望提高系统的实现效率;(2)相应的推理机的系统结构,可以得到简化;(3)开发逻辑程序与或并行性的任何技术,同时可应用到一致化过程之中;(4)本方法可用来合成函数程序设计和逻辑程序设计;(5)本方法可用来处理无限数据结构。
关键词
带等词
HORN逻辑
目标类型驱动
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 人工智能语言、逻辑及发展趋势
10
作者
胡运发
机构
国防科技大学计算机研究所
出处
《计算机科学》
CSCD
北大核心
1989年第1期15-19,共5页
文摘
本文综述了人工智能语言发展历史,及其在人工智能研究中的地位和作用,说明了不同的人工智能语言对应于不同的逻辑系统。逻辑系统的性质决定了人工智能语言的基本特征,表达能力和执行效率。本文试图阐明人工智能语言的发展方向。
关键词
人工智能
人工智能语言
逻辑系统
分类号
TP11-1
[自动化与计算机技术—控制理论与控制工程]
题名 使用最大熵模型进行中文文本分类
被引量:98
11
作者
李荣陆
王建会
陈晓云
陶晓鹏
胡运发
机构
复旦大学计算机与信息技术系
出处
《计算机研究与发展》
EI
CSCD
北大核心
2005年第1期94-101,共8页
基金
国家自然科学基金项目(60173027)
文摘
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.由于最大熵模型可以综合观察到各种相关或不相关的概率知识,对许多问题的处理都可以达到较好的结果.但是,将最大熵模型应用在文本分类中的研究却非常少,而使用最大熵模型进行中文文本分类的研究尚未见到.使用最大熵模型进行了中文文本分类.通过实验比较和分析了不同的中文文本特征生成方法、不同的特征数目,以及在使用平滑技术的情况下,基于最大熵模型的分类器的分类性能.并且将其和Bayes,KNN,SVM三种典型的文本分类器进行了比较,结果显示它的分类性能胜于Bayes方法,与KNN和SVM方法相当,表明这是一种非常有前途的文本分类方法.
关键词
文本分类
最大熵模型
特征
N-GRAM
Keywords
text classification
maximum entropy model
features
N-Gram
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于分类规则树的频繁模式文本分类
被引量:19
12
作者
陈晓云
陈袆
王雷
李荣陆
胡运发
机构
复旦大学计算机与信息技术系
福州大学数学与计算机科学学院
出处
《软件学报》
EI
CSCD
北大核心
2006年第5期1017-1025,共9页
基金
国家自然科学基金
福建省教育厅科技基金~~
文摘
基于频繁模式的关联分类是近年来出现的一种分类方法,该方法利用各类别频繁出现的模式构造分类规则,并对新文本进行分类.但现有关联分类方法应用于文本分类时存在两方面不足:一方面,用以构造分类规则的频繁模式仅考虑特征词在文本中出现与否,从而忽视了出现频度;另一方面,当产生的规则数量较多时,为提高分类效率需要进行规则修剪,修剪后的分类准确性明显降低.为此,提出了基于分类规则树的带词频的频繁模式文本分类方法.研究结果表明,词频的引入可以提高关联分类的准确率;而采用分类规则树可使分类时间明显加快又确保不降低分类质量.这两方面的措施弥补了现有关联分类应用于文本分类的不足.与3种典型文本分类方法比较后发现,在低维特征空间中,关联分类的性能优于Bayes,kNN(knearestneighbor)和SVM(supportvectormachines),因此是一种很有应用前景的文本分类方法.
关键词
频繁模式
文本分类
词频
关联规则
分类规则
Keywords
frequent pattern
text categorization
term frequency
association rule
classification rule
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 一种基于密度的快速聚类算法
被引量:91
13
作者
周水庚
周傲英
曹晶
胡运发
机构
复旦大学计算机科学系
出处
《计算机研究与发展》
EI
CSCD
北大核心
2000年第11期1287-1292,共6页
基金
国家自然科学基金项目!(项目编号 6 97430 0 1)
国家教委博士点教育基金
文摘
聚类是数据挖掘领域中的一个重要研究方向 .聚类技术在统计数据分析、模式识别、图像处理等领域有广泛应用 .迄今为止人们提出了许多用于大规模数据库的聚类算法 .基于密度的聚类算法 DBSCAN就是一个典型代表 .以 DBSCAN为基础 ,提出了一种基于密度的快速聚类算法 .新算法以核心对象邻域中所有对象的代表对象为种子对象来扩展类 ,从而减少区域查询次数 ,降低 I/ O开销 ,实现快速聚类 .对二维空间数据测试表明 :快速算法能够有效地对大规模数据库进行聚类 ,速度上数倍于已有 DBSCAN算法 .
关键词
数据挖掘
聚类
密度
快速算法
数据库
Keywords
spatial database, data mining, clustering, density, fast algorithm, representative objects
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
题名 基于语义分析的倾向性文本过滤
被引量:35
14
作者
刘永丹
曾海泉
李荣陆
胡运发
机构
复旦大学计算机与信息技术系
出处
《通信学报》
EI
CSCD
北大核心
2004年第7期78-85,共8页
基金
国家自然科学基金资助项目(60173027)
文摘
采用基于统计的文本过滤技术对具有倾向性的文本进行过滤的效果并不理想,原因在于基于统计的方法忽略了文本中的语义约束,无法有效识别倾向性信息。本文提出一种基于语义分析的文本过滤技术,将文本中的语义关系加以考虑,能高效地识别和过滤倾向性文本信息。
关键词
人工智能
文本过滤
语义分析
自然语言处理
Keywords
artificial intelligence
text filtering
semantic analysis
natural language process
分类号
TP301
[自动化与计算机技术—计算机系统结构]
题名 图像拼接技术
被引量:24
15
作者
王俊杰
刘家茂
胡运发
于玉
机构
复旦大学计算机系
出处
《计算机科学》
CSCD
北大核心
2003年第6期141-144,150,共5页
文摘
Image mosaics have been an active area of research in the fields of computer vision,image processing and computer graphics in recent years. The automatic fast construcuon of unlinuted field of view,high-resolution image mosaics is a main research task of this area. According to the procedure of image mosaics,the paper introduces and discusses image acquisition,geometric corrections,image register and image blending in detail. In the last part of the paper,we make a discussion on some problems of research and point out the future research directions.
关键词
图像拼接
计算机图形学
计算机视觉
可视化场景
图像序列
图像获取
Keywords
Image mosaics,Image acquisition ,Geometric corrections, Image registration, Panoramic image mosaics, Image blending
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 一个无需词典支持和切词处理的中文文档分类系统
被引量:23
16
作者
周水庚
关佶红
胡运发
周傲英
机构
武汉大学软件工程国家重点实验室
武汉大学计算机学院
复旦大学计算机科学与工程系
出处
《计算机研究与发展》
EI
CSCD
北大核心
2001年第7期839-844,共6页
基金
中国博士后科学基金
国家"八六三"高技术研究发展计划基金项目(86 3-30 6 -ZT0 4-0 2 -2 )
国家自然科学基金 (6 0 0 0 30 16 )的
文摘
报道了一个无需词典支持和切词处理的中文文档分类系统 .其特点是利用 N - gram信息进行中文文档分类 ,使中文文档分类摆脱了对词典和切词处理的依赖 ,实现了中文文档分类的领域无关性和时间无关性 ;采用开放的体系结构使文档分类系统易于功能扩充和性能完善 .测试结果表明该系统具有令人满意的分类性能 .
关键词
中文文档分类系统
词典支持
切词处理
中文信息处理
INTERNET
Keywords
Chinese text categorization, N gram information, feature selection, Bayesian classification, k NN method
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
题名 全文检索模型综述
被引量:12
17
作者
申展
江宝林
陈祎
唐磊
胡运发
机构
复旦大学计算机与信息技术系
出处
《计算机科学》
CSCD
北大核心
2004年第5期61-64,共4页
基金
国家自然科学基金(60173027)
文摘
全文检索的应用导致了信息检索领域的一场革命,是文档数据库研究的核心。全文检索的首要问题是全文检索模型的选择。本文介绍了目前国内外主要的全文拴索模型,总结了全文检索模型的评价标准,按照此标准对各种模型进行了分析比较,并对全文检索模型构建中一些关键问题进行了分析。
关键词
信息检索
文档数据库
全文检索模型
倒排表
Pat-树
互关联后继树
位图
署名文件
Keywords
Full-text retrieval, Information retrieval, Inverted files, Pat-tree, ISTree
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 一种实用高效的文本分类算法
被引量:20
18
作者
王建会
王洪伟
申展
胡运发
机构
复旦大学计算机与信息技术系
同济大学经济与管理学院 上海
出处
《计算机研究与发展》
EI
CSCD
北大核心
2005年第1期85-93,共9页
基金
国家自然科学基金项目(60173027)
文摘
在模式识别研究领域已有的分类算法中,大多数都是基于向量空间模型的算法,其中使用范围最广的是kNN算法.但是,其中的大多数算法都因为计算复杂度太高而不适用于大规模的场合.而且,当训练样本集增大时都需要重新生成分类器,可扩展性差.为此,提出了互依赖和等效半径的概念,并将两者相结合,提出新的分类算法--基于互依赖和等效半径、易更新的分类算法SECTILE.SECTILE计算复杂度较低,而且扩展性能较好,适用于大规模场合.将SECTILE算法应用于中文文本分类,并与kNN算法和类中心向量法进行比较,结果表明,在提高分类精度的同时,SECTILE还可以大幅度提高分类速度,有利于对大规模信息样本进行实时在线的自动分类.
关键词
分类
等效半径
向量空间
互依赖
SECTILE
Keywords
classification
MD
ER
VSM
SECTILE
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 kNN文本分类器类偏斜问题的一种处理对策
被引量:33
19
作者
郝秀兰
陶晓鹏
徐和祥
胡运发
机构
复旦大学计算机与信息技术系
上海远程教育集团
出处
《计算机研究与发展》
EI
CSCD
北大核心
2009年第1期52-61,共10页
基金
国家自然科学基金重大项目(60736016)~~
文摘
类偏斜问题(class i mbalance problem)是数据挖掘领域的常见问题之一,人们提出了各种策略来处理这个问题.当训练样本存在类偏斜问题时,kNN分类器会将小类中的样本错分到大类,导致分类的宏F1指标下降.针对kNN存在的这个缺陷,提出了文本训练集的临界点(critical point,CP)的概念并对其性质进行了探讨,给出了求CP,CP的下近似值LA、上近似值UA的算法.之后,根据LA或UA及训练样本数对传统的kNN决策函数进行修改,这就是自适应的加权kNN文本分类.为了验证自适应的加权kNN文本分类的有效性,设计了2组实验进行对比:一组为不同的收缩因子间进行对比,可看做是与Tan的工作进行对比,同时用来证实在LA或UA上分类器的宏F1较好;另一组则是与随机重取样进行实验对比,其中,传统kNN方法作为对比的基线.实验表明,所提的自适应加权kNN文本分类优于随机重取样,使得宏F1指标明显上升.该方法有点类似于代价相关学习.
关键词
文本分类
KNN
类偏斜
文本训练集的临界点
权重调节
随机重取样
Keywords
text classification
kNN
class imbalance
critical point of the text training set
weight adjustment random re-sampling
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于Ngram信息的中文文档分类研究
被引量:23
20
作者
周水庚
关佶红
俞红奇
胡运发
机构
复旦大学计算机系
武汉大学计算机学院
出处
《中文信息学报》
CSCD
北大核心
2001年第1期34-39,共6页
基金
国家自然科学基金! ( 6993 30 10 )
国家 863计划 !( 863 -3 0 6-ZT0 4 -0 2 -2 )
文摘
传统文档分类系统都是基于文档的词属性 ,分类过程需要庞大的词典支持和复杂的切词处理。本文研究基于N gram信息的中文文档分类 ,使中文文档分类系统摆脱对词典和切词处理的依赖 ,从而实现中文文档分类的领域无关性和时间无关性。利用kNN分类方法 ,实现了一个基于N gram信息的中文文档分类系统。
关键词
N-GRAM信息
属性选择
KNN法
中文文档分类系统
领域无关性
时间无关性
Keywords
in the documents,which need dictionaries support and efficient segmentation procedures.This paper explores the problem of utilizing N gram information to categorize Chinese documents so that the classifiers can shake off the burden of large di
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]