期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
26
篇文章
<
1
2
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
COM技术在Web数据收集和分析中的应用
被引量:
3
1
作者
程宝雷
李培峰
刁红军
《计算机工程》
CAS
CSCD
北大核心
2004年第19期180-182,共3页
描述了一个基于Web体系,采用COM、ActiveX和ASP等技术的数据收集和分析系统的实现原理,并介绍该系统的实现方案和办理流程,举例说明了部分技术要点。
关键词
WEB
ACTIVEX
ASP
COM
数据收集和分析
在线阅读
下载PDF
职称材料
多文种环境下汉字内码识别算法的研究
被引量:
16
2
作者
李培峰
朱巧明
钱培德
《中文信息学报》
CSCD
北大核心
2004年第2期73-79,共7页
汉字内码向ISO/IEC 10 6 46过渡是实现计算机用文字编码统一的必然趋势 ,但目前在一段时间内仍将存在多种汉字内码并存的情况 ,所以实现汉字内码的自动识别是保证汉字多内码并存的关键。本文主要探讨了如何在多内码并存的多文种环境中...
汉字内码向ISO/IEC 10 6 46过渡是实现计算机用文字编码统一的必然趋势 ,但目前在一段时间内仍将存在多种汉字内码并存的情况 ,所以实现汉字内码的自动识别是保证汉字多内码并存的关键。本文主要探讨了如何在多内码并存的多文种环境中实现汉字内码自动识别的问题 ,并提供了多种汉字内码识别算法 ,包括基于内码分布、标点符号特征、字频特征和语义特征的识别算法等。在此基础上 ,本文对不同的识别算法进行分析和评估。在对目标样本的测试中 ,以上算法的识别率最高可以达到 99 9%以上。
展开更多
关键词
计算机应用
中文信息处理
多文种环境
汉字内码
识别算法
在线阅读
下载PDF
职称材料
基于Web服务的校园信息化平台的设计和实现
被引量:
28
3
作者
李培峰
朱巧明
《计算机工程与设计》
CSCD
北大核心
2006年第19期3564-3567,共4页
数字化校园是高校信息化建设的发展方向。设计并实现了一个小型化的数字化校园方案——校园信息化平台,该平台以WebServices(Web服务)为信息集成的核心技术,可以集成学校现有的多种形式的信息系统,并为此提供了统一的数据中心、统一安...
数字化校园是高校信息化建设的发展方向。设计并实现了一个小型化的数字化校园方案——校园信息化平台,该平台以WebServices(Web服务)为信息集成的核心技术,可以集成学校现有的多种形式的信息系统,并为此提供了统一的数据中心、统一安全身份认证中心、统一用户权限管理中心和统一的用户界面。介绍了该校园信息化平台的模型以及系统的总体框架,并分析了实现该平台的一些关键技术。
展开更多
关键词
信息化平台模型
WEB服务
身份认证
应用集成
门户
在线阅读
下载PDF
职称材料
基于Web的大规模语料库构建方法
被引量:
8
4
作者
李培峰
朱巧明
钱培德
《计算机工程》
CAS
CSCD
北大核心
2008年第7期41-43,46,共4页
低成本、短周期构建大规模语料库是目前研究工作的难点之一。该文提出一种建设大规模语料库的新方法,主要解决如何基于Web构建大规模的语料库及对语料库纠错,从而提高其质量。该方法利用网格技术的大规模计算能力与Wiki的开放编辑环境...
低成本、短周期构建大规模语料库是目前研究工作的难点之一。该文提出一种建设大规模语料库的新方法,主要解决如何基于Web构建大规模的语料库及对语料库纠错,从而提高其质量。该方法利用网格技术的大规模计算能力与Wiki的开放编辑环境去收集和处理语料,根据可信度模型挑选出不可信的语料并由人工进行校对,计算校对后结果的可信度,选择出最可信的结果作为正确语料存储到语料库中。
展开更多
关键词
大规模语料库
网格
可信度
在线阅读
下载PDF
职称材料
基于统计和规则的未登录词识别方法研究
被引量:
21
5
作者
周蕾
朱巧明
《计算机工程》
CAS
CSCD
北大核心
2007年第8期196-198,共3页
介绍了一种基于统计和规则的未登录词识别方法。该方法分为2个步骤:(1)对文本进行分词,对分词结果中的碎片进行全切分生成临时词典,并利用规则和频度信息给临时词典中的每个字串赋权值,利用贪心算法获得每个碎片的最长路径,从而提取未...
介绍了一种基于统计和规则的未登录词识别方法。该方法分为2个步骤:(1)对文本进行分词,对分词结果中的碎片进行全切分生成临时词典,并利用规则和频度信息给临时词典中的每个字串赋权值,利用贪心算法获得每个碎片的最长路径,从而提取未登录词;(2)在上一步骤的基础上,建立二元模型,并结合互信息来提取由若干个词组合而成的未登录词(组)。实验证明该方法开放测试的准确率达到81.25%,召回率达到82.38%。
展开更多
关键词
未登录词识别
贪心算法
二元模型
互信息
在线阅读
下载PDF
职称材料
一种基于LDA模型的主题句抽取方法
被引量:
10
6
作者
王力
李培峰
朱巧明
《计算机工程与应用》
CSCD
2013年第2期160-164,257,共6页
在基于Web的主题关键词查询扩展,获取候选主题句的基础上,提出一种基于LDA模型的主题句抽取方法,以抽取粒度较细的主题信息,并增加主题信息的置信度。该方法通过多个侧面对目标主题的衬托,采用LDA模型对主题信息进行建模,利用各个主题...
在基于Web的主题关键词查询扩展,获取候选主题句的基础上,提出一种基于LDA模型的主题句抽取方法,以抽取粒度较细的主题信息,并增加主题信息的置信度。该方法通过多个侧面对目标主题的衬托,采用LDA模型对主题信息进行建模,利用各个主题概率分布的平滑度进行候选句的可信度计算来抽取主题句。在面向Web的主题句抽取的具体应用中,取得了较好的效果。
展开更多
关键词
隐含狄利克雷分配(LDA)
主题模型
主题句抽取
信息融合
在线阅读
下载PDF
职称材料
一个基于ISO/IEC10646的汉字输入模型
被引量:
4
7
作者
李培峰
朱巧明
钱培德
《中文信息学报》
CSCD
北大核心
2006年第5期91-96,共6页
计算机中各国文字编码的统一是必然趋势,而ISO/IEC 10646正是顺应这种趋势而诞生的一个国际标准。现有的输入法绝大多数是基于本地代码页(ANSI CODE),存在着移植困难、不能跨语言平台以及向国际化标准过渡困难等缺点。本文首先分析了现...
计算机中各国文字编码的统一是必然趋势,而ISO/IEC 10646正是顺应这种趋势而诞生的一个国际标准。现有的输入法绝大多数是基于本地代码页(ANSI CODE),存在着移植困难、不能跨语言平台以及向国际化标准过渡困难等缺点。本文首先分析了现有本地化输入法存在的问题,并在此基础上阐述了基于ISO10646的汉字输入法的实现方法,并给出了一个以ISO 10646为核心的通用汉字输入法模型和原理,该模型由输入法管理/服务器、ISO 10646输入码对照表、码本检索/过滤模块、输入法与OS接口模块、输入法内核和本地化接口六部分构成。最后,本文重点论述了输入法的核心—输入码对照表的设计和检索技术。
展开更多
关键词
算机应用
中文信息处理
输入法模型
ISO/IEC
10646
UNICODE
输入码对照表
在线阅读
下载PDF
职称材料
一个基于SOFM的柔性化审批应用方案的设计
被引量:
3
8
作者
韩月娟
赵雷
+1 位作者
吕强
杨季文
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第21期275-276,F0003,共3页
为了适应ERP系统中单据审批流转活动频繁变化的需求,该文提出了一种简单对象流转模型A Simple Object Flow Model(SOFM)并给出了SOFM的描述和特点,然后基于该模型成功地设计了一个柔性化的审批应用方案。该方案在多个ERP系统中得到了很...
为了适应ERP系统中单据审批流转活动频繁变化的需求,该文提出了一种简单对象流转模型A Simple Object Flow Model(SOFM)并给出了SOFM的描述和特点,然后基于该模型成功地设计了一个柔性化的审批应用方案。该方案在多个ERP系统中得到了很好的应用。
展开更多
关键词
审批
对象流转
柔性
在线阅读
下载PDF
职称材料
一个应用于手持设备的汉字通用输入模型
被引量:
3
9
作者
李培峰
朱巧明
钱培德
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第18期258-260,282,共4页
分析了现有汉字输入模型应用在手持设备时存在的缺点,提出了一个能适用于各种手持设备的汉字通用输入模型。该模型由通用引擎接口层、通用输入流处理层与通用数据处理接口层组成,其框架采用面向对象技术设计,能支持多种手持设备操作系统...
分析了现有汉字输入模型应用在手持设备时存在的缺点,提出了一个能适用于各种手持设备的汉字通用输入模型。该模型由通用引擎接口层、通用输入流处理层与通用数据处理接口层组成,其框架采用面向对象技术设计,能支持多种手持设备操作系统,并具有良好的通用性、透明性和可扩展性;介绍了模型各个层的功能以及具体的设计技术;说明了模型中各层之间的协作关系。
展开更多
关键词
汉字输入
输入模型
手持设备
层次结构
在线阅读
下载PDF
职称材料
面向信息服务的网格资源管理器的设计
被引量:
3
10
作者
李培峰
朱巧明
支丽艳
《计算机工程》
CAS
CSCD
北大核心
2008年第3期49-51,58,共4页
设计一个面向信息服务的网格资源管理器的架构,该架构分为全局和局部管理器。介绍一个新的作业调度算法,该算法的特点是根据历史作业执行时间来预测当前作业的执行时间,在调度时考虑作业执行时间和截止时间2个要素。试验证明该算法比目...
设计一个面向信息服务的网格资源管理器的架构,该架构分为全局和局部管理器。介绍一个新的作业调度算法,该算法的特点是根据历史作业执行时间来预测当前作业的执行时间,在调度时考虑作业执行时间和截止时间2个要素。试验证明该算法比目前常用的Max-Min和Min-Min算法具有更好的性能。
展开更多
关键词
资源管理器
网格
作业调度
执行时间预测
在线阅读
下载PDF
职称材料
基于指代消解的中文事件融合方法
被引量:
3
11
作者
许荣华
吴刚
+1 位作者
李培峰
朱巧明
《计算机应用》
CSCD
北大核心
2009年第8期2264-2267,共4页
事件抽取是信息抽取领域的一个重要的研究方向。针对事件抽取获得的信息不完整和语义不明确的特点,在此基础上引入指代消解和信息融合理论,通过事件元素归一化和互指事件的合并,在数据和特征两个层次上对事件信息进行融合,进一步明确和...
事件抽取是信息抽取领域的一个重要的研究方向。针对事件抽取获得的信息不完整和语义不明确的特点,在此基础上引入指代消解和信息融合理论,通过事件元素归一化和互指事件的合并,在数据和特征两个层次上对事件信息进行融合,进一步明确和完善事件信息,并在不损失信息的情况下精简整个信息系统的信息量。在裁员事件的融合实验中正确率达到86.9%。
展开更多
关键词
信息融合
事件抽取
指代消解
信息抽取
在线阅读
下载PDF
职称材料
汉字编码输入法动态评测系统的设计和实现
被引量:
3
12
作者
张玉华
杨季文
周克兰
《计算机工程与应用》
CSCD
北大核心
2006年第25期93-97,共5页
论文首先介绍了汉字编码输入法的现状以及通用要求标准,提出了对汉字编码输入法进行科学评测的重要性和意义,描述了输入法动态评测系统的方法,指出了影响动态评测结果的因素,描述了系统的主要功能,详细介绍了动态评测子系统的设计和实...
论文首先介绍了汉字编码输入法的现状以及通用要求标准,提出了对汉字编码输入法进行科学评测的重要性和意义,描述了输入法动态评测系统的方法,指出了影响动态评测结果的因素,描述了系统的主要功能,详细介绍了动态评测子系统的设计和实现过程,并给出了详实的测试数据。介绍的汉字输入法评测系统,可以作为探讨国家有关标准和规范的辅助工具。对汉字编码发明者和输入系统设计人员而言,该评测系统有很高的使用价值,对建立科学的输入法评价体系而言,该评测系统也有十分积极的意义。
展开更多
关键词
汉字输入法
汉字编码方案
输入法动态评测
码本
在线阅读
下载PDF
职称材料
面向多客体的细粒度RBAC模型及应用
被引量:
5
13
作者
孔芳
朱巧明
《计算机工程》
CAS
CSCD
北大核心
2008年第11期29-31,34,共4页
从综合信息管理系统以及软件系统集成的需求出发,分析了NIST RBAC模型的局限性,在此基础上对其模型进行扩充,提出ERBAC模型。该模型适用于多种客体且具体客体不确定的情况。文章还给出了ERBAC模型的具体定义和应用实例。
关键词
细粒度
多客体
访问控制
综合信息系统
在线阅读
下载PDF
职称材料
Linux中文输入法服务器的分析和设计
被引量:
2
14
作者
李培峰
朱巧明
钱培德
《计算机工程与应用》
CSCD
北大核心
2005年第33期118-121,205,共5页
论文首先分析了设计Linux汉字输入法服务器的标准XIM协议及其处理流程。并在此基础上介绍了一个在Linux图形环境下,基于XIM协议的中文输入法服务器ZHInput的数据结构、组成和总体构架。最后简单描述了这个服务器和输入法之间的通信机制。
关键词
输入法
输入法服务器
XIM协议
ZHInput
代码页
在线阅读
下载PDF
职称材料
基于规则库的汉字输入法自动评测系统的设计
被引量:
5
15
作者
张玉华
周克兰
《中文信息学报》
CSCD
北大核心
2004年第4期50-54,共5页
汉字编码输入法是汉字输入电脑的主要方式。对输入法进行科学评价 ,从而帮助软件开发人员和输入法用户进行自我改进或评估 ,有其十分积极的意义。本文在实际应用基础上 ,提出了通过汉字输入系统输入规则库的建立 ,在选定的输入法状态下 ...
汉字编码输入法是汉字输入电脑的主要方式。对输入法进行科学评价 ,从而帮助软件开发人员和输入法用户进行自我改进或评估 ,有其十分积极的意义。本文在实际应用基础上 ,提出了通过汉字输入系统输入规则库的建立 ,在选定的输入法状态下 ,通过计算机自动模拟汉字输入得到输入法码本 。
展开更多
关键词
计算机应用
中文信息处理
码本
规则库
自动评测系统
在线阅读
下载PDF
职称材料
一个面向公众的药品价格Web信息系统的设计与实现
被引量:
2
16
作者
吴宏杰
李培峰
杨季文
《计算机应用与软件》
CSCD
北大核心
2004年第9期63-64,71,共3页
本文以《苏州药品价格Web信息系统》为例 ,介绍了一个用于药品价格信息发布的Web信息系统 ,以及与之相对应的系统结构。
关键词
软件设计
药品价格
WEB
信息系统
药品名称
《苏州药品价格Web信息系统》
在线阅读
下载PDF
职称材料
数据迁移工具的设计研究
被引量:
4
17
作者
孔芳
徐汀荣
《计算机应用与软件》
CSCD
北大核心
2005年第2期133-135,共3页
数据迁移就是将数据从一种数据环境移入另一种数据环境中。它不仅仅是简单的数据搬家 ,还涉及到数据格式的转换。本文介绍了在Microsoft公司UDA技术基础上 ,利用SQL语句完成常用数据库数据间迁移的设计和实现流程。这一完整的数据流程...
数据迁移就是将数据从一种数据环境移入另一种数据环境中。它不仅仅是简单的数据搬家 ,还涉及到数据格式的转换。本文介绍了在Microsoft公司UDA技术基础上 ,利用SQL语句完成常用数据库数据间迁移的设计和实现流程。这一完整的数据流程如果定期发生 ,就可以频繁到实时数据转换或不频繁地每月为数据仓库进行更新 ,因此对于数据仓库的建立 ,以及后续的数据挖掘都有相当的实际价值 ,同时对于实用的应用程序更新也具有一定意义。
展开更多
关键词
数据库
数据迁移工具
数据仓库
数据挖掘
计算机
在线阅读
下载PDF
职称材料
一个基于多代码页的中文屏幕实时解释引擎的设计
被引量:
2
18
作者
李培峰
朱巧明
钱培德
《中文信息学报》
CSCD
北大核心
2005年第5期90-96,共7页
目前,在计算机中汉字有多种代码页,汉字的多代码页并存现象将长期存在。为了实现汉字多代码页并存,需要汉字代码页自动识别技术的支撑。屏幕实时解释引擎是目前各种在线字典、词典以及教学软件的核心技术,此技术目前存在不能跨代码页,...
目前,在计算机中汉字有多种代码页,汉字的多代码页并存现象将长期存在。为了实现汉字多代码页并存,需要汉字代码页自动识别技术的支撑。屏幕实时解释引擎是目前各种在线字典、词典以及教学软件的核心技术,此技术目前存在不能跨代码页,取词不全面、不正确等缺陷。本文主要针对以上情况,描述了采用汉字内码的代码页自动识别技术以及优化的自动屏幕取词技术的中文屏幕实时解释引擎的系统架构,并阐述了数据词典的设计以及在设计中采用的关键技术。对五百万汉字样本的测试中,应用此引擎的在线词典对有意义短字符串(不包括单字)代码页的识别率可以达到99%以上。
展开更多
关键词
计算机应用
中文信息处理
汉字代码页自动识别
屏幕取词
ISO10646
在线阅读
下载PDF
职称材料
一个多文种语言Ontology框架的构建方法
被引量:
1
19
作者
李培峰
朱巧明
钱培德
《计算机应用》
CSCD
北大核心
2007年第3期646-649,652,共5页
对语言Ontology进行了研究,提出了一个面向多文种信息处理的语言Ontology,给出了其设计思想、定义和推理机制,还描述了其结构和构建方法。该Ontology采用分层的树形结构,收录了具有语义的四类词:名词、动词、副词和形容词,并以词义和文...
对语言Ontology进行了研究,提出了一个面向多文种信息处理的语言Ontology,给出了其设计思想、定义和推理机制,还描述了其结构和构建方法。该Ontology采用分层的树形结构,收录了具有语义的四类词:名词、动词、副词和形容词,并以词义和文种为类节点、词为叶子节点进行组织。能表示各个文种词汇的语义,并以语义为轴心进行融合,以提供不同文种间词汇的转换关系。另外,还提供了词汇语义相似度计算方法以及推理机制来对语义进行推理。
展开更多
关键词
本体
多文种信息
推理机制
语义
相似度
在线阅读
下载PDF
职称材料
一种基于统计和规则的未登录词识别方法
被引量:
1
20
作者
周蕾
朱巧明
李培峰
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2005年第z1期819-825,共7页
介绍一种基于统计和规则的未登录词识别方法.该方法从网上下载新闻语料构筑语料库用于未登录词识别,识别过程分碎片分词识别和词结合提取识别两个步骤.该方法在开放测试时的准确率为81.25%,召回率达到82.38%.
关键词
未登录词识别
贪心算法
二元模型
互信息
在线阅读
下载PDF
职称材料
题名
COM技术在Web数据收集和分析中的应用
被引量:
3
1
作者
程宝雷
李培峰
刁红军
机构
苏州大学计算机科学和技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2004年第19期180-182,共3页
文摘
描述了一个基于Web体系,采用COM、ActiveX和ASP等技术的数据收集和分析系统的实现原理,并介绍该系统的实现方案和办理流程,举例说明了部分技术要点。
关键词
WEB
ACTIVEX
ASP
COM
数据收集和分析
Keywords
Web
ActiveX
ASP
COM
Data collection and analysis
分类号
TP316.7 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
多文种环境下汉字内码识别算法的研究
被引量:
16
2
作者
李培峰
朱巧明
钱培德
机构
苏州大学计算机科学和技术学院
出处
《中文信息学报》
CSCD
北大核心
2004年第2期73-79,共7页
基金
江苏省高校自然科学基金项目资助 (0 1kjb5 2 0 0 0 1)
文摘
汉字内码向ISO/IEC 10 6 46过渡是实现计算机用文字编码统一的必然趋势 ,但目前在一段时间内仍将存在多种汉字内码并存的情况 ,所以实现汉字内码的自动识别是保证汉字多内码并存的关键。本文主要探讨了如何在多内码并存的多文种环境中实现汉字内码自动识别的问题 ,并提供了多种汉字内码识别算法 ,包括基于内码分布、标点符号特征、字频特征和语义特征的识别算法等。在此基础上 ,本文对不同的识别算法进行分析和评估。在对目标样本的测试中 ,以上算法的识别率最高可以达到 99 9%以上。
关键词
计算机应用
中文信息处理
多文种环境
汉字内码
识别算法
Keywords
computer application
Chinese information processing
multi-lingual environment
han character internal code
recognition algorithm
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于Web服务的校园信息化平台的设计和实现
被引量:
28
3
作者
李培峰
朱巧明
机构
苏州大学计算机科学和技术学院
出处
《计算机工程与设计》
CSCD
北大核心
2006年第19期3564-3567,共4页
基金
江苏省高技术研究基金项目(BG2005020)
江苏省教育厅自然基金项目(04KKB320134)
文摘
数字化校园是高校信息化建设的发展方向。设计并实现了一个小型化的数字化校园方案——校园信息化平台,该平台以WebServices(Web服务)为信息集成的核心技术,可以集成学校现有的多种形式的信息系统,并为此提供了统一的数据中心、统一安全身份认证中心、统一用户权限管理中心和统一的用户界面。介绍了该校园信息化平台的模型以及系统的总体框架,并分析了实现该平台的一些关键技术。
关键词
信息化平台模型
WEB服务
身份认证
应用集成
门户
Keywords
model of information platform
web services
identification
application integration
portal
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于Web的大规模语料库构建方法
被引量:
8
4
作者
李培峰
朱巧明
钱培德
机构
苏州大学计算机科学和技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第7期41-43,46,共4页
基金
国家自然科学基金资助项目(60673041)
江苏省高技术研究基金资助项目(BG2005020)
江苏省自然科学基金资助项目(BK2003030)
文摘
低成本、短周期构建大规模语料库是目前研究工作的难点之一。该文提出一种建设大规模语料库的新方法,主要解决如何基于Web构建大规模的语料库及对语料库纠错,从而提高其质量。该方法利用网格技术的大规模计算能力与Wiki的开放编辑环境去收集和处理语料,根据可信度模型挑选出不可信的语料并由人工进行校对,计算校对后结果的可信度,选择出最可信的结果作为正确语料存储到语料库中。
关键词
大规模语料库
网格
可信度
Keywords
large scale corpus
grid
trustworthiness
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于统计和规则的未登录词识别方法研究
被引量:
21
5
作者
周蕾
朱巧明
机构
常熟理工
学院
计算机
科学
与工程系
苏州大学计算机科学和技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第8期196-198,共3页
基金
江苏省自然科学基金资助项目(BK2003030)
江苏省教育厅自然科学基金资助项目(04KKB320134)
文摘
介绍了一种基于统计和规则的未登录词识别方法。该方法分为2个步骤:(1)对文本进行分词,对分词结果中的碎片进行全切分生成临时词典,并利用规则和频度信息给临时词典中的每个字串赋权值,利用贪心算法获得每个碎片的最长路径,从而提取未登录词;(2)在上一步骤的基础上,建立二元模型,并结合互信息来提取由若干个词组合而成的未登录词(组)。实验证明该方法开放测试的准确率达到81.25%,召回率达到82.38%。
关键词
未登录词识别
贪心算法
二元模型
互信息
Keywords
Unknown Chinese words recognition
Greedy algorithm
Bi-gram model
Mutual information
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
一种基于LDA模型的主题句抽取方法
被引量:
10
6
作者
王力
李培峰
朱巧明
机构
苏州大学计算机科学和技术学院
江苏省
计算机
信息处理
技术
重点实验室
出处
《计算机工程与应用》
CSCD
2013年第2期160-164,257,共6页
基金
国家自然科学基金(No.90920004
No.60970056
+2 种基金
No.61070123
No.61003153)
江苏省高校自然科学重大基础研究项目(No.08KJA520002)
文摘
在基于Web的主题关键词查询扩展,获取候选主题句的基础上,提出一种基于LDA模型的主题句抽取方法,以抽取粒度较细的主题信息,并增加主题信息的置信度。该方法通过多个侧面对目标主题的衬托,采用LDA模型对主题信息进行建模,利用各个主题概率分布的平滑度进行候选句的可信度计算来抽取主题句。在面向Web的主题句抽取的具体应用中,取得了较好的效果。
关键词
隐含狄利克雷分配(LDA)
主题模型
主题句抽取
信息融合
Keywords
Latent Dirichlet Allocation (LDA)
topic model
topical sentence extraction
information fusion
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一个基于ISO/IEC10646的汉字输入模型
被引量:
4
7
作者
李培峰
朱巧明
钱培德
机构
苏州大学计算机科学和技术学院
出处
《中文信息学报》
CSCD
北大核心
2006年第5期91-96,共6页
基金
江苏省高技术研究资助项目(BG2005020)
江苏省教育厅自然基金资助项目(04KKB320134)
文摘
计算机中各国文字编码的统一是必然趋势,而ISO/IEC 10646正是顺应这种趋势而诞生的一个国际标准。现有的输入法绝大多数是基于本地代码页(ANSI CODE),存在着移植困难、不能跨语言平台以及向国际化标准过渡困难等缺点。本文首先分析了现有本地化输入法存在的问题,并在此基础上阐述了基于ISO10646的汉字输入法的实现方法,并给出了一个以ISO 10646为核心的通用汉字输入法模型和原理,该模型由输入法管理/服务器、ISO 10646输入码对照表、码本检索/过滤模块、输入法与OS接口模块、输入法内核和本地化接口六部分构成。最后,本文重点论述了输入法的核心—输入码对照表的设计和检索技术。
关键词
算机应用
中文信息处理
输入法模型
ISO/IEC
10646
UNICODE
输入码对照表
Keywords
computer application
Chinese information processing
Chinese character input model
ISO/IEC 10646
Unicode
input codes-Chinese characters mapping table
分类号
TP316.7 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
一个基于SOFM的柔性化审批应用方案的设计
被引量:
3
8
作者
韩月娟
赵雷
吕强
杨季文
机构
苏州大学计算机科学和技术学院
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第21期275-276,F0003,共3页
基金
江苏省高校指导性基金资助项目"支持工作流系统动态变化的柔性及自适应技术研究"(Q2118042)
文摘
为了适应ERP系统中单据审批流转活动频繁变化的需求,该文提出了一种简单对象流转模型A Simple Object Flow Model(SOFM)并给出了SOFM的描述和特点,然后基于该模型成功地设计了一个柔性化的审批应用方案。该方案在多个ERP系统中得到了很好的应用。
关键词
审批
对象流转
柔性
Keywords
Examination and approval
Object flow
Flexibility
分类号
TP311.52 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
一个应用于手持设备的汉字通用输入模型
被引量:
3
9
作者
李培峰
朱巧明
钱培德
机构
苏州大学计算机科学和技术学院
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第18期258-260,282,共4页
基金
江苏省自然科学基金资助项目(BK2003030)
江苏省高技术研究基金资助项目(BG2005020)
江苏省教育厅自然科学基金资助项目(04KKB320134)
文摘
分析了现有汉字输入模型应用在手持设备时存在的缺点,提出了一个能适用于各种手持设备的汉字通用输入模型。该模型由通用引擎接口层、通用输入流处理层与通用数据处理接口层组成,其框架采用面向对象技术设计,能支持多种手持设备操作系统,并具有良好的通用性、透明性和可扩展性;介绍了模型各个层的功能以及具体的设计技术;说明了模型中各层之间的协作关系。
关键词
汉字输入
输入模型
手持设备
层次结构
Keywords
Chinese characters input
Input model
Handheld devices
Hierarchy
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
面向信息服务的网格资源管理器的设计
被引量:
3
10
作者
李培峰
朱巧明
支丽艳
机构
苏州大学计算机科学和技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第3期49-51,58,共4页
基金
国家自然科学基金资助项目(60673041)
江苏省高技术研究基金资助项目(BG2005020)
文摘
设计一个面向信息服务的网格资源管理器的架构,该架构分为全局和局部管理器。介绍一个新的作业调度算法,该算法的特点是根据历史作业执行时间来预测当前作业的执行时间,在调度时考虑作业执行时间和截止时间2个要素。试验证明该算法比目前常用的Max-Min和Min-Min算法具有更好的性能。
关键词
资源管理器
网格
作业调度
执行时间预测
Keywords
resource management system
grid
job scheduling
running time prediction
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于指代消解的中文事件融合方法
被引量:
3
11
作者
许荣华
吴刚
李培峰
朱巧明
机构
苏州大学计算机科学和技术学院
江苏省
计算机
信息处理
技术
重点实验室
出处
《计算机应用》
CSCD
北大核心
2009年第8期2264-2267,共4页
基金
国家自然科学基金资助项目(60673041)
国家863计划项目(2006AA01Z147)
文摘
事件抽取是信息抽取领域的一个重要的研究方向。针对事件抽取获得的信息不完整和语义不明确的特点,在此基础上引入指代消解和信息融合理论,通过事件元素归一化和互指事件的合并,在数据和特征两个层次上对事件信息进行融合,进一步明确和完善事件信息,并在不损失信息的情况下精简整个信息系统的信息量。在裁员事件的融合实验中正确率达到86.9%。
关键词
信息融合
事件抽取
指代消解
信息抽取
Keywords
information fusion
event extraction
co-reference resolution
information extraction
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
汉字编码输入法动态评测系统的设计和实现
被引量:
3
12
作者
张玉华
杨季文
周克兰
机构
苏州大学计算机科学和技术学院
出处
《计算机工程与应用》
CSCD
北大核心
2006年第25期93-97,共5页
文摘
论文首先介绍了汉字编码输入法的现状以及通用要求标准,提出了对汉字编码输入法进行科学评测的重要性和意义,描述了输入法动态评测系统的方法,指出了影响动态评测结果的因素,描述了系统的主要功能,详细介绍了动态评测子系统的设计和实现过程,并给出了详实的测试数据。介绍的汉字输入法评测系统,可以作为探讨国家有关标准和规范的辅助工具。对汉字编码发明者和输入系统设计人员而言,该评测系统有很高的使用价值,对建立科学的输入法评价体系而言,该评测系统也有十分积极的意义。
关键词
汉字输入法
汉字编码方案
输入法动态评测
码本
Keywords
Chinese character input method, Chinese character coding scheme,input method dynamic evaluating system,code chart
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
面向多客体的细粒度RBAC模型及应用
被引量:
5
13
作者
孔芳
朱巧明
机构
苏州大学计算机科学和技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第11期29-31,34,共4页
基金
国家“863”计划基金资助项目(2006AA01Z147)
国家自然科学基金资助项目(60673041)
文摘
从综合信息管理系统以及软件系统集成的需求出发,分析了NIST RBAC模型的局限性,在此基础上对其模型进行扩充,提出ERBAC模型。该模型适用于多种客体且具体客体不确定的情况。文章还给出了ERBAC模型的具体定义和应用实例。
关键词
细粒度
多客体
访问控制
综合信息系统
Keywords
fine grain
multi-object
access control
comprehensive information management system
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
Linux中文输入法服务器的分析和设计
被引量:
2
14
作者
李培峰
朱巧明
钱培德
机构
苏州大学计算机科学和技术学院
出处
《计算机工程与应用》
CSCD
北大核心
2005年第33期118-121,205,共5页
文摘
论文首先分析了设计Linux汉字输入法服务器的标准XIM协议及其处理流程。并在此基础上介绍了一个在Linux图形环境下,基于XIM协议的中文输入法服务器ZHInput的数据结构、组成和总体构架。最后简单描述了这个服务器和输入法之间的通信机制。
关键词
输入法
输入法服务器
XIM协议
ZHInput
代码页
Keywords
input method,input method server,XIM,ZHInput,code pages
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于规则库的汉字输入法自动评测系统的设计
被引量:
5
15
作者
张玉华
周克兰
机构
苏州大学计算机科学和技术学院
出处
《中文信息学报》
CSCD
北大核心
2004年第4期50-54,共5页
文摘
汉字编码输入法是汉字输入电脑的主要方式。对输入法进行科学评价 ,从而帮助软件开发人员和输入法用户进行自我改进或评估 ,有其十分积极的意义。本文在实际应用基础上 ,提出了通过汉字输入系统输入规则库的建立 ,在选定的输入法状态下 ,通过计算机自动模拟汉字输入得到输入法码本 。
关键词
计算机应用
中文信息处理
码本
规则库
自动评测系统
Keywords
computer application
Chinese information processing
code chart
rule-base lib
auto evaluating system
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一个面向公众的药品价格Web信息系统的设计与实现
被引量:
2
16
作者
吴宏杰
李培峰
杨季文
机构
苏州大学计算机科学和技术学院
出处
《计算机应用与软件》
CSCD
北大核心
2004年第9期63-64,71,共3页
文摘
本文以《苏州药品价格Web信息系统》为例 ,介绍了一个用于药品价格信息发布的Web信息系统 ,以及与之相对应的系统结构。
关键词
软件设计
药品价格
WEB
信息系统
药品名称
《苏州药品价格Web信息系统》
Keywords
Web services J2EE JSP JavaBeans WIS Medicine price
分类号
TP311.1 [自动化与计算机技术—计算机软件与理论]
F407.7 [经济管理—产业经济]
在线阅读
下载PDF
职称材料
题名
数据迁移工具的设计研究
被引量:
4
17
作者
孔芳
徐汀荣
机构
苏州大学计算机科学和技术学院
出处
《计算机应用与软件》
CSCD
北大核心
2005年第2期133-135,共3页
文摘
数据迁移就是将数据从一种数据环境移入另一种数据环境中。它不仅仅是简单的数据搬家 ,还涉及到数据格式的转换。本文介绍了在Microsoft公司UDA技术基础上 ,利用SQL语句完成常用数据库数据间迁移的设计和实现流程。这一完整的数据流程如果定期发生 ,就可以频繁到实时数据转换或不频繁地每月为数据仓库进行更新 ,因此对于数据仓库的建立 ,以及后续的数据挖掘都有相当的实际价值 ,同时对于实用的应用程序更新也具有一定意义。
关键词
数据库
数据迁移工具
数据仓库
数据挖掘
计算机
Keywords
Data migration Meta data Data warehouse Data mining Universal data access
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
一个基于多代码页的中文屏幕实时解释引擎的设计
被引量:
2
18
作者
李培峰
朱巧明
钱培德
机构
苏州大学计算机科学和技术学院
出处
《中文信息学报》
CSCD
北大核心
2005年第5期90-96,共7页
基金
江苏省高校自然科学基金资助项目(01kjb520001
04KKB320134)
文摘
目前,在计算机中汉字有多种代码页,汉字的多代码页并存现象将长期存在。为了实现汉字多代码页并存,需要汉字代码页自动识别技术的支撑。屏幕实时解释引擎是目前各种在线字典、词典以及教学软件的核心技术,此技术目前存在不能跨代码页,取词不全面、不正确等缺陷。本文主要针对以上情况,描述了采用汉字内码的代码页自动识别技术以及优化的自动屏幕取词技术的中文屏幕实时解释引擎的系统架构,并阐述了数据词典的设计以及在设计中采用的关键技术。对五百万汉字样本的测试中,应用此引擎的在线词典对有意义短字符串(不包括单字)代码页的识别率可以达到99%以上。
关键词
计算机应用
中文信息处理
汉字代码页自动识别
屏幕取词
ISO10646
Keywords
computer application
Chinese information processing
Chinese character code pages auto recognition
capturing words from screen
ISO10646
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一个多文种语言Ontology框架的构建方法
被引量:
1
19
作者
李培峰
朱巧明
钱培德
机构
苏州大学计算机科学和技术学院
出处
《计算机应用》
CSCD
北大核心
2007年第3期646-649,652,共5页
基金
江苏省高技术研究项目(BG2005020)
江苏省教育厅自然基金资助项目(04KKB320134)
文摘
对语言Ontology进行了研究,提出了一个面向多文种信息处理的语言Ontology,给出了其设计思想、定义和推理机制,还描述了其结构和构建方法。该Ontology采用分层的树形结构,收录了具有语义的四类词:名词、动词、副词和形容词,并以词义和文种为类节点、词为叶子节点进行组织。能表示各个文种词汇的语义,并以语义为轴心进行融合,以提供不同文种间词汇的转换关系。另外,还提供了词汇语义相似度计算方法以及推理机制来对语义进行推理。
关键词
本体
多文种信息
推理机制
语义
相似度
Keywords
Ontology
multilingual information
reasoning mechanism
semantics
similarity measure
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
TP182 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
一种基于统计和规则的未登录词识别方法
被引量:
1
20
作者
周蕾
朱巧明
李培峰
机构
苏州大学计算机科学和技术学院
出处
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2005年第z1期819-825,共7页
基金
江苏省高技术研究项目(BG2005020),江苏省教育厅自然基金(04KKB320134)
文摘
介绍一种基于统计和规则的未登录词识别方法.该方法从网上下载新闻语料构筑语料库用于未登录词识别,识别过程分碎片分词识别和词结合提取识别两个步骤.该方法在开放测试时的准确率为81.25%,召回率达到82.38%.
关键词
未登录词识别
贪心算法
二元模型
互信息
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
COM技术在Web数据收集和分析中的应用
程宝雷
李培峰
刁红军
《计算机工程》
CAS
CSCD
北大核心
2004
3
在线阅读
下载PDF
职称材料
2
多文种环境下汉字内码识别算法的研究
李培峰
朱巧明
钱培德
《中文信息学报》
CSCD
北大核心
2004
16
在线阅读
下载PDF
职称材料
3
基于Web服务的校园信息化平台的设计和实现
李培峰
朱巧明
《计算机工程与设计》
CSCD
北大核心
2006
28
在线阅读
下载PDF
职称材料
4
基于Web的大规模语料库构建方法
李培峰
朱巧明
钱培德
《计算机工程》
CAS
CSCD
北大核心
2008
8
在线阅读
下载PDF
职称材料
5
基于统计和规则的未登录词识别方法研究
周蕾
朱巧明
《计算机工程》
CAS
CSCD
北大核心
2007
21
在线阅读
下载PDF
职称材料
6
一种基于LDA模型的主题句抽取方法
王力
李培峰
朱巧明
《计算机工程与应用》
CSCD
2013
10
在线阅读
下载PDF
职称材料
7
一个基于ISO/IEC10646的汉字输入模型
李培峰
朱巧明
钱培德
《中文信息学报》
CSCD
北大核心
2006
4
在线阅读
下载PDF
职称材料
8
一个基于SOFM的柔性化审批应用方案的设计
韩月娟
赵雷
吕强
杨季文
《计算机工程》
EI
CAS
CSCD
北大核心
2006
3
在线阅读
下载PDF
职称材料
9
一个应用于手持设备的汉字通用输入模型
李培峰
朱巧明
钱培德
《计算机工程》
EI
CAS
CSCD
北大核心
2006
3
在线阅读
下载PDF
职称材料
10
面向信息服务的网格资源管理器的设计
李培峰
朱巧明
支丽艳
《计算机工程》
CAS
CSCD
北大核心
2008
3
在线阅读
下载PDF
职称材料
11
基于指代消解的中文事件融合方法
许荣华
吴刚
李培峰
朱巧明
《计算机应用》
CSCD
北大核心
2009
3
在线阅读
下载PDF
职称材料
12
汉字编码输入法动态评测系统的设计和实现
张玉华
杨季文
周克兰
《计算机工程与应用》
CSCD
北大核心
2006
3
在线阅读
下载PDF
职称材料
13
面向多客体的细粒度RBAC模型及应用
孔芳
朱巧明
《计算机工程》
CAS
CSCD
北大核心
2008
5
在线阅读
下载PDF
职称材料
14
Linux中文输入法服务器的分析和设计
李培峰
朱巧明
钱培德
《计算机工程与应用》
CSCD
北大核心
2005
2
在线阅读
下载PDF
职称材料
15
基于规则库的汉字输入法自动评测系统的设计
张玉华
周克兰
《中文信息学报》
CSCD
北大核心
2004
5
在线阅读
下载PDF
职称材料
16
一个面向公众的药品价格Web信息系统的设计与实现
吴宏杰
李培峰
杨季文
《计算机应用与软件》
CSCD
北大核心
2004
2
在线阅读
下载PDF
职称材料
17
数据迁移工具的设计研究
孔芳
徐汀荣
《计算机应用与软件》
CSCD
北大核心
2005
4
在线阅读
下载PDF
职称材料
18
一个基于多代码页的中文屏幕实时解释引擎的设计
李培峰
朱巧明
钱培德
《中文信息学报》
CSCD
北大核心
2005
2
在线阅读
下载PDF
职称材料
19
一个多文种语言Ontology框架的构建方法
李培峰
朱巧明
钱培德
《计算机应用》
CSCD
北大核心
2007
1
在线阅读
下载PDF
职称材料
20
一种基于统计和规则的未登录词识别方法
周蕾
朱巧明
李培峰
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2005
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部