期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于生命周期的Web服务合成架构研究
1
作者 杨丹 申德荣 《计算机科学》 CSCD 北大核心 2010年第4期128-131,共4页
Web服务合成使Web服务的重用和组装以及提供增值服务成为可能。提出一个完善、有效的Web服务合成系统架构对于Web服务合成的发展和研究有着重要作用。根据Web服务合成生命周期的3个阶段,提出和讨论了一个基于Web服务合成生命周期的系统... Web服务合成使Web服务的重用和组装以及提供增值服务成为可能。提出一个完善、有效的Web服务合成系统架构对于Web服务合成的发展和研究有着重要作用。根据Web服务合成生命周期的3个阶段,提出和讨论了一个基于Web服务合成生命周期的系统架构。该架构支持合成服务流程的建模、合成和执行调用。在建模阶段,使用可视化的流程定义器,经过图形解释器和定义语言文档解析后存入服务仓储。在合成阶段,考虑到异构问题引入基于本体的服务匹配器,还考虑到合成服务的服务质量(QoS)管理,因此使用基于多值背景值依赖的方法来查找符合用户偏好的服务。在执行阶段为了保证合成服务的正确执行,提供了监控器、异常处理器和事务适配器。 展开更多
关键词 WEB服务合成 生命周期 架构 服务质量
在线阅读 下载PDF
基于句法结构特征分析及分类技术的答案提取算法 被引量:24
2
作者 胡宝顺 王大玲 +1 位作者 于戈 马婷 《计算机学报》 EI CSCD 北大核心 2008年第4期662-676,共15页
由于中文自然语言处理的特点和困难以及相应的语言处理基础资源的相对缺乏,使得国外一些成熟技术和研究成果不能直接应用到中文问答系统中.为此,针对中文事实型问答系统,提出一种新的基于句法结构特征分析及分类技术的答案提取算法,该... 由于中文自然语言处理的特点和困难以及相应的语言处理基础资源的相对缺乏,使得国外一些成熟技术和研究成果不能直接应用到中文问答系统中.为此,针对中文事实型问答系统,提出一种新的基于句法结构特征分析及分类技术的答案提取算法,该方法将答案提取问题看成是候选答案的分类问题,即将候选答案分类为正确和错误两类.首先,该方法根据与问题类型所对应的候选答案的类型信息,从文本片断中提取出候选答案及其在句子中的简单特征和句法结构特征;然后利用这些特征训练分类器;最后用训练得到的分类器判别候选答案是否为正确答案.针对中文事实性问题,该方法与目前典型的基于模式匹配的中文答案提取算法相比,准确率提升6.2%,MRR提升9.7%. 展开更多
关键词 句法依存分析 分类 答案提取 中文问答系统 事实性问题
在线阅读 下载PDF
基于SVM的中文组块分析 被引量:50
3
作者 李珩 朱靖波 姚天顺 《中文信息学报》 CSCD 北大核心 2004年第2期1-7,共7页
基于SVM(supportvectormachine)理论的分类算法 ,由于其完善的理论基础和良好的实验结果 ,目前已逐渐引起国内外研究者的关注。和其他分类算法相比 ,基于结构风险最小化原则的SVM在小样本模式识别中表现较好的泛化能力。文本组块分析作... 基于SVM(supportvectormachine)理论的分类算法 ,由于其完善的理论基础和良好的实验结果 ,目前已逐渐引起国内外研究者的关注。和其他分类算法相比 ,基于结构风险最小化原则的SVM在小样本模式识别中表现较好的泛化能力。文本组块分析作为句法分析的预处理阶段 ,通过将文本划分成一组互不重叠的片断 ,来达到降低句法分析的难度。本文将中文组块识别问题看成分类问题 ,并利用SVM加以解决。实验结果证明 ,SVM算法在汉语组块识别方面是有效的 ,在哈尔滨工业大学树库语料测试的结果是F =88 6 7%,并且特别适用于有限的汉语带标信息的情况。 展开更多
关键词 计算机应用 中文信息处理 支持向量机 结构风险最小化 文本组块 SVM 分类算法
在线阅读 下载PDF
无双语词典的英汉词对齐 被引量:11
4
作者 吕学强 吴宏林 姚天顺 《计算机学报》 EI CSCD 北大核心 2004年第8期1036-1045,共10页
该文提出了一种基于语料库的无双语词典的英汉词对齐模型 .它把自然语言的句子形式化地表示为集合 ,通过集合的交运算和差运算实现单词对齐 ,同时还考虑了词序和重复词的影响 .该模型不仅能对齐高频单词 ,而且能对齐低频单词 ,对未登录... 该文提出了一种基于语料库的无双语词典的英汉词对齐模型 .它把自然语言的句子形式化地表示为集合 ,通过集合的交运算和差运算实现单词对齐 ,同时还考虑了词序和重复词的影响 .该模型不仅能对齐高频单词 ,而且能对齐低频单词 ,对未登录词和汉语分词错误具有兼容能力 .该模型几乎不需要任何语言学知识和语言学资源 ,使语料库方法可独立应用 .实验表明 ,同质语料规模越大 ,词对齐的正确率和召回率越高 . 展开更多
关键词 自然语言处理 双语语料库 词对齐 最小求交 最小求差
在线阅读 下载PDF
基于增益的隐马尔科夫模型的文本组块分析 被引量:9
5
作者 李珩 杨峰 +1 位作者 朱靖波 姚天顺 《计算机科学》 CSCD 北大核心 2004年第2期152-154,192,共4页
本文提出一种基于增益的隐马尔科夫模型(Transductive HMM)的方法,用于文本组块(Text Chunking)分析的研究。该方法将一些上下文信息导入隐马尔科夫模型(HMM),构造增益的隐马尔科夫模型(TransductiveHMM)。该模型不需要修改标准的隐马... 本文提出一种基于增益的隐马尔科夫模型(Transductive HMM)的方法,用于文本组块(Text Chunking)分析的研究。该方法将一些上下文信息导入隐马尔科夫模型(HMM),构造增益的隐马尔科夫模型(TransductiveHMM)。该模型不需要修改标准的隐马尔科夫模型的训练和标注过程,只需要对训练语料根据导入的上下文信息进行相应的转换。实验结果显示,该方法在文本组块分析方面是有效的。 展开更多
关键词 中文信息处理 隐马尔科夫模型 文本组块分析 支持向量机 状态转移函数
在线阅读 下载PDF
一种障碍空间中不确定对象的连续最近邻查询方法 被引量:7
6
作者 李传文 谷峪 +1 位作者 李芳芳 于戈 《计算机学报》 EI CSCD 北大核心 2010年第8期1359-1368,共10页
近年来,基于位置的服务获得了越来越广泛的关注,其中最近邻查询是最常用的一种查询方式.测量手段的不准确性以及数据本身的性质导致不确定性在位置数据中普遍存在,这种不确定性会对最近邻查询结果产生影响.空间中障碍物的存在也给空间... 近年来,基于位置的服务获得了越来越广泛的关注,其中最近邻查询是最常用的一种查询方式.测量手段的不准确性以及数据本身的性质导致不确定性在位置数据中普遍存在,这种不确定性会对最近邻查询结果产生影响.空间中障碍物的存在也给空间数据查询带来了挑战.文中研究存在障碍物的空间中不确定对象连续最近邻查询的处理方法,设计了一种剪枝策略大幅降低需要计算的不确定对象数目,并进一步提出了障碍空间中不确定对象最近邻查询安全区域的概念及安全区域生成算法.设计了安全区域的索引存储方法.实验结果表明,文章所提出的方法具有良好的效率和可扩展性. 展开更多
关键词 最近邻 不确定 障碍空间 基于位置的服务
在线阅读 下载PDF
基于Stacking算法的组合分类器及其应用于中文组块分析 被引量:18
7
作者 李珩 朱靖波 姚天顺 《计算机研究与发展》 EI CSCD 北大核心 2005年第5期844-848,共5页
与基于Voting方法的组合分类器相比,提出基于Stacking算法的多分类器组合方法,通过构造一个两层的叠加式框架结构,将4种分类器(fnTBL,SNoW,SVM,MBL)进行了组合,并融合各种可能的上下文信息作为各层分类器的输入特征向量,在中文组块识别... 与基于Voting方法的组合分类器相比,提出基于Stacking算法的多分类器组合方法,通过构造一个两层的叠加式框架结构,将4种分类器(fnTBL,SNoW,SVM,MBL)进行了组合,并融合各种可能的上下文信息作为各层分类器的输入特征向量,在中文组块识别中取得了较好的效果.实验结果表明,组合后的分类器无论在准确率还是召回率上都有所提高,在哈尔滨工业大学树库语料的测试下达到了F=93.64的结果. 展开更多
关键词 叠加式 多分类器 文本组块
在线阅读 下载PDF
基于混沌与细胞自动机的数字水印模式 被引量:6
8
作者 王丽娜 杨景辉 +1 位作者 张焕国 于戈 《电子学报》 EI CAS CSCD 北大核心 2004年第4期580-582,共3页
本文提出了基于混沌与细胞自动机的数字自动转化为灰度图像的方法.数字作为密钥,不同数字能产生不同的灰度图像,其实现过程为数字作为种子,使用混沌迭代产生随机序列,然后转化成二值图像,经细胞自动机处理,再使用平滑过程,这样就产生了... 本文提出了基于混沌与细胞自动机的数字自动转化为灰度图像的方法.数字作为密钥,不同数字能产生不同的灰度图像,其实现过程为数字作为种子,使用混沌迭代产生随机序列,然后转化成二值图像,经细胞自动机处理,再使用平滑过程,这样就产生了灰度图像.灰度图像作为嵌人宿主信号的数字水印模式,该水印模式的能量集中在低频.实验结果显示该水印模式有好的特性,使用该水印模式的水印算法能抵抗一些常见的攻击. 展开更多
关键词 混沌 细胞自动机 数字水印模式 数字水印
在线阅读 下载PDF
基于局部动态可重构技术的多通道数据采集系统 被引量:5
9
作者 邓庆绪 宁宝锋 +1 位作者 金曦 刘志丹 《小型微型计算机系统》 CSCD 北大核心 2010年第9期1778-1783,共6页
可重构技术既具有硬件任务的高效性又具有软件任务的灵活性,近年已经成为研究热点,并越来越广泛的应用到实际系统之中.应用在化工、电力、冶金等行业的大型监控系统中的多通道数据采集系统具有高可靠性、强实时性和高并行性特点,典型的... 可重构技术既具有硬件任务的高效性又具有软件任务的灵活性,近年已经成为研究热点,并越来越广泛的应用到实际系统之中.应用在化工、电力、冶金等行业的大型监控系统中的多通道数据采集系统具有高可靠性、强实时性和高并行性特点,典型的多通道数据采集系统普遍采用ASIC集成电路设计,可配置性、灵活性和扩展性差,本文提出一种将局部动态可重构技术应用到多通道数据采集系统的设计方案,提高了系统的可配置性和应用范围,并且系统具有更高的实时性和并行性. 展开更多
关键词 局部动态可重构 可重构 FPGA 多通道数据采集
在线阅读 下载PDF
基于主机行为异常的P2P僵尸网络在线检测方法 被引量:4
10
作者 于晓聪 董晓梅 于戈 《小型微型计算机系统》 CSCD 北大核心 2012年第1期11-17,共7页
僵尸网络已经成为当前最为严重的网络威胁之一,其中P2P僵尸网络得到迅速发展,其自身的通信特征给检测带来巨大的挑战.针对P2P僵尸网络检测技术的研究已经引起研究人员的广泛关注.提出一种P2P僵尸网络在线检测方法,首先采用信息熵技术发... 僵尸网络已经成为当前最为严重的网络威胁之一,其中P2P僵尸网络得到迅速发展,其自身的通信特征给检测带来巨大的挑战.针对P2P僵尸网络检测技术的研究已经引起研究人员的广泛关注.提出一种P2P僵尸网络在线检测方法,首先采用信息熵技术发现网络流量中的异常点,然后通过分析P2P僵尸网络中主机的行为异常,利用统计学中的假设检验技术,从正常的网络流量数据中识别出可疑P2P僵尸主机,同时根据僵尸主机通信模式的相似性进行最终确认.实验结果表明该方法能够有效实现P2P僵尸网络的在线检测. 展开更多
关键词 P2P僵尸网络 信息熵 假设检验 行为异常 聚类
在线阅读 下载PDF
基于加权二部图的汉日词对齐 被引量:7
11
作者 吴宏林 刘绍明 于戈 《中文信息学报》 CSCD 北大核心 2007年第5期101-106,共6页
高效的自动词对齐技术是词对齐语料库建设的关键所在。当前很多词对齐方法存在以下不足:未登录词问题、灵活翻译问题和全局最优匹配问题。针对以上不足,该文提出加权二部图最大匹配词对齐模型,利用二部图为双语句对建模,利用词形、语义... 高效的自动词对齐技术是词对齐语料库建设的关键所在。当前很多词对齐方法存在以下不足:未登录词问题、灵活翻译问题和全局最优匹配问题。针对以上不足,该文提出加权二部图最大匹配词对齐模型,利用二部图为双语句对建模,利用词形、语义、词性和共现等信息计算单词间的相似度,利用加权二部图最大匹配获得最终对齐结果。在汉日词语对齐上的实验表明,该方法在一定程度上解决了以上三点不足,F-Score为80%,优于GIZA++的72%。 展开更多
关键词 计算机应用 中文信息处理 词对齐 二部图 匹配
在线阅读 下载PDF
面向文本分类的基于最小冗余原则的特征选取 被引量:3
12
作者 张希娟 王会珍 朱靖波 《中文信息学报》 CSCD 北大核心 2007年第5期56-60,共5页
在文本分类中,为了降低计算复杂度,常用的特征选取方法(如IG)都假设特征之间条件独立。该假设将引入严重的特征冗余现象。为了降低特征子集的冗余度,本文提出了一种基于最小冗余原则(minimal RedundancyPrinciple,MRP)的特征选取方法。... 在文本分类中,为了降低计算复杂度,常用的特征选取方法(如IG)都假设特征之间条件独立。该假设将引入严重的特征冗余现象。为了降低特征子集的冗余度,本文提出了一种基于最小冗余原则(minimal RedundancyPrinciple,MRP)的特征选取方法。通过考虑不同特征之间的相关性,选择较小冗余度的特征子集。实验结果显示基于最小冗余原则方法能够改善特征选取的效果,提高文本分类的性能。 展开更多
关键词 计算机应用 中文信息处理 条件独立性假设 最小冗余原则 特征选取 文本分类
在线阅读 下载PDF
支持存储访问的NoC模拟器的设计与实现
13
作者 邓庆绪 王文凤 +2 位作者 金曦 刘柄蔚 孔繁鑫 《小型微型计算机系统》 CSCD 北大核心 2012年第7期1537-1545,共9页
随着片上网络的发展,片上多处理器系统通信性能提高的同时,存储器的访问性能将成为片上多处理器系统的性能瓶颈.目前片上网络的研究主要依赖于模拟器,而现有的片上网络模拟器都不能完成对存储器访问的准确模拟.本文设计并实现了一个能... 随着片上网络的发展,片上多处理器系统通信性能提高的同时,存储器的访问性能将成为片上多处理器系统的性能瓶颈.目前片上网络的研究主要依赖于模拟器,而现有的片上网络模拟器都不能完成对存储器访问的准确模拟.本文设计并实现了一个能对存储器访问进行模拟的模拟器,为存储器性能的研究提供了一个实验平台;论文通过采用大量访问集对该模拟器进行测试,得出了若干条与存储器访问性能优化相关的片上网络设计建议. 展开更多
关键词 NOC SOC 存储器访问 模拟器
在线阅读 下载PDF
Co-training机器学习方法在中文组块识别中的应用 被引量:8
14
作者 刘世岳 李珩 +1 位作者 张俐 姚天顺 《中文信息学报》 CSCD 北大核心 2005年第3期73-79,共7页
采用半指导机器学习方法co training实现中文组块识别。首先明确了中文组块的定义,co training算法的形式化定义。文中提出了基于一致性的co training选取方法将增益的隐马尔可夫模型(TransductiveHMM)和基于转换规则的分类器(fnTBL)组... 采用半指导机器学习方法co training实现中文组块识别。首先明确了中文组块的定义,co training算法的形式化定义。文中提出了基于一致性的co training选取方法将增益的隐马尔可夫模型(TransductiveHMM)和基于转换规则的分类器(fnTBL)组合成一个分类体系,并与自我训练方法进行了比较,在小规模汉语树库语料和大规模未带标汉语语料上进行中文组块识别,实验结果要比单纯使用小规模的树库语料有所提高,F值分别达到了85 34%和83 4 1% ,分别提高了2 13%和7 2 1%。 展开更多
关键词 计算机应用 中文信息处理 co-training算法 中文组块 分类器
在线阅读 下载PDF
OpenE:一种基于n-gram共现的自动机器翻译评测方法 被引量:8
15
作者 孙连恒 杨莹 姚天顺 《中文信息学报》 CSCD 北大核心 2004年第2期15-22,共8页
在机器翻译研究领域中 ,评测工作发挥着重要的作用 ,它不仅仅是简单地对各个系统输出结果进行比较 ,它还对关键技术的发展起到了促进作用。译文质量的评测工作长期以来一直以人工的方式进行。随着机器翻译研究发展的需要 ,自动的译文评... 在机器翻译研究领域中 ,评测工作发挥着重要的作用 ,它不仅仅是简单地对各个系统输出结果进行比较 ,它还对关键技术的发展起到了促进作用。译文质量的评测工作长期以来一直以人工的方式进行。随着机器翻译研究发展的需要 ,自动的译文评测研究已经成为机器翻译研究中的一个重要课题。本文讨论了基于n gram共现的自动机器翻译评测框架 ,介绍了BLEU、NIST、OpenE三种自动评价方法 ,并通过实验详细分析了三种方法的优缺点。其中的OpenE采用了本文提出了一种新的片断信息量计算方法。它有效地利用了一个局部语料库 (参考译文库 )和全局语料库 (目标语句子库 )。实验结果表明这种方法对于机器翻译评价来说是比较有效的。 展开更多
关键词 人工智能 机器翻译 评测方法 信息量计算 n-gram共现 OpenE
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部