期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于FPGA的细粒度并行CYK算法加速器设计与实现 被引量:2
1
作者 夏飞 窦勇 +1 位作者 宋健 雷国庆 《计算机学报》 EI CSCD 北大核心 2010年第5期797-812,共16页
基于随机上下文无关文法(SCFG)理论模型进行RNA二级结构预测是目前采用计算方法研究RNA二级结构的一种重要途径.由于基于SCFG模型的标准结构预测算法(Coche-Younger-Kasami,CYK)巨大的时空复杂度,对CYK算法进行加速成为计算生物学领域... 基于随机上下文无关文法(SCFG)理论模型进行RNA二级结构预测是目前采用计算方法研究RNA二级结构的一种重要途径.由于基于SCFG模型的标准结构预测算法(Coche-Younger-Kasami,CYK)巨大的时空复杂度,对CYK算法进行加速成为计算生物学领域一个极具挑战性的热点问题.CYK的并行性能受限于算法多维度、非一致性的数据依赖关系和较低的计算/通信比,现有的基于通用微处理器结构的大规模并行处理方案不能获得令人满意的加速效果,并且大规模并行计算机系统硬件设备的购置、使用、日常维护的成本高昂,其适用性受到诸多限制.文中在深入分析CYK算法计算特征的基础上,基于FPGA平台提出并实现了一种细粒度的并行CYK算法.设计采用了对三维动态规划矩阵"按区域分割"和"逐层按列并行处理"的计算策略实现了多个处理单元间的负载均衡;采用数据预取、滑动窗口和数据传递流水线实现处理单元间的数据重用,有效解决了计算和通信间的平衡问题;设计了一种类似脉动阵列(systolic-like array)结构的主从多PE并行计算阵列,并在目前最大规模的FPGA芯片(Xilinx XC5VLX330)上成功集成了16个处理单元(processing elements),实验结果表明作者提出的CYK算法加速器结构具备良好的可扩展性.当RNA序列长度为959bps,CM模型状态数为3145时,与运行在Intel双核E5200 2.5GHzCPU、2.0GB主存通用计算上的Infernal-1.0软件相比,可获得超过14倍的加速效果.配置一个FP-GA算法加速器的通用计算平台的综合处理性能与包含20个Intel-Xeon CPU的PC集群相当,而硬件成本仅为后者的20%,系统功耗不到后者的10%. 展开更多
关键词 生物信息学 RNA 二级结构预测 SCFG模型 并行cyk算法 FPGA 硬件加速器
在线阅读 下载PDF
基于SCNF和概率CYK算法的最佳剖析树
2
作者 任浩征 董现峰 李梅 《计算机工程与设计》 CSCD 北大核心 2007年第9期2227-2229,2242,共4页
对基于纯规则(chart)的自底向上方法进行句法剖析后出现的大量无法消解的歧义现象,通过引入概率型Chomsky范式(SCNF)在一定程度上消除部分句法结构歧义;在利用Inside-Outside算法进行参数自动训练,并通过语法示例验证Inside-Outside算... 对基于纯规则(chart)的自底向上方法进行句法剖析后出现的大量无法消解的歧义现象,通过引入概率型Chomsky范式(SCNF)在一定程度上消除部分句法结构歧义;在利用Inside-Outside算法进行参数自动训练,并通过语法示例验证Inside-Outside算法的收敛性后,最后采用概率CYK算法得到句子的最佳剖析树。 展开更多
关键词 句法剖析 乔母斯基范式语法 规则 概率型乔母斯基范式语法 向内向外算法 概率cyk算法
在线阅读 下载PDF
基于句法CYK图神经网络的知识增强文本分类 被引量:1
3
作者 章巍 陈学奇 +2 位作者 韩剑锋 虞小江 吴海燕 《计算机应用》 CSCD 北大核心 2024年第S01期11-17,共7页
句子分类方法主要分为基于特征工程的机器学习方法、序列化模型和结构化模型,但基于特征工程的机器学习方法对词序不敏感易产生稀疏向量,序列化模型忽略了句子的短语、依存关系等句法结构信息,结构化模型如句法树、二叉树等的准确率受... 句子分类方法主要分为基于特征工程的机器学习方法、序列化模型和结构化模型,但基于特征工程的机器学习方法对词序不敏感易产生稀疏向量,序列化模型忽略了句子的短语、依存关系等句法结构信息,结构化模型如句法树、二叉树等的准确率受句法解析工具影响。针对上述问题,构建基于句法CYK(Cocke Younger Kasami)图神经网络(GNN)的知识增强文本分类模型S-CYK,对输入句子分别构建对应的短语树和CYK图以形成句法CYK图,并利用关系图注意力网络(RGAT)进行句子分类。在公共数据集AG’s News、DBpedia、ARP(Amazon Review Polarity)和ARF(Amazon Review Full)上的实验结果表明,与现有先进模型半监督变分自编码器(SSVAE)、对抗性微调BERT(AFTB)、基于GloVe的ABLSTM(GloVe+ABLSTM)和融合FastText的CNN(CNN with FastText)相比,S-CYK模型在4个数据集的准确率提升了0.04%~1.21%。S-CYK使用句法CYK图结构进行知识增强,能有效增强聚合句子信息的能力。 展开更多
关键词 句法知识 cyk算法 知识增强 图神经网络 文本分类
在线阅读 下载PDF
基于翻译规则的统计机器翻译 被引量:4
4
作者 刘颖 姜巍 《计算机科学》 CSCD 北大核心 2013年第2期214-217,共4页
扩展HMM模型可以解决词语对齐结果与句法约束冲突,从而更好地进行词语对齐。在短语对齐基础上利用目标语言的短语结构树抽取翻译规则。采用扩展CYK算法CYKA+作为系统的解码器,该算法可以处理非乔姆斯基范式的翻译规则;采用两轮解码算法... 扩展HMM模型可以解决词语对齐结果与句法约束冲突,从而更好地进行词语对齐。在短语对齐基础上利用目标语言的短语结构树抽取翻译规则。采用扩展CYK算法CYKA+作为系统的解码器,该算法可以处理非乔姆斯基范式的翻译规则;采用两轮解码算法在解码过程中整合语言模型。实验表明,与传统词语对齐模型相比,改进的HMM词语对齐模型具有更高的对齐准确率,并且翻译结果的BLEU评测得分更高。采用翻译规则的系统在不同数据集上具有更稳定的翻译结果。两轮解码算法与立方剪枝算法具有相近的解码质量,但前者解码速度更快。 展开更多
关键词 统计机器翻译 扩展HMM模型 翻译规则 cyk+算法 BLEU评分
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部