期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于语言模型的有监督词义消歧模型优化研究 被引量:8
1
作者 杨陟卓 黄河燕 《中文信息学报》 CSCD 北大核心 2014年第1期19-25,共7页
词义消歧是自然语言领域中重要的研究课题之一。目前,有监督词义消歧方法已经是解决该问题的有效手段。但是,由于缺乏大规模的训练语料,有监督方法还不能取得满意的效果。该文提出一种基于语言模型的词义消歧优化模型,该模型采用语言模... 词义消歧是自然语言领域中重要的研究课题之一。目前,有监督词义消歧方法已经是解决该问题的有效手段。但是,由于缺乏大规模的训练语料,有监督方法还不能取得满意的效果。该文提出一种基于语言模型的词义消歧优化模型,该模型采用语言模型优化传统的有监督消歧模型,充分利用有监督和语言模型两种模型的消歧优势,共同推导歧义词的词义。该模型可以在训练语料不足的情况下,有效的提高词义消歧效果。在真实数据上表明,该方法的消歧性能超过了参加SemEval-2007:task#5评测任务的最好的有监督词义消歧系统。 展开更多
关键词 数据稀疏 模型优化 有监督模型 语言模型 参数估计
在线阅读 下载PDF
基于有监督与半监督模型的茶叶产地溯源研究
2
作者 戴柯磊 杨科莹 +2 位作者 周子懿 段赟杰 洪雪珍 《现代农业科技》 2021年第24期181-184,187,共5页
茶叶市场掺假现象愈演愈烈,为了保护消费者权益,促进茶叶产业发展,对茶叶进行快速高效的溯源鉴定至关重要。目前,市面上采用的茶叶溯源方法大多需要数量较为固定的样本量进行预测分析,但在实际应用中,由于大规模样本的需求,会导致预测... 茶叶市场掺假现象愈演愈烈,为了保护消费者权益,促进茶叶产业发展,对茶叶进行快速高效的溯源鉴定至关重要。目前,市面上采用的茶叶溯源方法大多需要数量较为固定的样本量进行预测分析,但在实际应用中,由于大规模样本的需求,会导致预测成本进一步提高。本文以浙江安吉白茶为研究对象,比较有监督与半监督模型下不同样本量的预测准确度。结果显示,在有标签样本较少的情况下,基于半监督算法建立的茶叶溯源模型效果比有监督算法建立的茶叶溯源模型效果更好。 展开更多
关键词 安吉白茶 有监督模型 监督模型 近红外光谱 产地溯源 样本量选取
在线阅读 下载PDF
无监督与有监督相结合的粤语分词方法 被引量:1
3
作者 苏振江 张仰森 +1 位作者 胡昌秀 黄改娟 《计算机工程与设计》 北大核心 2023年第8期2482-2488,共7页
为能在缺乏粤语分词语料的情况下进行粤语研究,提出一种基于无监督与有监督结合的粤语分词方法。利用多源语料完成粤语词库的构建;利用二元字典与粤语词库对初步结果进行初筛分词和二次分词;利用DAG对粤语通用句式切分错误进行分析并修... 为能在缺乏粤语分词语料的情况下进行粤语研究,提出一种基于无监督与有监督结合的粤语分词方法。利用多源语料完成粤语词库的构建;利用二元字典与粤语词库对初步结果进行初筛分词和二次分词;利用DAG对粤语通用句式切分错误进行分析并修正;将修正后的粤语分词语料利用深度学习模型固化分词效果,得到基于Bert-BiLSTM-CRF三层架构的分词模型。实验结果表明,该方法能有效克服预分词语料的缺失问题,在无需大量分词语料的情况下,F值达到74.3%。 展开更多
关键词 粤语 分词研究 词库 互信息 端到端模型 有监督模型 监督模型
在线阅读 下载PDF
融合SLDA主题模型的不均衡文本分类方法 被引量:3
4
作者 唐焕玲 刘艳红 +2 位作者 郑涵 窦全胜 鲁明羽 《计算机工程与应用》 CSCD 北大核心 2021年第12期144-154,共11页
在标签均衡分布且标注样本足够多的数据集上,监督式分类算法通常可以取得比较好的分类效果。然而,在实际应用中样本的标签分布通常是不均衡的,分类算法的分类性能就变得比较差。为此,结合SLDA(Supervised LDA)有监督主题模型,提出一种... 在标签均衡分布且标注样本足够多的数据集上,监督式分类算法通常可以取得比较好的分类效果。然而,在实际应用中样本的标签分布通常是不均衡的,分类算法的分类性能就变得比较差。为此,结合SLDA(Supervised LDA)有监督主题模型,提出一种不均衡文本分类新算法ITC-SLDA(Imbalanced Text Categorization based on Supervised LDA)。基于SLDA主题模型,建立主题与稀少类别之间的精确映射,以提高少数类的分类精度。利用SLDA模型对未标注样本进行标注,提出一种新的未标注样本的置信度计算方法,以及类别约束的采样策略,旨在有效采样未标注样本,最终降低不均衡文本的倾斜度,提升不均衡文本的分类性能。实验结果表明,所提方法能明显提高不均衡文本分类任务中的Macro-F1和G-mean值。 展开更多
关键词 有监督主题模型 监督学习 不均衡文本 分类
在线阅读 下载PDF
结合有监督联合一致性自编码器的跨音视频说话人标注 被引量:2
5
作者 柳欣 李鹤洋 +1 位作者 钟必能 杜吉祥 《电子与信息学报》 EI CSCD 北大核心 2018年第7期1635-1642,共8页
跨模态说话人标注旨在利用说话人的不同生物特征进行相互匹配和互标注,可广泛应用于各种人机交互场合。针对人脸和语音两种不同模态生物特征之间存在明显的"语义鸿沟"问题,该文提出一种结合有监督联合一致性自编码器的跨音视... 跨模态说话人标注旨在利用说话人的不同生物特征进行相互匹配和互标注,可广泛应用于各种人机交互场合。针对人脸和语音两种不同模态生物特征之间存在明显的"语义鸿沟"问题,该文提出一种结合有监督联合一致性自编码器的跨音视频说话人标注方法。首先分别利用卷积神经网络和深度信念网络分别对人脸图像和语音数据进行判别性特征提取,接着在联合自编码器模型的基础上,提出一种新的有监督跨模态神经网络模型,同时嵌入softmax回归模型以保证模态间和模态内样本的相似性,进而扩展为3种有监督一致性自编码器神经网络模型来挖掘音视频异构特征之间的潜在关系,从而有效实现人脸和语音的跨模态相互标注。实验结果表明,该文提出的网络模型能够有效的对说话人进行跨模态标注,效果显著,取得了对姿态变化和样本多样性的鲁棒性。 展开更多
关键词 跨模态说话人标注 有监督联合自编码器 softmax回归模型 有监督神经网络模型
在线阅读 下载PDF
融合主题模型和动态路由的小样本学习方法
6
作者 张淑芳 唐焕玲 +3 位作者 郑涵 刘孝炎 窦全胜 鲁明羽 《数据采集与处理》 CSCD 北大核心 2022年第3期586-596,共11页
针对小样本学习标注训练样本过少,导致特征表达力弱的问题,本文结合有监督主题模型(Supervised LDA,SLDA)和动态路由算法提出一种新的动态路由原型网络模型(Dynamic routing prototypical network based on SLDA,DRP-SLDA)。利用SLDA主... 针对小样本学习标注训练样本过少,导致特征表达力弱的问题,本文结合有监督主题模型(Supervised LDA,SLDA)和动态路由算法提出一种新的动态路由原型网络模型(Dynamic routing prototypical network based on SLDA,DRP-SLDA)。利用SLDA主题模型建立词汇与类别之间的语义映射,增强词的类别分布特征,从词粒度角度编码获得样本的语义表示。提出动态路由原型网络(Dynamic routing prototypical network,DR-Proto),通过提取交叉特征利用样本之间的语义关系,采用动态路由算法迭代生成具有类别代表性的动态原型,旨在解决特征表达问题。实验结果表明,DRP-SLDA模型能有效提取词的类别分布特征,且获取动态原型提高类别辨识力,从而能够有效提升小样本文本分类的泛化性能。 展开更多
关键词 小样本学习 元学习 原型网络 有监督主题模型 文本分类
在线阅读 下载PDF
桉树杂交种与其亲本的近红外光谱判别 被引量:4
7
作者 卢万鸿 李鹏 +2 位作者 王楚彪 林彦 罗建中 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2020年第3期873-877,共5页
研究桉树控制授粉后目标性状的基因作用方式是探索其基因重组规律的重要内容。常规的数量统计分析精度往往不高,而DNA分析的专业要求高,且费时费力。该研究利用近红外光谱(NIRs)研究不同基因型桉树杂交种、亲本及杂交种与亲本间近红外... 研究桉树控制授粉后目标性状的基因作用方式是探索其基因重组规律的重要内容。常规的数量统计分析精度往往不高,而DNA分析的专业要求高,且费时费力。该研究利用近红外光谱(NIRs)研究不同基因型桉树杂交种、亲本及杂交种与亲本间近红外光谱信息的关系,探索NIRs用于桉树杂交种与其亲本判别的可行性和准确性。以控制授粉的桉树亲本及其杂交F1代材料为对象,每种基因型从各自田间试验分别选取10个单株,采集树冠中上部新鲜健康叶片。用手持式近红外仪Phazir Rx(1624)采集桉树杂交种与其亲本叶片的NIRs信息。每单株选10片完全生理成熟的健康叶片,避开叶脉扫描其正面光谱5次,以50条NIRs信息的均值代表单个叶片的NIRs信息,最终每个基因型获得10条NIRs信息。对原始NIRs采用二阶多项式S.G一阶导数预处理。预处理后的NIRs用于多元统计分析,首先对桉树杂交亲本和子代样本进行主成分分析(PCA),直观展示不同基因型的分类情况。然后运用簇类独立软模式(SIMCA)和偏最小二乘判别分析(PLS-DA)两种有监督的判别模式验证NIRs用于桉树杂交种与其亲本树种的分类判别效果。PCA结果显示,不同的亲本间、杂交种间及杂交种与亲本间样本的主因子得分可以清晰地将各基因型分开。SIMCA模式判别分析中,桉树杂交种样本到亲本PCA模型的样本距离显示,待判别样本能够形成单独的聚类,且能直观反映两者的遗传相似。PLS-DA判别结果显示,桉树杂交亲本的PLS模型能通过预测其杂交子代的响应变量将其与亲本准确分开。结果表明,桉树叶片的NIRs信息可以准确地反映桉树杂交子代遗传信息的传递规律,NIRs判别模型可以准确地将各种基因型予以区分。因此,NIRs信息不仅可用于桉树杂交种和纯种的定性判别,还可以分析桉树基因重组过程中加性遗传效应的大小,从而为桉树遗传基础分析及其育种改良研究提供理论支撑。 展开更多
关键词 有监督模型 主成分分析(PCA) 簇类独立软模式(SIMCA) 偏最小二乘判别分析(PLS-DA)
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部