期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
基于朴素贝叶斯模型和PageRank算法的电网事故主题爬虫算法
1
作者 谢树泳 刘之亮 《河南师范大学学报(自然科学版)》 北大核心 2025年第2期124-130,共7页
为了减少电网人身安全事故,利用数据挖掘技术构建和分析事故多维数据,建立准确的预警模型十分必要.其中一个极具挑战性的问题是如何在海量网页中自动化采集人身事故样本数据.提出一种朴素贝叶斯模型与PageRank结合的主题爬虫算法.首先... 为了减少电网人身安全事故,利用数据挖掘技术构建和分析事故多维数据,建立准确的预警模型十分必要.其中一个极具挑战性的问题是如何在海量网页中自动化采集人身事故样本数据.提出一种朴素贝叶斯模型与PageRank结合的主题爬虫算法.首先采用中文文本分割和设置关键词词频的方法对数据预处理,进行特征选择后,构建并训练朴素贝叶斯分类模型,从而实现电网事故分类准确度的显著提升.然后利用PageRank算法对精确分类后的网页进行主题相关性排序,有效避免普通爬虫方法中出现的主题漂移问题.实验结果表明,不论是在相同时间还是相同页面数的条件下,该方法的页面收获率均高于单独使用朴素贝叶斯分类器或PageRank的收获率,即本方法能够在大量网页中更高效、准确地爬取电网事故信息. 展开更多
关键词 电网安全 人身事故 朴素贝叶斯模型 PAGERANK算法 主题爬虫
在线阅读 下载PDF
基于朴素贝叶斯模型的中文关键词提取算法研究 被引量:13
2
作者 程岚岚 何丕廉 孙越恒 《计算机应用》 CSCD 北大核心 2005年第12期2780-2782,共3页
提出了一种基于朴素贝叶斯模型的中文关键词提取算法。该算法首先通过训练过程获得朴素贝叶斯模型中的各个参数,然后以之为基础,在测试过程完成关键词提取。实验表明,相对于传统的if*idf方法,该算法可从小规模的文档集中提取出更为准确... 提出了一种基于朴素贝叶斯模型的中文关键词提取算法。该算法首先通过训练过程获得朴素贝叶斯模型中的各个参数,然后以之为基础,在测试过程完成关键词提取。实验表明,相对于传统的if*idf方法,该算法可从小规模的文档集中提取出更为准确的关键词,而且可灵活地增加表征词语重要性的特征项,因而具有更好的可扩展性。 展开更多
关键词 提取 朴素贝叶斯模型 特征项
在线阅读 下载PDF
基于朴素贝叶斯模型的单词语义相似度度量 被引量:12
3
作者 王俊华 左万利 闫昭 《计算机研究与发展》 EI CSCD 北大核心 2015年第7期1499-1509,共11页
单词语义相似度度量是自然语言处理领域的经典和热点问题.通过结合朴素贝叶斯模型和知识库,提出一个新颖的度量单词语义相似度度量途径.首先借助通用本体WordNet获取属性变量,然后使用统计和分段线性插值生成条件概率分布列,继而通过贝... 单词语义相似度度量是自然语言处理领域的经典和热点问题.通过结合朴素贝叶斯模型和知识库,提出一个新颖的度量单词语义相似度度量途径.首先借助通用本体WordNet获取属性变量,然后使用统计和分段线性插值生成条件概率分布列,继而通过贝叶斯推理实现信息融合获得后验概率,并在此基础上量化单词语义相似度.主要贡献是定义了单词对距离和深度,并将朴素贝叶斯模型用于单词语义相似度度量.在基准数据集R&G(65)上,对比算法评判结果与人类评判结果的相关度,采用5折交叉验证对算法进行分析,样本Pearson相关度达到0.912,比当前最优方法高出0.4%,比经典算法高出7%~13%;Spearman相关度达到0.873,比经典算法高出10%~20%;且算法的运行效率和经典算法相当.实验结果显示将朴素贝叶斯模型和知识库相结合解决单词语义相似度问题是合理有效的. 展开更多
关键词 单词语义相似度 语义相似度 分段线性插值 朴素贝叶斯模型 WORDNET
在线阅读 下载PDF
基于集成朴素贝叶斯模型的在线地图匹配方法 被引量:1
4
作者 韩京宇 陈可佳 刘茜萍 《计算机工程与设计》 CSCD 北大核心 2014年第3期875-879,共5页
为了实现移动对象数据库中准确的路网匹配,提出了基于历史数据训练多个朴素贝叶斯模型实现路网匹配的新方法。该方法针对不同天气、时间段和道路等级,从历史匹配轨迹中训练朴素贝叶斯模型。为了克服数据噪声和单个模型引起的匹配偏差,... 为了实现移动对象数据库中准确的路网匹配,提出了基于历史数据训练多个朴素贝叶斯模型实现路网匹配的新方法。该方法针对不同天气、时间段和道路等级,从历史匹配轨迹中训练朴素贝叶斯模型。为了克服数据噪声和单个模型引起的匹配偏差,采用集成学习技术组合多个匹配器,通过投票实现高鲁棒性的地图匹配。在实际数据和模拟数据上的实验结果表明,该方法可以准确实现在线地图匹配。 展开更多
关键词 移动对象数据库 地图匹配 在线 朴素贝叶斯模型 集成学习 投票
在线阅读 下载PDF
基于朴素贝叶斯模型的新闻故事分割方法 被引量:1
5
作者 彭天强 李弼程 《计算机工程》 CAS CSCD 北大核心 2009年第20期178-180,共3页
提出一种基于朴素贝叶斯模型的新闻视频故事分割方法。通过对新闻视频进行镜头检测,获得候选故事边界点,从候选边界点周围镜头提取多模态中级特征,形成属性集合作为输入,应用朴素贝叶斯模型对候选边界点进行分类后对结果进行后处理,得... 提出一种基于朴素贝叶斯模型的新闻视频故事分割方法。通过对新闻视频进行镜头检测,获得候选故事边界点,从候选边界点周围镜头提取多模态中级特征,形成属性集合作为输入,应用朴素贝叶斯模型对候选边界点进行分类后对结果进行后处理,得到新闻故事。实验结果表明,该方法获得了较高的查准率和查全率,对不同类型的新闻节目有良好的适应性。 展开更多
关键词 故事分割 朴素贝叶斯模型 多模态融合 中级特征 视频检索
在线阅读 下载PDF
朴素贝叶斯模型在驾驶员伤情预测中的应用 被引量:1
6
作者 陆颖 殷越洲 谢君平 《机械设计与制造》 北大核心 2020年第1期181-184,共4页
先进车辆事故自动呼救(Advanced Automatic Crash Notification,AACN)系统能在车辆发生碰撞事故时及时对驾驶员的受伤情况进行预测,有助于呼救中心做出早期判断并制定更加积极有效的救援方案。首先,选取速度变化量、碰撞方向、驾驶员年... 先进车辆事故自动呼救(Advanced Automatic Crash Notification,AACN)系统能在车辆发生碰撞事故时及时对驾驶员的受伤情况进行预测,有助于呼救中心做出早期判断并制定更加积极有效的救援方案。首先,选取速度变化量、碰撞方向、驾驶员年龄、驾驶员是否系安全带、驾驶员侧安全气囊是否打开、驾驶员性别作为造成驾驶员伤情的影响因素,利用道路事故数据分析构建贝叶斯网络模型;其次对现有数据进行离散分类处理,然后建立驾驶员伤情预测的算法;最后通过事故数据进行仿真并对所提出的算法的有效性进行验证。结果表明,所建立的驾驶员伤情预测算法的预测准确率较高,可应用于AACN系统向呼救中心传递事故信息。 展开更多
关键词 先进车辆事故自动呼救系统 朴素贝叶斯模型 道路事故数据 驾驶员伤情预测算法
在线阅读 下载PDF
利用朴素贝叶斯模型进行多层网络链接预测 被引量:2
7
作者 张亚坤 李龙杰 陈晓云 《应用科学学报》 CAS CSCD 北大核心 2023年第1期23-40,共18页
针对多层网络链接预测中层间信息融合的问题,提出了一种利用朴素贝叶斯模型的链接预测方法。该方法结合目标层的邻域信息和辅助层相对于目标层的全局信息进行链接预测。在目标层中,根据节点对的邻域信息,利用朴素贝叶斯模型计算其连接概... 针对多层网络链接预测中层间信息融合的问题,提出了一种利用朴素贝叶斯模型的链接预测方法。该方法结合目标层的邻域信息和辅助层相对于目标层的全局信息进行链接预测。在目标层中,根据节点对的邻域信息,利用朴素贝叶斯模型计算其连接概率;在辅助层中,计算节点对在该层有边或无边时在目标层存在链接的概率。在真实数据和合成数据上的实验结果表明:该算法在正相关和负相关的多层网络中都有很好的预测性能。 展开更多
关键词 链接预测 多层网络 复杂网络 朴素贝叶斯模型
在线阅读 下载PDF
基于深度集成朴素贝叶斯模型的文本分类 被引量:16
8
作者 吴皋 李明 +2 位作者 周稻祥 岳俊宏 肖福龙 《济南大学学报(自然科学版)》 CAS 北大核心 2020年第5期436-442,共7页
针对传统朴素贝叶斯算法属于浅层学习,其特征独立性假设易引起分类效果欠佳的问题,提出一种深度集成朴素贝叶斯模型;该模型受深度森林中集成思想的启发,将高斯朴素贝叶斯、多项式朴素贝叶斯、伯努利朴素贝叶斯3种浅层基分类器集成为具... 针对传统朴素贝叶斯算法属于浅层学习,其特征独立性假设易引起分类效果欠佳的问题,提出一种深度集成朴素贝叶斯模型;该模型受深度森林中集成思想的启发,将高斯朴素贝叶斯、多项式朴素贝叶斯、伯努利朴素贝叶斯3种浅层基分类器集成为具有深层学习结构的朴素贝叶斯模型。结果表明:提出的深度集成朴素贝叶斯模型不仅克服了浅层学习特征表达能力不足的问题,而且缓解了特征独立性假设的缺点;通过在经典文本分类数据集上的实验,证明了提出的深度集成朴素贝叶斯模型的精确率、召回率以及精确率与召回率的调和平均数F 1值显著增大,模型性能良好。 展开更多
关键词 朴素贝叶斯模型 浅层学习 深度森林 集成 文本分类
在线阅读 下载PDF
贝叶斯网络个人信用评估模型 被引量:19
9
作者 郭春香 李旭升 《系统管理学报》 北大核心 2009年第3期249-254,260,共7页
研究了朴素贝叶斯分类器、树增强朴素贝叶斯分类器2种贝叶斯网络信用评估模型的精度,用10层交叉验证在2个真实数据集上对贝叶斯网络信用评分模型进行了测试并与神经网络模型进行了比较。结果表明,贝叶斯网络信用评估模型具有较高的分类... 研究了朴素贝叶斯分类器、树增强朴素贝叶斯分类器2种贝叶斯网络信用评估模型的精度,用10层交叉验证在2个真实数据集上对贝叶斯网络信用评分模型进行了测试并与神经网络模型进行了比较。结果表明,贝叶斯网络信用评估模型具有较高的分类精度,在信用评估中具有优势。 展开更多
关键词 信用评估 贝叶斯网络 朴素贝叶斯分类模型 树增强贝叶斯分类模型 神经网络
在线阅读 下载PDF
基于贝叶斯网络分类的个人信用评估模型 被引量:11
10
作者 李旭升 郭耀煌 《统计与决策》 CSSCI 北大核心 2006年第20期13-15,共3页
本文研究了朴素贝叶斯分类器、树增强朴素贝叶斯分类器两种贝叶斯网络信用评估模型的精度,用10层交叉验证在两个真实数据集上对贝叶斯网络信用评分模型进行了测试并与的神经网络模型进行了比较。结果表明,贝叶斯网络信用评估模型具有较... 本文研究了朴素贝叶斯分类器、树增强朴素贝叶斯分类器两种贝叶斯网络信用评估模型的精度,用10层交叉验证在两个真实数据集上对贝叶斯网络信用评分模型进行了测试并与的神经网络模型进行了比较。结果表明,贝叶斯网络信用评估模型具有较高的分类精度,在信用评估中具有优势。 展开更多
关键词 信用评估 贝叶斯网络 朴素贝叶斯分类模型 树增强贝叶斯分类模型 神经网络
在线阅读 下载PDF
基于NB的双级分类模型在邮件过滤中的研究 被引量:1
11
作者 惠孛 吴跃 陈佳 《计算机科学》 CSCD 北大核心 2006年第5期110-112,共3页
使用朴素的贝叶斯(NB)分类模型对邮件进行分类,是目前基于内容的垃圾邮件过滤方法的研究热点。朴素的贝叶斯在参数之间联系不强的时候分类效果简单而有效。但是朴素的贝叶斯分类模型中对特征参数的条件独立假设无法表达参数之间在语义... 使用朴素的贝叶斯(NB)分类模型对邮件进行分类,是目前基于内容的垃圾邮件过滤方法的研究热点。朴素的贝叶斯在参数之间联系不强的时候分类效果简单而有效。但是朴素的贝叶斯分类模型中对特征参数的条件独立假设无法表达参数之间在语义上的关系,影响分类性能。在朴素的贝叶斯分类模型的基础上,我们提出了一种双级贝叶斯分类模型(DLB,Double Level Bayes),既考虑到了参数之间的影响又保留了朴素的贝叶斯分类模型的优点。同时对DLB 模型与朴素的贝叶斯分类模型的性能进行比较。仿真实验表明,DLB 分类模型在垃圾邮件过滤应用中的效果在大部分条件下优于朴素的贝叶斯分类模型。 展开更多
关键词 垃圾邮件过虑 朴素贝叶斯分类模型 双级分类模型
在线阅读 下载PDF
基于聚类的朴素贝叶斯分类无监督学习方法 被引量:4
12
作者 葛顺 夏学知 《舰船科学技术》 北大核心 2016年第1期112-116,共5页
为实现朴素贝叶斯分类模型的无监督学习,提出一种基于数据挖掘理论中聚类算法思想的学习方法。该方法首先定义不同类型单维状态分量的差异度量方法和混合型多维向量的联合差异度量方法,通过分析样本数据中向量之间的差异性进行聚类统计... 为实现朴素贝叶斯分类模型的无监督学习,提出一种基于数据挖掘理论中聚类算法思想的学习方法。该方法首先定义不同类型单维状态分量的差异度量方法和混合型多维向量的联合差异度量方法,通过分析样本数据中向量之间的差异性进行聚类统计,得到研究对象的分类类别,然后对各单维状态分量分别聚类得到特征核值,进而确定不同类别各分量对应单维特征核值空间的概率隶属度。仿真实验结果表明,该方法能有效进行朴素贝叶斯分类学习。 展开更多
关键词 向量差异性度量 聚类统计 概率隶属度 朴素贝叶斯分类模型
在线阅读 下载PDF
融合朴素贝叶斯方法的复杂网络链路预测 被引量:13
13
作者 王润芳 陈增强 刘忠信 《智能系统学报》 CSCD 北大核心 2019年第1期99-107,共9页
近来复杂网络成为了众多学者的研究热点。但真实网络中的连边信息并不完整,不利于网络的分析研究,链路预测可以挖掘网络中的缺失连边,为网络重构提供基本依据。本文认为网络中链接的产生不仅受外部因素——共同邻居的影响,还受其自身因... 近来复杂网络成为了众多学者的研究热点。但真实网络中的连边信息并不完整,不利于网络的分析研究,链路预测可以挖掘网络中的缺失连边,为网络重构提供基本依据。本文认为网络中链接的产生不仅受外部因素——共同邻居的影响,还受其自身因素的影响。其中,共同邻居的影响可以通过文献中的局部朴素贝叶斯(LNB)模型量化,节点的影响则根据其自身的度量化。本文将两者综合考虑,提出了融合朴素贝叶斯(SNB)模型,然后用共同邻居(CN)、Adamic-Adar(AA)和资源分配(RA)指标进行推广。在美国航空网(USAir)上的实验结果表明,该方法的预测准确度比LNB和基准方法均有所提高,从而证明了该方法的有效性。 展开更多
关键词 复杂网络 融合朴素贝叶斯模型 局部朴素贝叶斯模型 贝叶斯模型 链路预测 共同邻居 节点度 网络重构
在线阅读 下载PDF
基于双信号融合的主轴/刀柄结合面刚度退化程度预测
14
作者 吴石 张勇 +1 位作者 王宇鹏 王春风 《中国机械工程》 EI CAS CSCD 北大核心 2024年第8期1449-1461,共13页
为了预测主轴/刀柄结合面刚度退化程度,提出了一种基于激励和响应信号融合的主轴/刀柄结合面刚度退化程度预测方法。首先进行钛合金矩形工件侧铣实验,采集瞬时铣削力信号和主轴/刀柄结合面附近的响应振动信号,构建反映主轴/刀柄结合面... 为了预测主轴/刀柄结合面刚度退化程度,提出了一种基于激励和响应信号融合的主轴/刀柄结合面刚度退化程度预测方法。首先进行钛合金矩形工件侧铣实验,采集瞬时铣削力信号和主轴/刀柄结合面附近的响应振动信号,构建反映主轴/刀柄结合面刚度退化的数据库。然后根据数据库中瞬时铣削力和振动信号各方向的时域、频域和时频域特征,基于相关性分析优选出瞬时铣削力信号和振动信号的时域均值、频域中心频率、时频域一阶小波包能量3个特征,分别使用低频滤波卷积核和高频滤波卷积核对优选后的特征矩阵进行双通道卷积池化处理,获取深度融合的主轴/刀柄结合面刚度退化程度特征向量。最后以支持向量机模型(SVM)的概率模式转化为朴素贝叶斯分类器(NBC)的条件概率,构建混合分类器模型(NBC-SVM),提高了分类器的分类性能。在主轴/刀柄结合面刚度退化数据库的基础上,基于双通道卷积池化的特征融合方法(CP-FF)和NBC-SVM模型实现了主轴/刀柄结合面刚度退化程度的预测,预测精度达96%。 展开更多
关键词 主轴/刀柄结合面 刚度退化 特征融合 朴素贝叶斯分类器支持向量机模型
在线阅读 下载PDF
气候情绪对污染行业股票收益率影响研究
15
作者 刘文文 赵鹏 +1 位作者 许点晨 汤苗苗 《武汉金融》 北大核心 2024年第8期43-52,共10页
本文以“双碳”目标为背景,基于朴素贝叶斯模型构建我国的气候情绪指标,并拓展Fama-French五因子模型,研究气候情绪对污染行业股票收益率的影响。结果表明:气候情绪与污染行业股票收益率之间存在显著的负相关性,引入气候情绪因子的模型... 本文以“双碳”目标为背景,基于朴素贝叶斯模型构建我国的气候情绪指标,并拓展Fama-French五因子模型,研究气候情绪对污染行业股票收益率的影响。结果表明:气候情绪与污染行业股票收益率之间存在显著的负相关性,引入气候情绪因子的模型在解释污染行业股票收益率方面表现更为优秀;气候情绪对位于不同收益分位的污染行业股票收益率的影响并非均匀分布,对高分位的污染行业股票收益率影响程度更高,而对低分位的污染行业股票收益率影响程度相对较小;气候情绪对污染行业股票收益率的影响在不同污染程度的行业中存在差异,对于污染程度较高和受到更多环境监控的企业,其股票收益率受到气候情绪的影响更为明显,而对于污染程度较低的企业,其股票收益率受到气候情绪的影响相对较小。 展开更多
关键词 气候变化 污染行业 气候情绪 股票收益率 朴素贝叶斯模型
在线阅读 下载PDF
有效超前期预测及预测精度评价 被引量:1
16
作者 施发启 《统计研究》 CSSCI 北大核心 1992年第6期64-69,共6页
一、问题的提出经济预测工作者经常对同一资料采用各种不同模型进行预测,显然,各种模型的预测精度不一,有的较高,有的较低。那么,这些模型的预测精度的差异在统计上是否显著?有没有一个公认的统计检验方法?这个问题常常被一些经济预测... 一、问题的提出经济预测工作者经常对同一资料采用各种不同模型进行预测,显然,各种模型的预测精度不一,有的较高,有的较低。那么,这些模型的预测精度的差异在统计上是否显著?有没有一个公认的统计检验方法?这个问题常常被一些经济预测工作者所忽视。一般认为,预测精度高的模型就是一个好模型,不论其精度比别的模型高多少。笔者认为这种看法有一定的片面性,因为尽管多数情况下复杂模型的预测精度比简单模型要高一些,但复杂模型的成本(包括投入的人力、物力和时间等)远远大于简单模型。所以,如果复杂模型的预测精度不是在统计上显著高于简单模型的话,采用复杂模型作预测就会得不偿失。另外。 展开更多
关键词 预测精度 朴素模型 预测方法 复杂模型 直线模型 预测误差 简单模型 统计量 超前预测 二次抛物线
在线阅读 下载PDF
模态逻辑中转换结构的局限性 被引量:1
17
作者 董英东 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2014年第2期284-288,共5页
针对Sally Porkom运用模态语言分析加标转换结构,利用加标转换结构所支持的语义证明许多形式逻辑系统是完全的,找到一个不具有克里普克完全性的系统,证明关系语义不足以刻画所有的模态逻辑的问题.利用构造的方法,给出两个系统KY和KZ,虽... 针对Sally Porkom运用模态语言分析加标转换结构,利用加标转换结构所支持的语义证明许多形式逻辑系统是完全的,找到一个不具有克里普克完全性的系统,证明关系语义不足以刻画所有的模态逻辑的问题.利用构造的方法,给出两个系统KY和KZ,虽然这两个系统无法用关系语义进行区分,但利用一般框架可知KY和KZ是有区别的.KY和KZ证明了在加标转换结构和模态系统之间有一些不相符合的地方,具有一定的局限性. 展开更多
关键词 模态逻辑 转换结构 典范模型 有穷模型 赋值模型 朴素模型 完全性 加标转换
在线阅读 下载PDF
基于关键词抽取的微博舆情事件内容聚合 被引量:17
18
作者 周鹏 蔡淑琴 +1 位作者 石双元 王伟 《情报杂志》 CSSCI 北大核心 2014年第1期91-96,共6页
微博舆情事件会带来严重后果,而碎片化和无序化使得难以从海量的微博内容中全面地认知微博舆情事件的全貌。从微博舆情事件内容聚合出其主要内容具有重要实践价值和研究价值。基于关键词抽取技术KEA提出了一种微博舆情事件内容聚合方法... 微博舆情事件会带来严重后果,而碎片化和无序化使得难以从海量的微博内容中全面地认知微博舆情事件的全貌。从微博舆情事件内容聚合出其主要内容具有重要实践价值和研究价值。基于关键词抽取技术KEA提出了一种微博舆情事件内容聚合方法。根据对微博内容篇幅、规范性和网络性的分析,增加中心度特征、词性特征和改进词位置特征,并以朴素贝叶斯分类器抽取关键词集作为聚合输出。最后通过现实微博平台上的内容聚合实验证明本研究所提方法相对基线方法在准确率和召回率上的优势。 展开更多
关键词 微博 舆情事件 文本挖掘 抽取 KEA算法 朴素贝叶斯模型
在线阅读 下载PDF
基于领域知识的文本分类 被引量:13
19
作者 朱靖波 陈文亮 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第8期733-735,共3页
提出了一种基于知识的文本分类方法,其中引入领域知识,利用领域特征作为文本特征,增强文本表示能力,将文本分类过程看作集聚计算过程.文本索引过程采用了改进型特征选取和权重计算方法.提出了一种基于互信息的学习算法,从训练语料中自... 提出了一种基于知识的文本分类方法,其中引入领域知识,利用领域特征作为文本特征,增强文本表示能力,将文本分类过程看作集聚计算过程.文本索引过程采用了改进型特征选取和权重计算方法.提出了一种基于互信息的学习算法,从训练语料中自动学习领域特征集聚计算公式.实验结果显示基于领域知识的文本分类技术总体性能优于传统的贝叶斯分类模型,领域知识的应用能够有效改善对相似主题和相反主题的分类性能. 展开更多
关键词 领域知识 文本分类 集聚计算 机器学习 朴素贝叶斯模型
在线阅读 下载PDF
科技文献的实验语料句抽取方法 被引量:2
20
作者 朱丽萍 刘蔷 +2 位作者 苏斐 杨中国 王显灿 《计算机工程与设计》 北大核心 2016年第11期3086-3091,共6页
为方便研究自然语言处理的学者选择更有效的实验语料,进行自然语言处理类科技文献的实验语料抽取研究。实验语料是指自然语言处理类文献在实验过程中使用的文本类数据,如训练数据、测试数据等。将文本划分为实验语料句和非实验语料句两... 为方便研究自然语言处理的学者选择更有效的实验语料,进行自然语言处理类科技文献的实验语料抽取研究。实验语料是指自然语言处理类文献在实验过程中使用的文本类数据,如训练数据、测试数据等。将文本划分为实验语料句和非实验语料句两类,统计实验语料句的词汇特征和位置特征,构建相应的特征库,用朴素贝叶斯模型对特征进行训练。在词性标注和分词的基础上,结合机器学习生成的模型判定是否为实验语料句,进行抽取。以自然语言类科技文献作为数据来源,在该领域随机选取了200篇科技文献进行抽取实验,对比人工判别方法和所提方法的抽取结果,验证了所提方法能够较为准确地获取实验语料信息。 展开更多
关键词 信息抽取 科技文献 特征提取 机器学习 朴素贝叶斯模型
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部