-
题名基于层叠模型的话题检测方法研究
被引量:1
- 1
-
-
作者
谢林燕
张素香
戚银城
-
机构
华北电力大学电子与通信工程系
国网信息通信有限公司
-
出处
《郑州大学学报(理学版)》
CAS
北大核心
2012年第2期43-47,共5页
-
文摘
针对相似话题难以区分的问题,提出了基于层叠模型的话题检测方法.该方法以Single-Pass聚类策略为基础,将新闻实体信息运用到话题检测中,改进时间相似度和地点相似度的计算方法,在底层利用文本内容相似度完成话题检测的任务,在高层结合时间相似度和地点相似度完成话题检测的任务.实验结果表明,该方法的性能优于传统的文本相似度算法.
-
关键词
话题检测
相似话题
向量空间模型
层叠模型
-
Keywords
topic detection
similar topic
vector space model(VSM)
cascade model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于新闻类RSS文档的信息隐藏系统
- 2
-
-
作者
戚银城
孙卓
谢林燕
-
机构
华北电力大学电子与通信工程系
-
出处
《计算机工程》
CAS
CSCD
2012年第5期129-132,共4页
-
文摘
分析新闻类聚合内容(RSS)文档的结构,提出一种基于新闻类RSS文档的信息隐藏方法。根据各新闻条目的先后顺序不会影响RSS文档使用的特点,利用<item>标签模块的排列组合隐藏机密信息。同时选取另外2种基于XML的隐藏方法进行合理组合,构建一个基于多种隐藏方法的新闻类RSS文档的信息隐藏系统。实验结果表明,排序后的3种隐藏方法不会发生冲突,在提高隐藏容量的同时,具有较好的隐蔽性和鲁棒性。
-
关键词
信息隐藏
RSS文档
标签
可扩展标记语言
-
Keywords
information hiding
Really Simple Syndication(RSS) document
tag
eXtensible Markkup Language(XML)
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名基于k近邻中心偏移因子的欠采样方法
被引量:2
- 3
-
-
作者
孟东霞
谢林燕
-
机构
河北省高校智慧金融应用技术研究中心
河北金融学院金融科技学院
国家计算机网络应急技术处理协调中心河北分中心
-
出处
《统计与决策》
CSSCI
北大核心
2023年第12期40-44,共5页
-
基金
河北省高校智慧金融应用技术研发中心项目(IFDC2022030C)
河北省省级科技计划资助项目(20310701D)
中央引导地方科技发展资金项目(216Z0701G)。
-
文摘
针对不平衡数据集在实际应用中分类效果较差的问题,文章提出一种基于k近邻中心偏移因子对多数类样本欠采样的数据处理方法。k近邻中心是样本的k个最近邻覆盖区域的中心点,所在位置随着k值的增加而发生偏移,偏移变化的波动程度用中心偏移因子来表示。中心偏移因子的值反映了样本周围的局部密度,数值较小的因子代表样本及其近邻处于密集区域,或近邻在样本的同一侧密集分布,样本可能为冗余样本。为了在不改变原始数据分布的前提下尽可能地删除冗余度较高的多数类样本,首先,移除多数类样本中的噪声点,计算多数类样本的中心偏移因子;然后,将多数类样本按照偏移因子的数值从低到高排序;最后,通过比较样本与k近邻的中心偏移因子来删除部分多数类样本,使数据集趋于平衡。实验使用支持向量机对多种欠采样方法平衡后的14个数据集进行了分类,实验结果表明,所提方法在大多数数据集上表现较优,有效提高了少数类的分类精度。
-
关键词
不平衡数据集
欠采样
K近邻
中心偏移因子
-
Keywords
imbalanced dataset
undersampling
k-nearest neighbor
center offset factor
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名绿茶中儿茶素的提取工艺优化研究
被引量:3
- 4
-
-
作者
师海荣
谢林燕
-
机构
滁州学院生物与食品工程学院
-
出处
《安徽农学通报》
2020年第12期96-100,共5页
-
基金
安徽省质量工程大学生创新创业训练计划项目(201810377063)
安徽省教育厅人文社科重点项目(SK2018A0415)
安徽省大学生创客实验室项目(2016ckjh135)。
-
文摘
选取放置了12个月的绿茶作为试验材料,采用乙醇溶剂提取法,分别使用过滤、离心2种方法提纯儿茶素。结果表明:采用离心操作提纯儿茶素的得率是过滤操作的31.3倍;采用离心法进行工艺提取后续操作优化发现,使用60%的乙醇溶液,pH4.0、料液比1∶20、60℃恒温水浴超声提取30min,重复操作1次,提取完成后,在2000r/min条件下离心2次、使用旋转蒸发仪在60℃前提下蒸发15min,最后在60℃的真空干燥箱中干燥24h,儿茶素粗提物的得率高达30.72%。
-
关键词
儿茶素
工艺优化
离心提取法
-
Keywords
Catechin
Process optimization
Centrifugal extraction
-
分类号
Q946
[生物学—植物学]
-