期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于最小二乘支持向量机的网页主题语义分类的研究 被引量:2
1
作者 樊中华 侯占斌 +1 位作者 张晨星 马骁 《计算机应用与软件》 CSCD 2009年第12期53-55,59,共4页
提出了对网页主题进行语义扩展的方法,利用最小二乘支持向量机LSSVM(least squares support vector machines)来代替传统的支持向量机SVM(support vector machine)的分类技术。在建立LSSVM模型的多类别分类算法基础上,将其应用到网页主... 提出了对网页主题进行语义扩展的方法,利用最小二乘支持向量机LSSVM(least squares support vector machines)来代替传统的支持向量机SVM(support vector machine)的分类技术。在建立LSSVM模型的多类别分类算法基础上,将其应用到网页主题语义分类。实验表明,最小二乘支持向量机学习速度快,在小样本情况下具有良好的非线性建模和泛化能力,对网页主题语义分类具有很好的效果。 展开更多
关键词 最小二乘支持向量机 语义建模 网页主题语义分类
在线阅读 下载PDF
基于Bi-LSTM和分布式表示的网页主题相关度计算
2
作者 王锋 白宇 +1 位作者 蔡东风 王铁铮 《计算机应用与软件》 北大核心 2018年第7期57-62,共6页
针对向量空间模型忽略了查询关键词和网页的语义相关问题,提出一种基于双向LSTM(bidirectional long short-term memory)、词的分布式表示和文档的分布式表示的网页主题相关度计算方法。该方法通过双向LSTM和词的分布式表示对查询关键... 针对向量空间模型忽略了查询关键词和网页的语义相关问题,提出一种基于双向LSTM(bidirectional long short-term memory)、词的分布式表示和文档的分布式表示的网页主题相关度计算方法。该方法通过双向LSTM和词的分布式表示对查询关键词进行扩展,并得到查询扩展的主题关键词集合的词向量;将搜索到的网页通过分布式表示方法得到网页向量;对主题关键词集合和网页进行相关度计算,得到主题相关网页。实验采用搜狗实验室公开的搜狗全网新闻数据作为词向量训练语料,搜狗评测数据作为测试语料。实验结果表明采用该方法可以提高主题相关网页计算的准确率,性能明显高于向量空间模型。 展开更多
关键词 双向LSTM 分布式表示 查询扩展 网页主题 相关度计算
在线阅读 下载PDF
汉维主题网页自动获取技术的研究 被引量:2
3
作者 梁建飞 吐尔根.依布拉音 +1 位作者 田生伟 赛依旦.阿不力米提 《计算机应用与软件》 CSCD 北大核心 2012年第1期42-45,共4页
为了获得大量用于机器翻译研究的汉维(维吾尔)文语料,提出一种从网页中自动获取主题信息的方法。考虑到有主题网页中主题信息分布相对集中、文本密度较高,并且这类网页中大量的噪音信息是由链接引入的,提出的算法首先将链接分为噪音链... 为了获得大量用于机器翻译研究的汉维(维吾尔)文语料,提出一种从网页中自动获取主题信息的方法。考虑到有主题网页中主题信息分布相对集中、文本密度较高,并且这类网页中大量的噪音信息是由链接引入的,提出的算法首先将链接分为噪音链接和非噪音链接,并在源码中删除噪音链接的锚文本和非噪音链接的HTML标签,然后利用容器标签将源码划分为若干部分并删除文本长度和文本密度均小于各自阈值的源码块。针对汉维网页做了实验,实验结果表明,算法在设置合适的阈值的情况下良好率达到90%以上。 展开更多
关键词 主题网页 主题信息 噪音信息
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部