-
题名偏序域上的传递保持Skyline计算
被引量:1
- 1
-
-
作者
杨婧
张彦春
余永红
江海新
-
机构
中国科学院计算所网络数据科学与技术重点实验室
复旦大学计算机学院
南京邮电大学通达学院
中国科学院大学虚拟经济与数据科学研究中心
-
出处
《小型微型计算机系统》
CSCD
北大核心
2014年第12期2727-2733,共7页
-
基金
第51批中国博士后面上项目(2012M510594)资助
国家自然科学青年基金项目(61303049)资助
-
文摘
当属性域是偏序的时候,最终的Skyline点几乎和原始数据集一样大小.因为大多数情况下,数据集里至少有一维点与点之间是不可比的.因此在保留感兴趣的点的同时,将大数据集裁剪到一个合理的规模,是一个值得研究的问题.为了得到一个更小更有用的Skyline点集,可以更好地反映真实的用户偏好,本文基于两种假设:偏好的参数是不完整的,实际的偏好是传递性的,提出一个更为广义的控制关系概念.
-
关键词
偏序域
传递保持
SKYLINE计算
-
Keywords
partially ordered domains
transitivity-preserving
skylines
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名面向文本分类的有监督显式语义表示
被引量:1
- 2
-
-
作者
孙飞
郭嘉丰
兰艳艳
程学旗
-
机构
中国科学院计算所网络数据科学与技术重点实验室
-
出处
《数据采集与处理》
CSCD
北大核心
2017年第3期550-558,共9页
-
基金
国家重大基础研究发展计划("九七三"计划)(2012CB316303
2014CB340401)资助项目
+2 种基金
国家高技术研究发展计划("八六三"计划)(2012AA011003)资助项目
国家自然科学基金重点(61232010)资助项目
国家科技支撑计划子课题(2012BAH46B04)资助项目
-
文摘
文本表示作为文本分类的一个基本问题,一直广受关注。目前文本表示主要有词袋模型、隐式语义表达和基于知识库的显式语义表达3种方式。本文首先分析对比了这3种文本表示方式在文本分类中的效果。实验发现,基于知识库的显式语义表达并没有如预期一样提高文本分类的效果。经分析,其原因在于显式语义表达在扩展文档表达时易引入噪声。针对该问题,本文提出了一种有监督的显式语义表达方法。该方法利用数据集的标注信息识别文档中与分类最相关的核心概念,并扩展核心概念以形成文档显式语义表达。3个标准分类数据集上的结果证实了本文所提文本表示方法的有效性。
-
关键词
文本分类
文本表达
有监督显式语义表示
-
Keywords
text categorization
text representation
supervised explicit semantic representation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-