-
题名用户评价中比较句的识别和倾向性分析
被引量:4
- 1
-
-
作者
吴晨
韦向峰
-
机构
清华同方光盘电子出版社
同方知网(北京)技术有限公司
中国科学院声学研究所
-
出处
《计算机科学》
CSCD
北大核心
2016年第S1期435-439,共5页
-
基金
国家科技支撑计划课题:读者需求分析与按需出版(2013BAH47F02)
中国科学院信息化专项:民族语言信息处理学科领域基础科学数据整合与集成应用(Y329251431)资助
-
文摘
在互联网上用户评价内容中很多比较句的比较结果反映了语句陈述者对比较对象的倾向性态度。根据已有的10类比较句句型总结了它们的常见概念搭配,在基于语义块的语句倾向性分析方法的基础上构建了比较句自动识别系统和比较句倾向性自动分析系统。采用第四届中文倾向性分析评测的语料进行实验,对语料中的比较句进行了识别,对比较句中的要素进行了抽取并且分析了比较句的倾向性,识别结果和倾向性分析结果均好于所有参评系统的平均值。
-
关键词
用户评价
比较句
倾向性分析
概念搭配
-
Keywords
User views
Comparative sentences
Opinion analysis
Conceptual collocation
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于访问行为序列相似度的加权聚类算法
被引量:2
- 2
-
-
作者
李维娜
吴晨
-
机构
清华同方光盘电子出版社中国知网
-
出处
《计算机工程与设计》
北大核心
2017年第2期430-436,共7页
-
基金
"十二五"国家科技支撑计划基金项目(2013BAH47F02)
-
文摘
传统算法很少有研究用户行为的聚类,用户访问关键词、访问时间、访问次数等行为都能够反应出其兴趣,从用户行为日志出发,考虑到其访问量、关键词序列以及关键词之间的时间间隔权重,对k-means进行改进,提出一种基于行为序列相似度的加权聚类算法K-Similar,重要的用户群体聚到一类,挖掘出这一类用户的内容需求。该算法已在中国知网的行为日志数据上进行了验证,验证结果表明,该算法在效率和精度上较k-means都有一定程度的提高,得到了兴趣度更高的用户群体,展现了群体的需求特点。
-
关键词
加权聚类
用户访问行为
访问量
关键词序列
时间间隔
序列相似度
-
Keywords
weighted clustering
users’ access behavior
visit volume
keywords sequence
time interval
sequence similarity
-
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
-