期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
实体关系的自动抽取研究 被引量:10
1
作者 张素香 文娟 +2 位作者 秦颖 袁彩霞 钟义信 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2006年第B07期370-373,共4页
针对实体关系的自动获取难题,将极大熵算法和Bootstrapping算法相结合,利用Bootstrapping算法和标量聚类的思想,通过设置种子模板和种子词获取了极大熵算法中所需的特征词.结合极大熵算法,从语言的形态学、语法、语义等方面系统地... 针对实体关系的自动获取难题,将极大熵算法和Bootstrapping算法相结合,利用Bootstrapping算法和标量聚类的思想,通过设置种子模板和种子词获取了极大熵算法中所需的特征词.结合极大熵算法,从语言的形态学、语法、语义等方面系统地设计了9个特征,尽可能全方位地描述文实体的真实情况.搭建了实验所需的系统框架,实现了实体关系的自动抽取.实验结果表明:该方法能够有效地解决实体关系的自动生成问题. 展开更多
关键词 极大熵 BOOTSTRAPPING 特征选择 实体关系抽取 评测
在线阅读 下载PDF
基于Boot Strapping的中文实体关系自动生成 被引量:3
2
作者 张素香 李蕾 +1 位作者 秦颖 钟义信 《微电子学与计算机》 CSCD 北大核心 2006年第12期15-18,共4页
针对中文信息抽取系统中建立提取事件模板的难点问题,基于Bootstrapping思想,提出一种简单、可行的实体关系自动生成方法,利用由种子词和种子模板组成的知识库建立学习器,采用标量聚类的方法,通过种子模板抽取更多的与种子词相似语义关... 针对中文信息抽取系统中建立提取事件模板的难点问题,基于Bootstrapping思想,提出一种简单、可行的实体关系自动生成方法,利用由种子词和种子模板组成的知识库建立学习器,采用标量聚类的方法,通过种子模板抽取更多的与种子词相似语义关系的特征词。在此基础上,利用最近邻居的原则,进而生成更多的抽取模板。丰富了知识库,为分析二元实体关系奠定基础,使得生成复杂的消息模板成为可能,同时极大地减轻手工建立模板的复杂度,有利于系统进行移植。 展开更多
关键词 BOOT Strapping 种子词 种子模板 标量聚类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部