期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向招标文件的半结构化文本自动生成
被引量:
1
1
作者
刘金硕
刘宁
《计算机工程》
CAS
CSCD
北大核心
2023年第3期67-72,共6页
招标文件范本总结了历史招标文件的核心内容。针对现有文本摘要方法无法有效提取文本主题结构、忽略时间特征对文本重要性的影响等问题,提出一种基于多头图注意力网络的半结构化文本自动生成(SGMG)模型。在模型预处理层中,利用BERT预训...
招标文件范本总结了历史招标文件的核心内容。针对现有文本摘要方法无法有效提取文本主题结构、忽略时间特征对文本重要性的影响等问题,提出一种基于多头图注意力网络的半结构化文本自动生成(SGMG)模型。在模型预处理层中,利用BERT预训练模型进行文本嵌入,通过白化操作增强文本向量的表达能力。在主题抽取模块中,利用异质图建立主题、段落及文档之间的语义关系,应用多头图注意力网络加强图节点之间的交互,提高模型学习能力。在中心句抽取模块中,通过融合时间特征及语义相似关系的有向图计算文本中心性,防止重要时间信息的丢失。在句子选择模块中,结合三元词过滤法,提升生成内容的多样性。将国家能源集团2016年至2020年的招标文件作为语料进行实验,结果表明SGMG模型能够有效提取文本主题结构,生成文本内容与人工编制的范本接近,ROUGE-L评估指标相比于TextRank、LexRank等现有文本摘要方法提升了4.3个百分点以上。
展开更多
关键词
文本
生成
半结构化文本
主题提取
图注意力网络
异质图
在线阅读
下载PDF
职称材料
基于PATTree的半结构化文本信息抽取范式研究
被引量:
2
2
作者
曹进军
《情报杂志》
CSSCI
北大核心
2007年第7期55-58,共4页
信息抽取器在信息抽取领域是一个很重要的部分,而抽取器的研制通常要依靠抽取规则来实现。以前是利用使用者的使用模式或记录,找出相关的抽取规则。而利用PAT Tree可以直接从半结构化的Web的资料中,找出抽取规则。
关键词
PAT
Tree
半结构化文本
信息抽取
范式
在线阅读
下载PDF
职称材料
基于Boosting的半结构化信息抽取
3
作者
刘椿年
宋霞
《北京工业大学学报》
CAS
CSCD
北大核心
2005年第2期199-203,共5页
为了对半结构化文本实现自动抽取信息.介绍了一种基于Boosting算法的信息抽取方法,它能够自动对一个训练例生成规则,将该规则应用于正例集并改变正例集权重分布,找到权重最大的正例生成下一条规则.给出了一种能描述不符合英文词法的词...
为了对半结构化文本实现自动抽取信息.介绍了一种基于Boosting算法的信息抽取方法,它能够自动对一个训练例生成规则,将该规则应用于正例集并改变正例集权重分布,找到权重最大的正例生成下一条规则.给出了一种能描述不符合英文词法的词的模式匹配约束.试验表明:在特征简单的抽取规则学习中,该方法精确度与召回率可达100%.在特征比较复杂的抽取规则学习中,该方法F1评估值也能达到80%以上.
展开更多
关键词
BOOSTING算法
抽取规则
半结构化文本
在线阅读
下载PDF
职称材料
面向领域的Web文本结构化分析
被引量:
2
4
作者
杨春磊
刘念唐
+1 位作者
林雨
邵堃
《合肥工业大学学报(自然科学版)》
CAS
CSCD
北大核心
2013年第3期309-314,共6页
为了充分利用领域特征进行Web文本的结构化分析,文章提出了一种面向领域的Web文本结构化分析方法。该方法以领域特征为基础,依据半结构化文本的结构特征和Html文本的层次特性构造Html树;利用本体论的相关思想和方法构建领域本体,从Html...
为了充分利用领域特征进行Web文本的结构化分析,文章提出了一种面向领域的Web文本结构化分析方法。该方法以领域特征为基础,依据半结构化文本的结构特征和Html文本的层次特性构造Html树;利用本体论的相关思想和方法构建领域本体,从Html树中提取有价值的信息;并结合通用词库和领域词库进行结构化分析。实验结果表明,该方法能够很好地实现Web文本的结构化分析。
展开更多
关键词
领域特征
WEB
文本
结构化
分析
半结构化文本
领域本体
在线阅读
下载PDF
职称材料
题名
面向招标文件的半结构化文本自动生成
被引量:
1
1
作者
刘金硕
刘宁
机构
武汉大学国家网络安全学院空天信息安全与可信计算教育部重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第3期67-72,共6页
基金
国家自然科学基金“网络恶意信息中人物身份消歧与溯源鉴别方法与关键技术研究”(U193607)
国家重点研发计划(2020YFA0607902)。
文摘
招标文件范本总结了历史招标文件的核心内容。针对现有文本摘要方法无法有效提取文本主题结构、忽略时间特征对文本重要性的影响等问题,提出一种基于多头图注意力网络的半结构化文本自动生成(SGMG)模型。在模型预处理层中,利用BERT预训练模型进行文本嵌入,通过白化操作增强文本向量的表达能力。在主题抽取模块中,利用异质图建立主题、段落及文档之间的语义关系,应用多头图注意力网络加强图节点之间的交互,提高模型学习能力。在中心句抽取模块中,通过融合时间特征及语义相似关系的有向图计算文本中心性,防止重要时间信息的丢失。在句子选择模块中,结合三元词过滤法,提升生成内容的多样性。将国家能源集团2016年至2020年的招标文件作为语料进行实验,结果表明SGMG模型能够有效提取文本主题结构,生成文本内容与人工编制的范本接近,ROUGE-L评估指标相比于TextRank、LexRank等现有文本摘要方法提升了4.3个百分点以上。
关键词
文本
生成
半结构化文本
主题提取
图注意力网络
异质图
Keywords
text generation
semi-structured text
topic extraction
Graph Attention Network(GAT)
heterogeneous graph
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于PATTree的半结构化文本信息抽取范式研究
被引量:
2
2
作者
曹进军
机构
天津师范大学图书馆
出处
《情报杂志》
CSSCI
北大核心
2007年第7期55-58,共4页
基金
天津市"十一五"教育规划项目"本科生教学参考信息管理与服务系统"(编号:G173)研究成果
文摘
信息抽取器在信息抽取领域是一个很重要的部分,而抽取器的研制通常要依靠抽取规则来实现。以前是利用使用者的使用模式或记录,找出相关的抽取规则。而利用PAT Tree可以直接从半结构化的Web的资料中,找出抽取规则。
关键词
PAT
Tree
半结构化文本
信息抽取
范式
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于Boosting的半结构化信息抽取
3
作者
刘椿年
宋霞
机构
北京工业大学计算机学院多媒体与智能软件技术实验室
出处
《北京工业大学学报》
CAS
CSCD
北大核心
2005年第2期199-203,共5页
基金
国家自然科学基金资助项目(60173014)北京市自然科学基金资助项目(4022003).
文摘
为了对半结构化文本实现自动抽取信息.介绍了一种基于Boosting算法的信息抽取方法,它能够自动对一个训练例生成规则,将该规则应用于正例集并改变正例集权重分布,找到权重最大的正例生成下一条规则.给出了一种能描述不符合英文词法的词的模式匹配约束.试验表明:在特征简单的抽取规则学习中,该方法精确度与召回率可达100%.在特征比较复杂的抽取规则学习中,该方法F1评估值也能达到80%以上.
关键词
BOOSTING算法
抽取规则
半结构化文本
Keywords
Boosting algorithm
extraction rule
semi-structured text
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
面向领域的Web文本结构化分析
被引量:
2
4
作者
杨春磊
刘念唐
林雨
邵堃
机构
合肥工业大学计算机与信息学院
出处
《合肥工业大学学报(自然科学版)》
CAS
CSCD
北大核心
2013年第3期309-314,共6页
基金
国家自然科学基金资助项目(60975033
60575035
60275022)
文摘
为了充分利用领域特征进行Web文本的结构化分析,文章提出了一种面向领域的Web文本结构化分析方法。该方法以领域特征为基础,依据半结构化文本的结构特征和Html文本的层次特性构造Html树;利用本体论的相关思想和方法构建领域本体,从Html树中提取有价值的信息;并结合通用词库和领域词库进行结构化分析。实验结果表明,该方法能够很好地实现Web文本的结构化分析。
关键词
领域特征
WEB
文本
结构化
分析
半结构化文本
领域本体
Keywords
domain feature
Web text
structured analysis
semi-structured text
domain ontology
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向招标文件的半结构化文本自动生成
刘金硕
刘宁
《计算机工程》
CAS
CSCD
北大核心
2023
1
在线阅读
下载PDF
职称材料
2
基于PATTree的半结构化文本信息抽取范式研究
曹进军
《情报杂志》
CSSCI
北大核心
2007
2
在线阅读
下载PDF
职称材料
3
基于Boosting的半结构化信息抽取
刘椿年
宋霞
《北京工业大学学报》
CAS
CSCD
北大核心
2005
0
在线阅读
下载PDF
职称材料
4
面向领域的Web文本结构化分析
杨春磊
刘念唐
林雨
邵堃
《合肥工业大学学报(自然科学版)》
CAS
CSCD
北大核心
2013
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部