期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
基于自然标注信息和隐含主题模型的无监督文本特征抽取 被引量:4
1
作者 饶高琦 于东 荀恩东 《中文信息学报》 CSCD 北大核心 2015年第6期141-149,共9页
术语和惯用短语可以体现文本特征。无监督的抽取特征词语对诸多自然语言处理工作起到支持作用。该文提出了"聚类-验证"过程,使用主题模型对文本中的字符进行聚类,并采用自然标注信息对提取出的字符串进行验证和过滤,从而实现... 术语和惯用短语可以体现文本特征。无监督的抽取特征词语对诸多自然语言处理工作起到支持作用。该文提出了"聚类-验证"过程,使用主题模型对文本中的字符进行聚类,并采用自然标注信息对提取出的字符串进行验证和过滤,从而实现了从未分词领域语料中无监督获得词语表的方法。通过优化和过滤,我们可以进一步获得了富含有术语信息和特征短语的高置信度特征词表。在对计算机科学等六类不同领域语料的实验中,该方法抽取的特征词表具有较好的文体区分度和领域区分度。 展开更多
关键词 自然标注信息 自然语块 隐含主题模型 领域特征 文体特征
在线阅读 下载PDF
语料库自然标注信息与中文分词应用研究(英文) 被引量:2
2
作者 饶高琦 修驰 荀恩东 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第1期140-146,共7页
以中文分词为应用目标,将大规模语料库上存在的自然标注信息分为显性标注信息与隐性标注信息,分别考察了它们的分布和对大数据集上语言计算的影响。结果表明,两者都直接或间接地表达了作者对语言的分割意志,因而对分词具有积极的影响。... 以中文分词为应用目标,将大规模语料库上存在的自然标注信息分为显性标注信息与隐性标注信息,分别考察了它们的分布和对大数据集上语言计算的影响。结果表明,两者都直接或间接地表达了作者对语言的分割意志,因而对分词具有积极的影响。通过词语抽取测试,发现在缺乏丰富显性标注信息的文本中,来自语言固有规律的自然标注信息对字符串有着强大的分割性能。 展开更多
关键词 自然标注信息 中文分词 词语抽取 大规模语料库
在线阅读 下载PDF
基于群体智慧理论的协同标注信息行为机理研究——以豆瓣电影标签数据为例 被引量:9
3
作者 易明 冯翠翠 +1 位作者 莫富传 邓卫华 《情报学报》 CSSCI CSCD 北大核心 2021年第1期101-114,共14页
本文从群体智慧理论出发,构建了协同标注信息行为模型,将协同标注信息行为从宏观层面划分为初始阶段、中级阶段和终极阶段三个子过程;从微观层面划分为发散、收敛和凝聚三个子环节。其中,宏观层面描述了协同标注信息行为由量变到质变的... 本文从群体智慧理论出发,构建了协同标注信息行为模型,将协同标注信息行为从宏观层面划分为初始阶段、中级阶段和终极阶段三个子过程;从微观层面划分为发散、收敛和凝聚三个子环节。其中,宏观层面描述了协同标注信息行为由量变到质变的过程,凸显了过程性;微观层面描述了协同标注信息行为中群体智慧涌现的基本过程,凸显了协同性。本研究通过对豆瓣电影标签数据的实证分析发现:基于群体智慧理论的三阶段-三环节模型合理地解释了协同标注信息行为的过程性和协同性;标签标注次数的偏度系数总体呈增长趋势,群体智慧在协同标注信息行为过程中不断涌现;标签引用是整个协同标注信息行为过程中的常态,逐渐形成了稳定的代表群体用户意见的高频标签群;八种协同标注信息行为模式在整个协同标注信息行为的过程中均有发生,但收敛模式较为稳定,发散模式有很大的概率转为收敛模式;协同标注信息行为过程以收敛环节为主,群体用户意见经历由发散向收敛转移,并最终凝聚全局共识、涌现大众分类。研究结果表明,本文的理论模型与研究方法具有科学性,能够丰富协同信息行为的理论与方法体系。 展开更多
关键词 协同标注信息行为 群体智慧 大众分类
在线阅读 下载PDF
基于词典和弱标注信息的电影评论情感分析 被引量:19
4
作者 樊振 过弋 +1 位作者 张振豪 韩美琪 《计算机应用》 CSCD 北大核心 2018年第11期3084-3088,共5页
针对评论文本情感分析研究中数据标注费时费力的问题,提出了一种新的数据自动标注方法。首先,通过基于情感词典的方法计算出评论文本的情感倾向;其次,利用用户评分的弱标注信息和基于词典方法的情感倾向对评论文本自动标注;最后,利用支... 针对评论文本情感分析研究中数据标注费时费力的问题,提出了一种新的数据自动标注方法。首先,通过基于情感词典的方法计算出评论文本的情感倾向;其次,利用用户评分的弱标注信息和基于词典方法的情感倾向对评论文本自动标注;最后,利用支持向量机(SVM)对评论文本进行情感分类。所提出的数据自动标注方法在两种类型数据集情感分类准确率上分别达到了77.2%和77.8%,相对于单一的利用用户评分对数据标注的方法,分别提高了1.7个百分点和2.1个百分点。实验结果表明,提出的数据自动标注方法在电影评论情感分析中能提高分类效果。 展开更多
关键词 电影评论 情感词典 标注信息 支持向量机 情感分类
在线阅读 下载PDF
工程图纸字符串及标注信息提取 被引量:6
5
作者 范帆 关佶红 《计算机工程与应用》 CSCD 2012年第7期161-164,共4页
工程图纸中字符串及标注信息的提取是工程图纸自动化处理极为重要的组成部分,是进行尺寸理解、图像理解等高层次理解的前提和基础。提出一种基于工程图纸知识的预分割字符串及标注信息提取方法,重点关注工程图纸中以表格形式存在的字符... 工程图纸中字符串及标注信息的提取是工程图纸自动化处理极为重要的组成部分,是进行尺寸理解、图像理解等高层次理解的前提和基础。提出一种基于工程图纸知识的预分割字符串及标注信息提取方法,重点关注工程图纸中以表格形式存在的字符串以及图元标注信息的解析、定位、提取。通过前期处理保持字符串与字符串、图元与标注信息之间的逻辑联系,解析获得字符串的坐标信息,对字符串所在的区域进行水平化,去除杂质线段等操作,以达到最佳的识别效果。 展开更多
关键词 预分割字符串 标注信息提取 文字识别
在线阅读 下载PDF
我国音乐期刊论文标注信息的考察与分析 被引量:7
6
作者 景月亲 《黄钟(武汉音乐学院学报)》 北大核心 2001年第1期62-66,共5页
文章以《中国学术期刊 (光盘版 )检索与评价数据规范》为依据 ,依次考察了《人民音乐》、《音乐研究》、《中国音乐学》等 12种国内主要音乐理论期刊的文献标识码、文章编号、题名、作者及工作单位、作者简介、摘要、关键词、分类号、... 文章以《中国学术期刊 (光盘版 )检索与评价数据规范》为依据 ,依次考察了《人民音乐》、《音乐研究》、《中国音乐学》等 12种国内主要音乐理论期刊的文献标识码、文章编号、题名、作者及工作单位、作者简介、摘要、关键词、分类号、收稿日期、参考文献等方面的标注信息。根据考察结果 ,提出 :(1)音乐期刊论文写作与编辑规范化亟待加强 ;(2 )编辑人员应加强文献知识学习 ,以准确判别并及时纠正作者标识中的错误 ;(3)从读者角度出发 ,适当增加部分标注信息 ;(4 )在音乐学术研究与音乐期刊的规范化建设方面 ,音乐理论期刊肩负着义不容辞的责任和义务。 展开更多
关键词 音乐期刊 音乐编辑 期刊论文 标注信息 考察报告
在线阅读 下载PDF
汉语复合名词语义信息标注词库:基于生成词库理论 被引量:16
7
作者 宋作艳 赵青青 亢世勇 《中文信息学报》 CSCD 北大核心 2015年第3期27-33,43,共8页
复合名词分析一直是语言研究和自然语言信息处理中的一个重要问题,涉及未登录词的识别、自动释义以及词典编纂等。生成词库理论是目前较新的一种语义学理论,我们拟利用该理论对汉语复合名词进行语义信息标注,建立一个词库。该文首先介... 复合名词分析一直是语言研究和自然语言信息处理中的一个重要问题,涉及未登录词的识别、自动释义以及词典编纂等。生成词库理论是目前较新的一种语义学理论,我们拟利用该理论对汉语复合名词进行语义信息标注,建立一个词库。该文首先介绍了这一词库的标注框架,然后通过对"纸"、"石"构成的复合词的对比分析,展示了这一词库在复合名词构词、语义研究中的应用。研究结果显示,物性角色、自然类和人造类是非常重要的语义信息,能揭示复合名词构词和语义的一些模式和规律。 展开更多
关键词 语义信息标注词库 复合名词 生成词库理论 物性结构 语义类型
在线阅读 下载PDF
增强现实环境下产品信息标注布局算法研究 被引量:2
8
作者 王峻峰 于洪涛 +1 位作者 李世其 徐迟 《计算机应用与软件》 CSCD 2011年第12期92-95,104,共5页
针对增强现实条件下标注布局复杂多变的特点,提出在标注算法中加入预分布过程以提高算法效率,增强算法稳定性,并通过实验加以验证。分析增强现实中信息标注的问题类型,指出解决该类问题的思路,并阐述改进算法的实现过程,选择相关的参数... 针对增强现实条件下标注布局复杂多变的特点,提出在标注算法中加入预分布过程以提高算法效率,增强算法稳定性,并通过实验加以验证。分析增强现实中信息标注的问题类型,指出解决该类问题的思路,并阐述改进算法的实现过程,选择相关的参数,进行多次验证实验,并对结果进行分析,找出影响产品布局算法实现效率的因素,并使问题得到较好的解决。算法在解决信息标注问题上完全可行。 展开更多
关键词 增强现实 信息标注算法 预分布 效率 稳定性
在线阅读 下载PDF
AutoCAD标注组元信息自动提取的研究 被引量:6
9
作者 王钰 刘建强 《工程图学学报》 CSCD 北大核心 2007年第4期136-140,共5页
论述了通过编程自动提取AutoCAD中尺寸、引线和公差标注等基本图元信息的方法。由于标注对象是一些基本图元对象构成的特定集合,其表现形式又各不相同,通过这些对象自身的属性和方法接口,无法获取重绘标注对象的足够信息,因而采用不同方... 论述了通过编程自动提取AutoCAD中尺寸、引线和公差标注等基本图元信息的方法。由于标注对象是一些基本图元对象构成的特定集合,其表现形式又各不相同,通过这些对象自身的属性和方法接口,无法获取重绘标注对象的足够信息,因而采用不同方式,编程自动获取构成这些标注对象的基本图形对象,进而获取这些基本图形对象中的属性信息。采用了AutoCAD的ActiveX Automation开发平台予以实现。 展开更多
关键词 计算机应用 标注组元信息 标注属性提取 计算机辅助设计
在线阅读 下载PDF
中文病历文本中时间信息自动标注
10
作者 周小甲 周庆利 +1 位作者 李昊旻 吕旭东 《中国生物医学工程学报》 CAS CSCD 北大核心 2012年第3期434-439,共6页
病历文本中标准化的时间信息及其关联临床事件的自动提取,对促进临床决策支持和医疗信息挖掘等应用具有重要意义。虽然很多研究已提出多种面向临床事件的提取方法,然而在时间信息自动标注领域的研究还未达到实际利用的水平。这主要是由... 病历文本中标准化的时间信息及其关联临床事件的自动提取,对促进临床决策支持和医疗信息挖掘等应用具有重要意义。虽然很多研究已提出多种面向临床事件的提取方法,然而在时间信息自动标注领域的研究还未达到实际利用的水平。这主要是由于中文病历文本中时间信息表达的多样性、相互关联性和不明确性所致。为此本研究首先利用基于正则表达式的时间信息自动识别方法实现基本时间信息的提取,然后通过分析和研究中文病历文本中参考时间的种类和选取规律,将时间信息自动识别结果进行计算并自动标注为国际时间标注标准TIMEX2形式。本方法在包含1 207条时间信息的147份实际病历文本语料中进行了验证,结果显示时间识别的F值为92.82%,时间标注的F值为90.80%,为时间信息的后续利用奠定了良好的基础。 展开更多
关键词 时间信息标注 TIMEX2 正则表达式
在线阅读 下载PDF
面向城市增强现实的高融合度信息标注方法 被引量:6
11
作者 葛林 庄晓斌 +1 位作者 华炜 万华根 《系统仿真学报》 CAS CSCD 北大核心 2014年第9期2015-2022,共8页
针对城市增强现实系统中信息提示主要发生在屏幕空间而引起信息维度下降,甚至导致用户误解的问题,提出一种场景结构空间中的多元媒体提示信息高融合度信息标注方法。对真实城市场景建筑物进行稀疏点云结构与简单三维结构建模,基于建筑... 针对城市增强现实系统中信息提示主要发生在屏幕空间而引起信息维度下降,甚至导致用户误解的问题,提出一种场景结构空间中的多元媒体提示信息高融合度信息标注方法。对真实城市场景建筑物进行稀疏点云结构与简单三维结构建模,基于建筑物表面兴趣区域生成标注信息载体;基于所构建的信息载体进行多元提示信息的高融合度标注;基于场景图进行场景标注信息组织以使增强现实在线信息提示程序能高效地利用所标注的提示信息。所提出的方法已在基于三维数字内容创作工具的原型系统中实现,针对城市实景的实验结果表明,能有效利用真实物理场景的结构信息,达到了多元信息高度融合的效果,且标注信息能为增强现实在线信息提示程序能高效利用。 展开更多
关键词 增强现实 信息标注 高融合 信息载体 多元媒体信息组织 提示信息
在线阅读 下载PDF
基于信息融合标注的实体及关系联合抽取方法 被引量:9
12
作者 马建红 魏字默 陈亚萌 《计算机应用与软件》 北大核心 2021年第7期159-166,共8页
针对目前机器学习方法在化学领域的资源实体及关系抽取任务上召回率低以及高度依赖人工特征工程和领域知识的问题,提出一种基于实体信息及关系信息融合标注的联合抽取方法(Information Fusion Tagging-Joint Model,IFT-Joint)。该方法... 针对目前机器学习方法在化学领域的资源实体及关系抽取任务上召回率低以及高度依赖人工特征工程和领域知识的问题,提出一种基于实体信息及关系信息融合标注的联合抽取方法(Information Fusion Tagging-Joint Model,IFT-Joint)。该方法主要从以下两个方面改进:将联合抽取任务转化为序列标注问题,缓解联合抽取中重叠关系的问题;从序列标注的角度出发,提出一种基于BERT(Bidirectional Encoder Representations from Transformers)联合抽取模型。通过多组实验表明,在化学领域实体数据集上,IFT-Joint的召回率可达到75%以上,相比于所提到的其他方法效果提升明显,且具有良好的稳定性。 展开更多
关键词 信息融合标注 联合抽取 序列标注 重叠关系 BERT
在线阅读 下载PDF
Web页面标注模型及其实现 被引量:3
13
作者 陈联 《计算机工程与设计》 CSCD 北大核心 2006年第11期2054-2056,共3页
为改善基于Web的远程教育的交互性,提出了一种Web页面嵌入标注模型,讨论了该模型的实现。该模型不但实现了在线对任意服务器上的Web页面进行直接标注,而且实现了标注的精确定位以及标注信息的共享和重组。
关键词 Web页面标注 嵌入标注模型 标注信息 共享与重组
在线阅读 下载PDF
基于联合媒体相关模型的图像自动标注改进算法 被引量:1
14
作者 贾克斌 安震 《北京工业大学学报》 CAS CSCD 北大核心 2014年第4期514-520,共7页
为了充分利用标注词间的相关性,提高图像标注精度,解决图像检索中的语义鸿沟问题,提出了一种基于联合媒体相关模型的图像自动标注改进算法.该算法将标注词和图像的联合概率求解过程转换成在标注词条件下图像出现的概率和标注词的先验概... 为了充分利用标注词间的相关性,提高图像标注精度,解决图像检索中的语义鸿沟问题,提出了一种基于联合媒体相关模型的图像自动标注改进算法.该算法将标注词和图像的联合概率求解过程转换成在标注词条件下图像出现的概率和标注词的先验概率的求解过程,减少了高频候选标注词对概率统计模型的影响,同时引入语义相似语言模型,利用上下文关联词矢量表示每个标注词,通过估计1幅图像的1组相关性最大的标注词来实现对图像的标注.与基于联合媒体相关图像自动标注算法相比,在标注过程中,本算法不再假设模型中各标注词之间是相互独立的,充分考虑标注词上下文的相关性信息,提高了图像标注精度;对标准的Corel图像集实验结果表明,基于联合媒体相关模型的图像自动标注改进算法是有效的. 展开更多
关键词 联合媒体相关模型 语言模型 标注词上下文信息
在线阅读 下载PDF
个性化网络地图自主标注系统研究
15
作者 张素智 王威 孙嘉彬 《郑州轻工业学院学报(自然科学版)》 CAS 2015年第1期36-39,共4页
针对目前网络地图的标注更新慢、标注不全、信息获取不及时等问题,提出了一种个性化网络地图自主标注系统.该系统根据用户信息生成(UGC)思想,采用Web 2.0和AJAX技术,将自主标注信息和空间地理信息建立关联,允许用户参与地图自主标注,方... 针对目前网络地图的标注更新慢、标注不全、信息获取不及时等问题,提出了一种个性化网络地图自主标注系统.该系统根据用户信息生成(UGC)思想,采用Web 2.0和AJAX技术,将自主标注信息和空间地理信息建立关联,允许用户参与地图自主标注,方便用户以地图为载体对城市生活信息进行发布、查询、浏览等.测试实验表明,该系统提高了访问效率,增强了网络地图的可移植性,改善了用户体验. 展开更多
关键词 网络地图 地理信息系统 信息标注 用户信息生成
在线阅读 下载PDF
跨语言标注情境中的学习行为——基于推荐标签的实验分析 被引量:2
16
作者 张思雅 马晓悦 赵捧未 《图书情报知识》 CSSCI 北大核心 2020年第4期76-86,共11页
[目的/意义]厘清跨语言环境中推荐标签及其表征语言对用户标注学习行为的影响,是优化和提高推荐标签质量、改善用户跨语言标注体验的重要基础。[研究设计/方法]通过受控实验的方法对比用户在外文推荐标签、中文推荐标签以及无推荐标签... [目的/意义]厘清跨语言环境中推荐标签及其表征语言对用户标注学习行为的影响,是优化和提高推荐标签质量、改善用户跨语言标注体验的重要基础。[研究设计/方法]通过受控实验的方法对比用户在外文推荐标签、中文推荐标签以及无推荐标签的情况下的跨语言标注结果和学习行为。[结论/发现]跨语言标注环境下存在三种基于推荐标签的学习模式:基于标签形式的学习、基于标签语义的长语义映射学习和基于标签语义的短语义映射学习;推荐标签在为用户的标注学习提供指导的同时,也带来一定的代价,这符合"锚定效应"的观点。[创新/价值]研究结果将有助于指导跨语言标注系统的设计与实现,提高信息共享效率。 展开更多
关键词 跨语言 推荐标签 学习行为 信息标注
在线阅读 下载PDF
一种面向图情信息的快速检索优化算法 被引量:2
17
作者 徐继维 《现代电子技术》 2023年第24期165-169,共5页
为了提升大数据背景下数字图书信息的检索效率,文中对图书信息的检索业务流程进行了梳理,并针对信息标注时准确率低的问题展开了研究。通过引入图像、文本和用户三个维度的相似度,寻找待标注信息和数据库已有信息的关联性,使得新的图书... 为了提升大数据背景下数字图书信息的检索效率,文中对图书信息的检索业务流程进行了梳理,并针对信息标注时准确率低的问题展开了研究。通过引入图像、文本和用户三个维度的相似度,寻找待标注信息和数据库已有信息的关联性,使得新的图书信息可以快速写入现有数据库。此外,为解决该方法在现有数据库中无相似信息时识别率低的问题,采用了RCNN深度学习网络先将信息划分为主体区域和多个次要区域,再通过不同结构的深度学习网络对不同区域进行特征提取,在提升算法训练效率的同时,也提升了特征提取的准确率。基于某数字馆藏图书信息数据集进行的仿真验证结果表明,文中引入的相似度指标与标注的准确率呈正相关,算法相较于现有的OTC、Mop-CNN、ImageNet-CNN等人工智能网络,准确率分别提升了0.372、0.093和0.201。 展开更多
关键词 信息检索 信息标注 数字图书 RCNN 特征提取 图像相似度
在线阅读 下载PDF
小样本驱动特征分段网络的防护材料折痕检测 被引量:1
18
作者 刘梦真 黄广炎 +2 位作者 张宏 周宏元 刘思宇 《兵工学报》 EI CAS CSCD 北大核心 2024年第3期963-974,共12页
防刺服能在恐怖袭击、医闹伤害、违法犯罪等事件中有效保护生命安全,然而在生产制造及穿着使用中易产生机械折痕。立足于防护材料折痕缺陷的快速检测需求,创新性地在图像识别方法中提出特征分段网络结构,实现了小样本驱动下防护材料折... 防刺服能在恐怖袭击、医闹伤害、违法犯罪等事件中有效保护生命安全,然而在生产制造及穿着使用中易产生机械折痕。立足于防护材料折痕缺陷的快速检测需求,创新性地在图像识别方法中提出特征分段网络结构,实现了小样本驱动下防护材料折痕的快速、精准检测功能。通过引入注意力机制和深度可分离卷积模块,并赋予损失函数与优化器两种典型参数,全面提高了特征分段网络模型的检测精度与效率;提出几何信息标注算法,搭建防护材料缺陷可视化检测平台,实现了机械折痕自动精准定位与几何信息输出。模型训练结果表明,特征分段网络模型的准确率可达96.19%,折痕缺陷几何信息标注误差在2%以内,优异的可视化检测功能可拓展到大型工程化自动检测领域。研究工作为下一步构建含有折痕缺陷的防刺装备防护性能预测模型奠定了基础。 展开更多
关键词 防护材料 机械折痕检测 特征分段神经网络 几何信息标注
在线阅读 下载PDF
基于图的制造特征关联关系模型构建方法
19
作者 成彬 齐吉燕 《组合机床与自动化加工技术》 北大核心 2019年第9期36-38,49,共4页
为了更智能、高效地构建制造特征的关联关系模型,实现以三维模型作为机加工艺信息载体的目的,通过一种基于图的方法研究了制造特征关联关系模型的构建方法。在特征识别的基础上,根据标注信息及制造特征属性邻接图建立特征面间的位置关系... 为了更智能、高效地构建制造特征的关联关系模型,实现以三维模型作为机加工艺信息载体的目的,通过一种基于图的方法研究了制造特征关联关系模型的构建方法。在特征识别的基础上,根据标注信息及制造特征属性邻接图建立特征面间的位置关系图,由图中顶点间关系判定制造特征间的关联关系,完成制造特征关联关系模型的建立,并选用制造特征间几何关联关系结合特征属性表征三维MBD模型。结果表明:该方案可以合理的表示三维MBD模型。可见该模型可以达到作为工艺信息载体的目的。 展开更多
关键词 MBD模型 制造特征 三维标注信息
在线阅读 下载PDF
MBD环境下的三维机加工艺设计技术 被引量:18
20
作者 田富君 陈兴玉 +2 位作者 程五四 张祥祥 张红旗 《计算机集成制造系统》 EI CSCD 北大核心 2014年第11期2690-2696,共7页
针对基于模型定义技术对工艺设计带来的变革,在定义工艺模型、工序模型和工序参考模型的基础上,建立了基于模型定义环境下的三维机加工艺设计模式。以工艺方法为核心,集成工艺参数信息、资源信息和检验信息,构建了一种三维工艺信息标注... 针对基于模型定义技术对工艺设计带来的变革,在定义工艺模型、工序模型和工序参考模型的基础上,建立了基于模型定义环境下的三维机加工艺设计模式。以工艺方法为核心,集成工艺参数信息、资源信息和检验信息,构建了一种三维工艺信息标注符号。从标注面、相关性查询、成组标注、限定区域和颜色的使用等方面制定了三维机加工艺信息标注规范。开发了三维机加工艺设计系统,并以某零件为例,验证了方法的有效性。 展开更多
关键词 基于模型定义 工序模型 三维工艺信息标注 计算机辅助工艺设计
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部