期刊文献+
共找到9,746篇文章
< 1 2 250 >
每页显示 20 50 100
基于Word2Vec模型的泥石流多源灾害数据融合研究
1
作者 晋磊 徐鹏 +2 位作者 黎杰 蔡迎春 杨海波 《人民黄河》 北大核心 2025年第7期97-102,共6页
在大数据、物联网与人工智能技术快速发展的背景下,泥石流灾害数据正日益呈现出海量、多源、异构的特点。主要采用jieba、NLPIR和LTP等分词工具抽取模型库,对非结构化存储的泥石流灾害数据进行解析与抽取,并汇聚至数据库,实现数据融合... 在大数据、物联网与人工智能技术快速发展的背景下,泥石流灾害数据正日益呈现出海量、多源、异构的特点。主要采用jieba、NLPIR和LTP等分词工具抽取模型库,对非结构化存储的泥石流灾害数据进行解析与抽取,并汇聚至数据库,实现数据融合。通过Word2Vec模型将词语映射到高维空间中,实现文本中的词汇转换为实数向量;采用t-SNE算法和Kernel PCA算法将高维词向量转换为低维度的向量,使用K-means算法对其进行聚类可视化。研究结果表明:在数据抽取评估方面,一致性、完整性、准确性的评估均值在0.800以上,均方差小于0.050。对比PCA和t-SNE两种降维方法,通过轮廓系数(Silhouette Score,SS)评估聚类效果,PCA的SS指标值为0.359,t-SNE的SS指标值为0.336,结果显示PCA表现更优。Bert模型具有较强的上下文理解能力,更加适合泥石流灾害数据抽取,依托Word2Vec模型的CBOW架构获取词向量,结果显示PCA在评价指标上整体表现优于t-SNE。针对泥石流灾害数据多源和语义一致性问题,涵盖从数据抽取、降维到聚类的全过程,为实现泥石流灾害数据的语义融合与统一管理提供了有效支持。 展开更多
关键词 泥石流灾害 知识抽取 质量评估 知识融合 word2Vec
在线阅读 下载PDF
基于图像Bag-of-Words模型的无载体信息隐藏 被引量:48
2
作者 周志立 曹燚 孙星明 《应用科学学报》 CAS CSCD 北大核心 2016年第5期527-536,共10页
介绍一种基于bag-of-words(BOW)模型的无载体信息隐藏方法.该方法使用BOW模型提取图像的视觉关键词(visual words,VW)以表达待隐藏的文本信息,从而实现文本信息在图像中的隐藏.首先使用BOW模型提取图像集中每幅图像的VW,构建文本信息的... 介绍一种基于bag-of-words(BOW)模型的无载体信息隐藏方法.该方法使用BOW模型提取图像的视觉关键词(visual words,VW)以表达待隐藏的文本信息,从而实现文本信息在图像中的隐藏.首先使用BOW模型提取图像集中每幅图像的VW,构建文本信息的关键词和VW的映射关系库;然后把每幅图像分为若干子图像,统计每一幅子图像的VW频数直方图,选择频数最高的VW表示该子图像;最后根据构建的文本关键词和子图像VW的映射关系库,搜索出与待隐藏文本信息存在映射关系的子图像序列,将含有这些子图像的图像作为含密图像进行传递.实验结果和分析表明,该隐藏算法在抗隐写分析、鲁棒性和安全性方面均有良好的表现. 展开更多
关键词 无载体信息隐藏 BAG of words模型 视觉词汇 图像搜索
在线阅读 下载PDF
基于“bag of words”的视频匹配方法 被引量:10
3
作者 李远宁 刘汀 +1 位作者 蒋树强 黄庆明 《通信学报》 EI CSCD 北大核心 2007年第12期147-151,共5页
提出了一种利用"bag of words"模型对视频内容进行建模和匹配的方法。通过量化视频帧的局部特征构建视觉关键词(visual words)辞典,将视频的子镜头表示成若干视觉关键词的集合。在此基础上构建基于子镜头的视觉关键词词组的... 提出了一种利用"bag of words"模型对视频内容进行建模和匹配的方法。通过量化视频帧的局部特征构建视觉关键词(visual words)辞典,将视频的子镜头表示成若干视觉关键词的集合。在此基础上构建基于子镜头的视觉关键词词组的倒排索引,用于视频片段的匹配和检索。这种方法保留了局部特征的显著性及其相对位置关系,而且有效地压缩了视频的表达,加速的视频的匹配和检索过程。实验结果表明,和已有方法相比,基于"bag of words"的视频匹配方法在大视频样本库上获得了更高的检索精度和检索速度。 展开更多
关键词 视频匹配 视觉关键词 BAG of words倒排索引
在线阅读 下载PDF
n-words模型下Hesse稀疏表示的图像检索算法 被引量:2
4
作者 王瑞霞 彭国华 《电子与信息学报》 EI CSCD 北大核心 2016年第5期1115-1122,共8页
论文针对视觉词袋(BOVW)模型放弃图像空间结构的缺点,提出一种基于Hesse稀疏编码的图像检索算法。首先,建立n-words模型,获得图像局部特征表示。n-words模型由一系列连续视觉词获得,是图像特征的一种高级描述。该文从n=1到n=5进行试验,... 论文针对视觉词袋(BOVW)模型放弃图像空间结构的缺点,提出一种基于Hesse稀疏编码的图像检索算法。首先,建立n-words模型,获得图像局部特征表示。n-words模型由一系列连续视觉词获得,是图像特征的一种高级描述。该文从n=1到n=5进行试验,寻找最恰当的n值;其次,将二阶Hesse能量函数融入标准稀疏编码的目标函数,得到Hesse稀疏编码公式;最后,以获得的n-words序列作为编码特征,利用特征符号搜索算法求解最优Hesse系数,计算相似度,返回检索结果。实验在两类数据集上进行,与BOVW模型和已有的算法相比,新算法极大地提高了图像检索的准确率。 展开更多
关键词 图像检索 稀疏编码 视觉词袋模型 n-words模型 Hesse能量函数
在线阅读 下载PDF
基于Bag of Words的干果图像分类研究 被引量:1
5
作者 施明登 周鹏 白铁成 《安徽农业科学》 CAS 2014年第29期10381-10383,共3页
针对干果图像信息量大、分类精度低和耗时多的特点,提出利用Bag of Words模型提取图片的代表特征,并采用朴素贝叶斯分类器指导特征矩阵分类。结果表明,图像分类精度能达到80%,分类处理时间约为2 s。通过增加学习样本来进一步提高分类精... 针对干果图像信息量大、分类精度低和耗时多的特点,提出利用Bag of Words模型提取图片的代表特征,并采用朴素贝叶斯分类器指导特征矩阵分类。结果表明,图像分类精度能达到80%,分类处理时间约为2 s。通过增加学习样本来进一步提高分类精度,将Bag of Words应用于干果图像识别和分类是可行的。 展开更多
关键词 图像分类 词袋模型 朴素贝叶斯分类器
在线阅读 下载PDF
基于Bag-of-words和Hash编码的近似重复图像检测算法
6
作者 王誉天 袁江涛 +1 位作者 秦海权 刘鑫 《计算机应用》 CSCD 北大核心 2013年第3期667-669,共3页
针对近似重复图像检测的传统算法存在检测效率和准确率不够高的缺点,提出了基于Bag-of-words和哈希编码的近似重复图像检测算法。该算法首先利用Bag-of-words把一幅图像表示成一个500维的特征向量;然后,利用主成分分析(PCA)和尺度不变... 针对近似重复图像检测的传统算法存在检测效率和准确率不够高的缺点,提出了基于Bag-of-words和哈希编码的近似重复图像检测算法。该算法首先利用Bag-of-words把一幅图像表示成一个500维的特征向量;然后,利用主成分分析(PCA)和尺度不变特征转换(SIFT)进行特征降维,并利用Hash编码技术对特征进行编码;最后,利用动态距离度量技术实现近似重复图像的检测。实验结果表明,利用该算法进行近似重复图像检测是完全可行的,在准确度和查全率之间做到了较好的平衡,查准率可达90%~95%,查全率可达70%~80%。 展开更多
关键词 近似重复图像 BAG-OF-words 主成分分析 哈希编码 动态距离度量
在线阅读 下载PDF
What Eye Movements Tell About Identifying Compound Words in Reading and Top-Down Effects in Reading Long Texts 被引量:1
7
作者 Jukka Hyn 《心理与行为研究》 2004年第3期497-504,共8页
Two lines of research on eye movements in reading are summarized. One line of research examines how adult readers identify compound words during reading. The other line of research deals with how a specific reading go... Two lines of research on eye movements in reading are summarized. One line of research examines how adult readers identify compound words during reading. The other line of research deals with how a specific reading goal influences the way long expository texts are read. Both lines of research are conducted using Finnish as the source language. With respect to the first research question, it is demonstrated that compound words are recognized either holistically or via their components, depending on the length of the compound word. Readers begin to process whatever information is readily available in the foveal vision(i.e., either the whole-word form or the initial component). The second line of research demonstrates that(1)a specific reading goal is capable of exerting an early effect on readers’ eye fixation patterns,(2)time course analyses based on eye movement patterns can reveal interesting individual differences, and(3)working memory capacity is linked to the efficiency to strategically allocate attention as well as to encode information to and retrieve it from the long-term memory. It is concluded that the eye-tracking technique is an excellent research tool to tap into the workings of the human mind during the comprehension of written texts. 展开更多
关键词 eye movements word recognition COMPOUND words text COMPREHENSION working memory capacity.
在线阅读 下载PDF
结合Word2vec和BiLSTM的民航非计划事件分析方法 被引量:1
8
作者 王捷 周迪 +1 位作者 左洪福 黄维 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2024年第7期917-924,共8页
安全是民航业的核心主题。针对目前民航非计划事件分析严重依赖专家经验及分析效率低下的问题,文章提出一种结合Word2vec和双向长短期记忆(bidirectional long short-term memory,BiLSTM)神经网络模型的民航非计划事件分析方法。首先采... 安全是民航业的核心主题。针对目前民航非计划事件分析严重依赖专家经验及分析效率低下的问题,文章提出一种结合Word2vec和双向长短期记忆(bidirectional long short-term memory,BiLSTM)神经网络模型的民航非计划事件分析方法。首先采用Word2vec模型针对事件文本语料进行词向量训练,缩小空间向量维度;然后通过BiLSTM模型自动提取特征,获取事件文本的完整序列信息和上下文特征向量;最后采用softmax函数对民航非计划事件进行分类。实验结果表明,所提出的方法分类效果更好,能达到更优的准确率和F 1值,对不平衡数据样本同样具有较稳定的分类性能,证明了该方法在民航非计划事件分析上的适用性和有效性。 展开更多
关键词 民航安全 文本分析 非计划事件 word2vec 双向长短期记忆(BiLSTM)神经网络
在线阅读 下载PDF
On C -E Translation of Culturally - loaded Words from a Literary Perspective
9
作者 Zhu Zhe 《学术界》 CSSCI 北大核心 2017年第6期305-314,共10页
The paper discusses translation of culturally-loaded words(CLW),to which the author maintains that great importance should be attached,especially to translation of literary works.The difficulty of translating CLW is d... The paper discusses translation of culturally-loaded words(CLW),to which the author maintains that great importance should be attached,especially to translation of literary works.The difficulty of translating CLW is determined by complexity of culture.The author argues that in translating Chinese words laden with cultural connotations,foreignization should take priority over other strategies when the source text(ST) is highly literary.Thus,foreignness and local flavor in ST can be retained as much as possible in the target text(TT),hence enhancing target readers' appreciation of ST and promoting intercultural exchanges. 展开更多
关键词 culturally- loaded words FOREIGNIZATION equivalent COMPENSATION
在线阅读 下载PDF
基于LDA-Word2vec的图书情报领域机器学习研究主题演化与热点主题识别 被引量:34
10
作者 胡泽文 韩雅蓉 王梦雅 《现代情报》 CSSCI 北大核心 2024年第4期154-167,共14页
[目的/意义]在人工智能技术及应用快速发展与深刻变革背景下,机器学习领域不断出现新的研究主题和方法,深度学习和强化学习技术持续发展。因此,有必要探索不同领域机器学习研究主题演化过程,并识别出热点与新兴主题。[方法/过程]本文以... [目的/意义]在人工智能技术及应用快速发展与深刻变革背景下,机器学习领域不断出现新的研究主题和方法,深度学习和强化学习技术持续发展。因此,有必要探索不同领域机器学习研究主题演化过程,并识别出热点与新兴主题。[方法/过程]本文以图书情报领域中2011—2022年Web of Science数据库中的机器学习研究论文为例,融合LDA和Word2vec方法进行主题建模和主题演化分析,引入主题强度、主题影响力、主题关注度与主题新颖性指标识别热点主题与新兴热点主题。[结果/结论]研究结果表明,(1)Word2vec语义处理能力与LDA主题演化能力的结合能够更加准确地识别研究主题,直观展示研究主题的分阶段演化规律;(2)图书情报领域的机器学习研究主题主要分为自然语言处理与文本分析、数据挖掘与分析、信息与知识服务三大类范畴。各类主题之间的关联性较强,且具有主题关联演化特征;(3)设计的主题强度、主题影响力和主题关注度指标及综合指标能够较好地识别出2011—2014年、2015—2018年和2019—2022年3个不同周期阶段的热点主题。 展开更多
关键词 机器学习 LDA模型 word2vec 主题演化 热点主题 主题影响力 主题关注度
在线阅读 下载PDF
KEY WORDS INDEX IN ENGLISH (2004;Volume18)
11
《中国药理学与毒理学杂志》 CAS CSCD 北大核心 2004年第6期474-476,共3页
关键词 CD ENGLISH KEY words INDEX IN
在线阅读 下载PDF
An Algorithm to Format English Words
12
作者 Chen ZhenjieNanjing Institute of Posts & Coromunictions Min Zhenhui, Shia Zhenhua Nanjing Aeronautical Institute 《中文信息学报》 CSCD 1991年第2期63-64,共2页
This paper introduces an English word formation algorithm used in natural language processing system, which is based on affix stripping strategy. The goal is to reduce the redundant information in the machine lexicon ... This paper introduces an English word formation algorithm used in natural language processing system, which is based on affix stripping strategy. The goal is to reduce the redundant information in the machine lexicon and improve the ability to recognize words. In appendix, a formation program written in Turbo-Prolog is presented. 展开更多
关键词 recognize REDUNDANT LEXICON STRIPPING PROLOG word
在线阅读 下载PDF
More on the Multiplicity of Semantic Relations between Words
13
作者 Lu Jian-ming 《苏州大学学报(哲学社会科学版)》 CSSCI 北大核心 2012年第4期191-192,共2页
This paper further discusses the Mutiplicity of Semantic Relations between Words(MSRW)(Lu 2010)in two aspects:the reason why the semantie relations between two words can be multiple and the significance of understandi... This paper further discusses the Mutiplicity of Semantic Relations between Words(MSRW)(Lu 2010)in two aspects:the reason why the semantie relations between two words can be multiple and the significance of understanding the MSRW.Through examples,this paper points out that understanding the MSRW is of particular importance not only in deepening our knowledge about lexical semantics,but also in advancing the methodology of syntactic analysis.The Construction-Chunk Approach,a new methodology of syntactic analysis built on the MSRW,is a case in point. 展开更多
关键词 Semanties Muliplicity of Semantie Relations between words Construction-Chunk Approach
在线阅读 下载PDF
融合Word2Vec词嵌入的多核卷积神经网络音乐歌词多情感分类方法 被引量:2
14
作者 张昱 冯亚寒 丁千惠 《科学技术与工程》 北大核心 2024年第20期8598-8605,共8页
目前,音乐歌词情感分类大多以二标签极性情感为主,多情感标签分类较少,并且对于情感性不确定的歌词而言,得到的分类性能不高。为了解决多情感标签研究分类的不足,以及提高分类准确性,提出一种利用Word2Vec词嵌入技术,并使用多核卷积神... 目前,音乐歌词情感分类大多以二标签极性情感为主,多情感标签分类较少,并且对于情感性不确定的歌词而言,得到的分类性能不高。为了解决多情感标签研究分类的不足,以及提高分类准确性,提出一种利用Word2Vec词嵌入技术,并使用多核卷积神经网络作为分类器的音乐歌词多情感分类方法。该方法首先结合音乐歌词文本,进行数据预处理和可视化分析;其次利用Word2Vec词嵌入提取歌词局部特征,构建特征情感向量,挖掘歌词中情感信息,将歌词转化为更利于分类器模型输入的词向量;最后在分类器中,选用卷积神经网络模型,并在此基础上采用不同高度卷积核的方式构建新模型以此得到多情感分类。结果表明:音乐歌词多情感分类的结果达到94.26%,与传统CNN相比,分类精确率提高了6.86%,取得了良好性能。 展开更多
关键词 自然语言处理 情感分类 卷积神经网络 词嵌入 文本分类 音乐歌词
在线阅读 下载PDF
A Contrastive Analysis of the Structure of Prosodic Words in Mandarin and English
15
作者 GUO Zhongzi 《北京第二外国语学院学报》 2016年第5期137-137,共1页
This paper, particularly focusing on the pitch of prosodic words,has conducted a contrastive study on the structure of prosodic words in Englishand Mandarin . This paper reports a Mandarin monologue speech corpus-stud... This paper, particularly focusing on the pitch of prosodic words,has conducted a contrastive study on the structure of prosodic words in Englishand Mandarin . This paper reports a Mandarin monologue speech corpus-study, anexperimental phonetic attempt to conduct a study on the pitch of trisyllabic prosodicwords in Mandarin monologue. In addition, taking the characteristics of Englishprosodic words into consideration, the paper makes a contrastive analysis of prosodicwords in English and Mandarin. This study finds that the pitch of trisyllabic prosodicwords in Mandarin is inevitably affected by structural factors. As far as the leftsyllable is concerned, the grammatical category, prosodic hierarchical boundary andthe position of the intonational phrase where the syllable is located, the mid syllableand the right syllable may have influences on the pitch contour of the left syllable.As to the mid syllable, the grammatical category, the left syllable, the right syllableand the position of the intonational phrase where the syllable is located may haveinfluences on the pitch contour of the mid syllable. As for the right syllable, theprosodic hierarchical boundary where the syllable is located and the mid syllable mayhave effects on the pitch contour of the right syllable. Different from the previousfindings of the study on read corpus, this study shows that the mid syllable not onlyhas dissimilatory effects but also has assimilatory effects on the pitch of its precedingsyllable. The left syllable has anticipatory effects on the onset pitch of the mid syllableand the right syllable has coarticulation effects on the offset pitch of the mid syllable. 展开更多
关键词 prosodic words structural factors PITCH REGRESSIVE effects COARTICULATION
在线阅读 下载PDF
论科技英语中wh-words引导名词性从句的用法
16
作者 陈晓霞 《大连理工大学学报(社会科学版)》 2007年第1期80-83,共4页
科技英语因其自身特点而成为一个独特的语域。wh-words可以用来引导各种从句。文章研究在科技英语中wh-words的句法功能,重点研究wh-words引导名词性从句的用法。运用统计学方法对wh-words在科技英语(T4)等语料库中的分布频率进行分析,... 科技英语因其自身特点而成为一个独特的语域。wh-words可以用来引导各种从句。文章研究在科技英语中wh-words的句法功能,重点研究wh-words引导名词性从句的用法。运用统计学方法对wh-words在科技英语(T4)等语料库中的分布频率进行分析,根据卡方测试的结果做出判断。wh-words在不同的从句中使用的频率高低不等,有些wh-words在不同的语料库中的分布存在着显著不同,如what等词。因此,在某种程度上可以说,wh-words这一组词的用法特点是科技英语区别于普通英语的一个反映。 展开更多
关键词 wh-词语 科技英语 名词性从句 语料库 卡方测试 显著水平
在线阅读 下载PDF
Function Words Analysis——A Reading Comprehension Aid for Chinese Engineers
17
作者 Wu Shuoping and Liu Lian(The Second Academy, MAS) 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 1990年第1期86-90,共5页
Background Generally speaking. Chinese college graduates in the fifties and sixties took Russian as their second language, and those who graduated in the seventies had no second language to speak of. Now, in the years... Background Generally speaking. Chinese college graduates in the fifties and sixties took Russian as their second language, and those who graduated in the seventies had no second language to speak of. Now, in the years of our Open Door Policy, they find they have to learn some English and learn it quickly. They try to learn from radio and TV and many take English courses of 4 to 6 months, with varying degree of success. Their chief stumbling blocks 展开更多
关键词 Function words Analysis A Reading Comprehension Aid for Chinese Engineers
在线阅读 下载PDF
New Applied Research on Semantic Electronic Thematic Words
18
作者 王兰成 田梅 《上海交通大学学报》 EI CAS CSCD 北大核心 2003年第S1期152-156,共5页
随着计算机网络与信息技术的迅速发展 ,广大用户对网上资源信息检索的质量提出更高要求 ,其关键因素是信息的自动处理和控制能力 ,电子叙词表建构及其计算机管理是提高信息检索质量的重要保证 .文中建立了叙词表、叙词关系表、停用词表... 随着计算机网络与信息技术的迅速发展 ,广大用户对网上资源信息检索的质量提出更高要求 ,其关键因素是信息的自动处理和控制能力 ,电子叙词表建构及其计算机管理是提高信息检索质量的重要保证 .文中建立了叙词表、叙词关系表、停用词表以及范畴索引、词族索引 ,并给出了具体实现的数据结构与算法 .实践表明 。 展开更多
关键词 计算机程序 叙词 语义环境 算法
在线阅读 下载PDF
“Words”and“Meaning”in the Horizon of Philosophical Hermeneutics
19
作者 Yu Xiangyue Li Jiajun 《学术界》 CSSCI 北大核心 2016年第11期304-309,共6页
The article holds that the problem of the relationship between"words"and"meaning"has always been the philosophical proposition.Through analyzing the relationship between"words"and"me... The article holds that the problem of the relationship between"words"and"meaning"has always been the philosophical proposition.Through analyzing the relationship between"words"and"meaning"and probing into"disoourse","text"and"space-time history",the author thinks that the interpreters'preconceptions,preexistence,pre-structure and different perspectives have resulted in diverse forms of interpretations,and the being of each kind of form has its own rationality.Moreover,the process in which the interpreters interpret"words","discourse","text"and"history"is also the process to interpret themselves.Nevertheless,being able to say and being unable to say are soaked in the whole process of interpretation,and,as a result,human beings will always be confronted with a kind of"say and cannot say"embarrassment. 展开更多
关键词 哲学 词义 文学作品 文化研究
在线阅读 下载PDF
Was 还是 Words?——也谈美国语音
20
作者 杨大平 《山东外语教学》 北大核心 1991年第3期88-88,共1页
近年来,随着改革开放,中国和北美的联系迅速增加,美式英语也日趋流行,无论在对外英语广播节目中,还是在学校的英语教学中,操美音者大有压倒之势。然而稍加留意就会发现其中不乏各种语音错误。要求人人都讲得标准,未免强人所难,正如中国... 近年来,随着改革开放,中国和北美的联系迅速增加,美式英语也日趋流行,无论在对外英语广播节目中,还是在学校的英语教学中,操美音者大有压倒之势。然而稍加留意就会发现其中不乏各种语音错误。要求人人都讲得标准,未免强人所难,正如中国人不可能都讲标准普通话一样。但是有一个基本的标准,即必须音能达意,也就是必须遵循音位(phoneme)的变化原则。值得注意的是,有些人在模仿美音时,不自觉地犯了扩大化的毛病。 展开更多
关键词 语音错误 广播节目 Was words 字母组合 中国学生 闹出笑话 音位变体 自由变体 不自觉
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部