期刊文献+
共找到137篇文章
< 1 2 7 >
每页显示 20 50 100
基于统计语言模型改进的Word2Vec优化策略研究 被引量:14
1
作者 张克君 史泰猛 +1 位作者 李伟男 钱榕 《中文信息学报》 CSCD 北大核心 2019年第7期11-19,共9页
该文从训练词向量的语言模型入手,研究了经典skip-gram、CBOW语言模型训练出的词向量的优缺点,引入TFIDF文本关键词计算法,提出了一种基于关键词改进的语言模型。研究发现,经典skip-gram、CBOW语言模型只考虑到词本身与其上下文的联系,... 该文从训练词向量的语言模型入手,研究了经典skip-gram、CBOW语言模型训练出的词向量的优缺点,引入TFIDF文本关键词计算法,提出了一种基于关键词改进的语言模型。研究发现,经典skip-gram、CBOW语言模型只考虑到词本身与其上下文的联系,而改进的语言模型通过文本关键词建立了词本身与整个文本之间的联系,在词向量训练结果的查准率和相似度方面,改进模型训练出的词向量较skip-gram、CBOW语言模型有一个小幅度的提升。通过基于维基百科1.5GB中文语料的词向量训练实验对比后发现,使用CBOW-TFIDF模型训练出的词向量在相似词测试任务中结果最佳;把改进的词向量应用到情感倾向性分析任务中,正向评价的精确率和F1值分别提高了4.79%、4.92%,因此基于统计语言模型改进的词向量,对于情感倾向性分析等以词向量为基础的应用研究工作有较为重要的实践意义。 展开更多
关键词 词向量 统计语言模型 TFIDF 文本关键词 CBOW-TFIDF
在线阅读 下载PDF
结合LDA与Word2vec的文本语义增强方法 被引量:28
2
作者 唐焕玲 卫红敏 +2 位作者 王育林 朱辉 窦全胜 《计算机工程与应用》 CSCD 北大核心 2022年第13期135-145,共11页
文本的语义表示是自然语言处理和机器学习领域的研究难点,针对目前文本表示中的语义缺失问题,基于LDA主题模型和Word2vec模型,提出一种新的文本语义增强方法Sem2vec(semantic to vector)模型。该模型利用LDA主题模型获得单词的主题分布... 文本的语义表示是自然语言处理和机器学习领域的研究难点,针对目前文本表示中的语义缺失问题,基于LDA主题模型和Word2vec模型,提出一种新的文本语义增强方法Sem2vec(semantic to vector)模型。该模型利用LDA主题模型获得单词的主题分布,计算单词与其上下文词的主题相似度,作为主题语义信息融入到词向量中,代替one-hot向量输入至Sem2vec模型,在最大化对数似然目标函数约束下,训练Sem2vec模型的最优参数,最终输出增强的语义词向量表示,并进一步得到文本的语义增强表示。在不同数据集上的实验结果表明,相比其他经典模型,Sem2vec模型的语义词向量之间的语义相似度计算更为准确。另外,根据Sem2vec模型得到的文本语义向量,在多种文本分类算法上的分类结果,较其他经典模型可以提升0.58%~3.5%,同时也提升了时间性能。 展开更多
关键词 LDA主题模型 word2vec模型 语义词向量 语义相似度 文本分类
在线阅读 下载PDF
word2vec-ACV:OOV语境含义的词向量生成模型 被引量:9
3
作者 王永贵 郑泽 李玥 《计算机应用研究》 CSCD 北大核心 2019年第6期1623-1628,共6页
针对word2vec模型生成的词向量缺乏语境的多义性以及无法创建集外词(OOV)词向量的问题,引入相似信息与word2vec模型相结合,提出word2vec-ACV模型。该模型首先基于连续词袋(CBOW)和Hierarchical softmax的word2vec模型训练出词向量矩阵... 针对word2vec模型生成的词向量缺乏语境的多义性以及无法创建集外词(OOV)词向量的问题,引入相似信息与word2vec模型相结合,提出word2vec-ACV模型。该模型首先基于连续词袋(CBOW)和Hierarchical softmax的word2vec模型训练出词向量矩阵即权重矩阵;然后将共现矩阵进行归一化处理得到平均上下文词向量,再将词向量组成平均上下文词向量矩阵;最后将平均上下文词向量矩阵与权重矩阵相乘得到词向量矩阵。为了能同时解决集外词及多义性问题,将平均上下文词向量分为全局平均上下文词向量(global ACV)和局部平均上下文词向量(local ACV)两种,并对两者取权值组成新的平均上下文词向量矩阵,并将word2vec-ACV模型和word2vec模型分别进行类比任务实验和命名实体识别任务实验。实验结果表明,word2vec-ACV模型同时解决了语境多义性以及创建集外词词向量的问题,降低了时间消耗,提升了词向量表达的准确性和对海量词汇的处理能力。 展开更多
关键词 word2vec模型 词向量 共现矩阵 平均上下文词向量
在线阅读 下载PDF
基于Word2Vec的SCI地址字段数据清洗方法研究 被引量:16
4
作者 孙源 《情报杂志》 CSSCI 北大核心 2019年第2期195-200,共6页
[目的/意义]旨在设计一种有效针对SCI地址字段的数据清洗方案,将Word2Vec词向量模型引入到SCI地址字段的清洗过程中,利用地址字段中上下文的信息,识别SCI地址字段中机构名称的不同写法,最终建立"机构名称映射表",达到数据清... [目的/意义]旨在设计一种有效针对SCI地址字段的数据清洗方案,将Word2Vec词向量模型引入到SCI地址字段的清洗过程中,利用地址字段中上下文的信息,识别SCI地址字段中机构名称的不同写法,最终建立"机构名称映射表",达到数据清洗的目的。[方法/过程]首先,对SCI地址字段的数据进行预处理,按照规律将地址字段的信息构建成专有名词。然后,引入Word2Vec模型训练,利用训练好的模型结合余弦相似度找出与待清洗机构名相似的拼写形式。最后,建立"机构名称映射表"完成清洗。[结果/结论]通过实证分析发现,第一,在相同阈值下,该方法针对机构的识别准确要比传统字符匹配的方法要高。第二,在机构名变体与缩写的识别能力上有较好的表现。第三,该方法的运算速度是传统字符匹配算法的近40倍。Word2Vec词向量模型在数据清洗中有一定应用价值,能够根据SCI地址字段的上下文信息,清洗出指定机构名称的形似、变体和缩写机构名,从而达到数据规范化的目的。 展开更多
关键词 数据清洗 word2Vec 词向量模型 SCI地址字段
在线阅读 下载PDF
基于文本挖掘的我国长期护理保险政策供给特征研究
5
作者 刘芷含 李鹤斌 +1 位作者 卢志诚 王雪晗 《护理研究》 北大核心 2025年第19期3242-3255,共14页
目的:探索我国长期护理保险政策的核心要点,为后续提高长期护理保险政策文件的制定及落实提供参考。方法:采用词频-逆文档频率(TF-IDF)词向量模型,对中国长期护理保险试点政策数据库中的1600余份我国长期护理保险政策文件进行文本挖掘... 目的:探索我国长期护理保险政策的核心要点,为后续提高长期护理保险政策文件的制定及落实提供参考。方法:采用词频-逆文档频率(TF-IDF)词向量模型,对中国长期护理保险试点政策数据库中的1600余份我国长期护理保险政策文件进行文本挖掘研究。结果:利用多维尺度分析将政策文本内容梳理出宏观政策环境、服务模式与内容、筹资与给付标准3条政策脉络。结论:建议政府创新制度供给,鼓励数据驱动供给,加强危机学习意识。 展开更多
关键词 长期护理保险 词频-逆文档频率词向量模型 多维尺度分析 文本挖掘 政策供给
在线阅读 下载PDF
基于语义增强的装备事件抽取方法
6
作者 方睿 崔良中 方圆婧 《计算机科学》 北大核心 2025年第S1期286-294,共9页
信息时代下,装备领域的数据量急剧增长,使得论证人员难以高效地从中获取关键信息,进而支持相应的数据分析和论证工作。针对装备领域事件抽取事件论元边界模糊的问题,提出了一种基于语义增强的装备事件抽取方法。该方法利用装备领域的专... 信息时代下,装备领域的数据量急剧增长,使得论证人员难以高效地从中获取关键信息,进而支持相应的数据分析和论证工作。针对装备领域事件抽取事件论元边界模糊的问题,提出了一种基于语义增强的装备事件抽取方法。该方法利用装备领域的专业术语和词汇信息,构建领域词向量,并设计能够兼容和整合不同粒度语义信息的模型结构,将装备领域词向量与预训练模型ERNIE生成的字符向量进行融合,将专业术语知识和通用语言理解能力相结合,实现更全面的语义信息捕捉,增强模型对装备领域文本语义的理解,从而提升模型对事件论元边界的识别能力。实验结果表明,该方法在装备领域数据集上取得了优于基线方法的F1值,相比CK-BERT模型F1值提升了3.83%;在公开数据集ACE2005上进行的实验验证了其能有效提升装备领域事件要素抽取的性能。 展开更多
关键词 装备领域 事件抽取 语义增强 领域词向量 预训练模型
在线阅读 下载PDF
获取适配专利知识的功能模型相似度计算方法
7
作者 曹国忠 李凯 《机械设计》 北大核心 2025年第4期175-181,共7页
为优化产品创新知识推送的适配性问题,在构建模型进行知识匹配与推送研究基础上,提出一种获取适配专利知识的功能模型相似度计算方法。该方法将TRIZ中的功能模型与知识推送过程相结合,根据功能模型选取待改进设计中相似度计算的要素,引... 为优化产品创新知识推送的适配性问题,在构建模型进行知识匹配与推送研究基础上,提出一种获取适配专利知识的功能模型相似度计算方法。该方法将TRIZ中的功能模型与知识推送过程相结合,根据功能模型选取待改进设计中相似度计算的要素,引入图论算法;基于功能模型计算所选要素的权重;融合专利检索与专利自然语言处理技术提取专利设计中的相似度计算要素,采用词向量模型实现相似度计算。对存在刹车导管切割长度不良问题的切管机进行实例研究,构建其功能模型,并采用计算方法匹配相似专利方案功能模型,验证该计算方法的可行性与准确性。基于该方法准确计算匹配相似专利方案功能模型,从结构层面直接对设计问题的解决进行启发,可提升产品创新知识推送的适配性,进而提高创新设计效率。 展开更多
关键词 功能模型相似度计算 适配性专利知识 图论算法 自然语言处理 词向量模型
在线阅读 下载PDF
基于TB-IDACNN的新闻推荐模型
8
作者 辛春花 鲁晓波 何婷 《计算机工程与设计》 北大核心 2025年第5期1387-1394,共8页
针对现有新闻推荐方法存在未考虑新闻的动态特性、难以深度挖掘新闻的语义信息等问题,提出一种融合TinyBERT和改进型动态注意卷积神经网络的个性化新闻推荐模型(TB-IDACNN)。充分利用TinyBERT词向量模型、卷积神经网络和内积注意力网络... 针对现有新闻推荐方法存在未考虑新闻的动态特性、难以深度挖掘新闻的语义信息等问题,提出一种融合TinyBERT和改进型动态注意卷积神经网络的个性化新闻推荐模型(TB-IDACNN)。充分利用TinyBERT词向量模型、卷积神经网络和内积注意力网络等深度学习模型的优势,综合考虑新闻的动态特性和静态特性,实现个性化新闻推荐。在MIND和Adressa数据集上的结果表明,相比其它几种先进的新闻推荐模型,所提模型可以获得更好的推荐性能,能够有效满足用户在新闻推荐任务中的需求。 展开更多
关键词 动态神经网络 新闻推荐 词嵌入模型 内积注意力机制 卷积神经网络 词向量化 平均加权池化
在线阅读 下载PDF
基于内容和兴趣漂移模型的电影推荐算法研究 被引量:32
9
作者 吕学强 王腾 +1 位作者 李雪伟 董志安 《计算机应用研究》 CSCD 北大核心 2018年第3期717-720,802,共5页
针对基于内容的推荐算法中,内容相似度计算精度低、用户兴趣漂移等问题,提出一种结合影评内容相似度和长短期兴趣模型来计算电影相似度的推荐方法。算法利用TextRank、Word2Vec等技术和模型对影评进行关键词抽取和词向量构建,同时基于Wo... 针对基于内容的推荐算法中,内容相似度计算精度低、用户兴趣漂移等问题,提出一种结合影评内容相似度和长短期兴趣模型来计算电影相似度的推荐方法。算法利用TextRank、Word2Vec等技术和模型对影评进行关键词抽取和词向量构建,同时基于Word2Vec训练结果进行电影内容相似度计算,一定程度上解决了近义词、网络词等带来的准确率下降问题;然后基于长短期兴趣漂移模型,统计用户对不同内容属性的偏好权重,并随时间窗口动态计算电影相似度矩阵,缓解了用户兴趣随时间漂移而改的问题;最后根据不同推荐策略获得推荐结果。实验结果证明,该算法比对比方法正确率提高了5%左右,同时兴趣模型提取了用户长短期兴趣标签,在工业界及基于标签的算法等场景中都具有很高的实用价值。 展开更多
关键词 个性推荐 词向量模型 用户偏好 兴趣漂移 聚类 集合相似度
在线阅读 下载PDF
一种基于LDA主题模型的话题发现方法 被引量:22
10
作者 郭蓝天 李扬 +2 位作者 慕德俊 杨涛 李哲 《西北工业大学学报》 EI CAS CSCD 北大核心 2016年第4期698-702,共5页
话题发现是提取热点话题并掌握其演化规律的关键技术之一。针对社交网络中海量短文本信息具有高维性导致主题模型难以处理以及主题分布不均导致主题不明确的问题,提出一种基于LDA(latent dirichlet allocation)主题模型的CBOW-LDA主题... 话题发现是提取热点话题并掌握其演化规律的关键技术之一。针对社交网络中海量短文本信息具有高维性导致主题模型难以处理以及主题分布不均导致主题不明确的问题,提出一种基于LDA(latent dirichlet allocation)主题模型的CBOW-LDA主题建模方法,通过引入基于CBOW(continuous bag-of-word)模型的词向量化方法对目标语料进行相似词的聚类,能够有效降低LDA模型输入文本的维度,并且使主题更明确。通过在真实数据集上计算分析,与现有基于词频权重的词向量化LDA方法相比,在相同主题词数情况下困惑度可降低约3%。 展开更多
关键词 词向量 LDA模型 话题发现 困惑度
在线阅读 下载PDF
基于领域知识和词向量的词义消歧方法 被引量:14
11
作者 杨安 李素建 李芸 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第2期204-210,共7页
利用无标注文本构建词向量模型,结合特定领域的关键词信息,提出一种词义消歧方法。以环境领域的待消歧文本作为评测语料,通过与Lesk等其他消歧方法进行比较,证明了所提方法的有效性。通过引入不同的领域知识,证明该方法亦可在其他领域... 利用无标注文本构建词向量模型,结合特定领域的关键词信息,提出一种词义消歧方法。以环境领域的待消歧文本作为评测语料,通过与Lesk等其他消歧方法进行比较,证明了所提方法的有效性。通过引入不同的领域知识,证明该方法亦可在其他领域的文本消歧任务中加以应用。 展开更多
关键词 词义消歧 词向量模型 领域知识
在线阅读 下载PDF
自然语言处理领域中的词嵌入方法综述 被引量:23
12
作者 曾骏 王子威 +2 位作者 于扬 文俊浩 高旻 《计算机科学与探索》 CSCD 北大核心 2024年第1期24-43,共20页
词嵌入作为自然语言处理任务的第一步,其目的是将输入的自然语言文本转换为模型可以处理的数值向量,即词向量,也称词的分布式表示。词向量作为自然语言处理任务的根基,是完成一切自然语言处理任务的前提。然而,国内外针对词嵌入方法的... 词嵌入作为自然语言处理任务的第一步,其目的是将输入的自然语言文本转换为模型可以处理的数值向量,即词向量,也称词的分布式表示。词向量作为自然语言处理任务的根基,是完成一切自然语言处理任务的前提。然而,国内外针对词嵌入方法的综述文献大多只关注于不同词嵌入方法本身的技术路线,而未能将词嵌入的前置分词方法以及词嵌入方法完整的演变趋势进行分析与概述。以word2vec模型和Transformer模型作为划分点,从生成的词向量是否能够动态地改变其内隐的语义信息来适配输入句子的整体语义这一角度,将词嵌入方法划分为静态词嵌入方法和动态词嵌入方法,并对此展开讨论。同时,针对词嵌入中的分词方法,包括整词切分和子词切分,进行了对比和分析;针对训练词向量所使用的语言模型,从概率语言模型到神经概率语言模型再到如今的深度上下文语言模型的演化,进行了详细列举和阐述;针对预训练语言模型时使用的训练策略进行了总结和探讨。最后,总结词向量质量的评估方法,分析词嵌入方法的当前现状并对其未来发展方向进行展望。 展开更多
关键词 词向量 词嵌入方法 自然语言处理 语言模型 分词 词向量评估
在线阅读 下载PDF
基于词向量空间模型的中文文本分类方法 被引量:15
13
作者 胡学钢 董学春 谢飞 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第10期1261-1264,共4页
大多文本分类方法是基于向量空间模型的,基于这一模型的文本向量维数较高,导致分类器效率难以提高。针对这一不足,该文提出基于词向量空间模型的文本分类方法。其主要思想是把文本的特征词表示成空间向量,通过训练得到词-类别支持度矩阵... 大多文本分类方法是基于向量空间模型的,基于这一模型的文本向量维数较高,导致分类器效率难以提高。针对这一不足,该文提出基于词向量空间模型的文本分类方法。其主要思想是把文本的特征词表示成空间向量,通过训练得到词-类别支持度矩阵,根据待分文本的词和词-类别支持度矩阵计算文本与类别的相似度。实验证明,这一分类方法取得了较高的分类精度和分类效率。 展开更多
关键词 文本分类 向量空间模型 K-最近邻居 词向量空间模型
在线阅读 下载PDF
基于语义信息的中文短信文本相似度研究 被引量:9
14
作者 刘金岭 宋连友 范玉虹 《计算机工程》 CAS CSCD 2012年第13期58-60,70,共4页
在传统TF-IDF模型基础上分析中文短信文本中特征词的语义信息,提出一种中文短信文本相似度度量方法。对短信文本进行预处理,计算各词语的TF-IDF值,并选择TF-IDF值较高的词作为特征词,借助向量空间模型的词语向量相似度,结合词语相似度加... 在传统TF-IDF模型基础上分析中文短信文本中特征词的语义信息,提出一种中文短信文本相似度度量方法。对短信文本进行预处理,计算各词语的TF-IDF值,并选择TF-IDF值较高的词作为特征词,借助向量空间模型的词语向量相似度,结合词语相似度加权,给出2篇短信文本相似度的计算方法。实验结果表明,该方法在F-度量值上优于TF-IDF算法及词语语义相似度算法。 展开更多
关键词 短信文本 相似度 TF-IDF模型 特征词 向量空间模型
在线阅读 下载PDF
基于单词相似度的文本聚类 被引量:9
15
作者 李星毅 曾路平 施化吉 《计算机工程与设计》 CSCD 北大核心 2009年第8期1966-1968,共3页
研究了现有的基于向量空间模型的文本聚类算法,发现这些算法都存在数据维度过高和忽略了单词之间语义关系的缺点。针对这些问题,提出一种基于单词相似度的文本聚类算法,该算法首先利用单词相似度对单词进行分类获得单词间的语义关系,然... 研究了现有的基于向量空间模型的文本聚类算法,发现这些算法都存在数据维度过高和忽略了单词之间语义关系的缺点。针对这些问题,提出一种基于单词相似度的文本聚类算法,该算法首先利用单词相似度对单词进行分类获得单词间的语义关系,然后利用产生的单词类作为向量空间的项表示文本降低了向量空间的维度,最后采用基于划分聚类方法对文本聚类。实验结果表明,相对于传统基于向量空间模型的聚类算法,该算法具有较好的聚类效果。 展开更多
关键词 文本聚类 单词相似度 向量空间模型 单词类向量空间 文本表示
在线阅读 下载PDF
基于GloVe词向量的“技术——应用”发现研究 被引量:6
16
作者 吉久明 施陈炜 +1 位作者 李楠 康健 《现代情报》 CSSCI 2019年第4期13-22,共10页
[目的/意义]本文探讨挖掘技术和应用间的关联关系,便于把握技术的目标应用场景和了解应用需求的可选技术方案,为技术转化提供基础。[方法/过程]首先,建立基于改进GloVe词向量的"技术——应用"发现模型,提出改进词向量的算法;... [目的/意义]本文探讨挖掘技术和应用间的关联关系,便于把握技术的目标应用场景和了解应用需求的可选技术方案,为技术转化提供基础。[方法/过程]首先,建立基于改进GloVe词向量的"技术——应用"发现模型,提出改进词向量的算法;然后,以机器学习技术为例,获取该领域学术论文文摘数据,预处理后建立训练文本集合,再使用改进GloVe模型训练获得词向量;最后,对词向量聚类获得"技术"和"应用"类词汇集,通过共现获得两者之间的关联并分析。[结果/结论]实验结果表明,本文改进GloVe模型后训练的词向量性能获得提升,聚类效果好,最终实现"技术——应用"的关联分析。 展开更多
关键词 词向量 GloVe模型 文本聚类 共现分析
在线阅读 下载PDF
基于语义相似度的论坛话题追踪方法 被引量:22
17
作者 席耀一 林琛 +2 位作者 李弼程 周杰 许旭阳 《计算机应用》 CSCD 北大核心 2011年第1期93-96,共4页
现有的话题追踪方法大多面向新闻数据,将其应用于论坛时效果不够理想。结合论坛的特点,提出一种基于语义相似度的论坛话题追踪方法。该方法首先通过构建话题和帖子的关键词表建立其文本表示模型,然后利用知网计算两个关键词表的语义相... 现有的话题追踪方法大多面向新闻数据,将其应用于论坛时效果不够理想。结合论坛的特点,提出一种基于语义相似度的论坛话题追踪方法。该方法首先通过构建话题和帖子的关键词表建立其文本表示模型,然后利用知网计算两个关键词表的语义相似度并以此作为帖子与话题的相关程度,最后根据相关程度实现论坛话题追踪。该方法较好地避免了向量空间模型的缺陷。实验表明,该方法能比较有效地解决面向论坛的话题追踪问题。 展开更多
关键词 话题追踪 论坛 关键词 语义相似度 向量空间模型
在线阅读 下载PDF
基于词向量模型的漏洞检测方法 被引量:2
18
作者 肖巍 胡景浩 +2 位作者 侯正章 王涛 潘超 《吉林大学学报(理学版)》 CAS 北大核心 2023年第6期1358-1366,共9页
针对漏洞检测领域面临的实验平台不统一、数据集异构等问题,研究词向量模型在C/C++函数漏洞检测方面的应用.用5种词向量模型对源代码生成的抽象语法树结构进行知识表示,用6种神经网络模型进行漏洞检测,实验结果表明,函数级代码具有浅层... 针对漏洞检测领域面临的实验平台不统一、数据集异构等问题,研究词向量模型在C/C++函数漏洞检测方面的应用.用5种词向量模型对源代码生成的抽象语法树结构进行知识表示,用6种神经网络模型进行漏洞检测,实验结果表明,函数级代码具有浅层的语义关系,代码块内部联系紧密. 展开更多
关键词 词向量模型 漏洞检测 抽象语法树 代码表征 神经网络
在线阅读 下载PDF
基于词序方法的文本相似度计算模型 被引量:7
19
作者 郭武斌 周宽久 苏振魁 《情报学报》 CSSCI 北大核心 2008年第6期857-862,共6页
针对传统向量空间模型对文本相似度的计算未考虑词序导致偏差的问题,提出使用马尔可夫模型的状态转移矩阵、两两文本的最长公共子序列以及它们的所有公共子串信息来描述词序信息,在此基础上提出一种将马尔可夫状态转移矩阵、最长公共... 针对传统向量空间模型对文本相似度的计算未考虑词序导致偏差的问题,提出使用马尔可夫模型的状态转移矩阵、两两文本的最长公共子序列以及它们的所有公共子串信息来描述词序信息,在此基础上提出一种将马尔可夫状态转移矩阵、最长公共子序列、公共子串和TF-IDF相结合,兼顾词序和词频信息的文本相似度计算方法,并使用英文TREC-9的部分数据集对基于词序方法的文本相似度计算方法进行了测试。试验结果表明:在同等分词及评估条件下,基于词序方法的文本相似度计算结果的准确率相对于单纯采用传统的基于向量空间模型的TF-IDF方法提高了5%~15%。 展开更多
关键词 文本相似度 词序 向量空间模型 TF-IDF方法
在线阅读 下载PDF
面向领域的个性化智能检索系统MySpy的研究与开发 被引量:5
20
作者 陈世平 周福华 俞海 《小型微型计算机系统》 CSCD 北大核心 2002年第11期1336-1339,共4页
针对互联网上的“Rich Data Poor Information”问题 ,进行了面向领域的个性化智能检索系统的开发与研究 .系统采用多 Agent技术实现对 web文档索引数据库管理 ;实现基于智能代理的信息过滤和个性化服务 ;利用辅助词典、同义词词典和蕴... 针对互联网上的“Rich Data Poor Information”问题 ,进行了面向领域的个性化智能检索系统的开发与研究 .系统采用多 Agent技术实现对 web文档索引数据库管理 ;实现基于智能代理的信息过滤和个性化服务 ;利用辅助词典、同义词词典和蕴含词词典 ,对查询词进行概念扩检 ,使检索结果能返回与查询需求相似的文档 . 展开更多
关键词 个性化 智能检索系统 MySpy 智能代理 信息检索 分词 向量空间模型 全文检索 因特网
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部