期刊文献+
共找到44篇文章
< 1 2 3 >
每页显示 20 50 100
多视图融合DJ-TextRCNN的古籍文本主题推荐研究 被引量:3
1
作者 武帅 杨秀璋 何琳 《情报学报》 CSSCI CSCD 北大核心 2024年第1期61-75,共15页
传统编目分类和规则匹配方法存在工作效能低、过度依赖专家知识、缺乏对古籍文本自身语义的深层次挖掘、编目主题边界模糊、较难实现对古籍文本领域主题的精准推荐等问题。为此,本文结合古籍语料特征探究如何实现精准推荐符合研究者需... 传统编目分类和规则匹配方法存在工作效能低、过度依赖专家知识、缺乏对古籍文本自身语义的深层次挖掘、编目主题边界模糊、较难实现对古籍文本领域主题的精准推荐等问题。为此,本文结合古籍语料特征探究如何实现精准推荐符合研究者需求的文本主题内容的方法,以推动数字人文研究的进一步发展。首先,选取本课题组前期标注的古籍语料数据进行主题类别标注和视图分类;其次,构建融合BERT(bidirectional encoder representation from transformers)预训练模型、改进卷积神经网络、循环神经网络和多头注意力机制的语义挖掘模型;最后,融入“主体-关系-客体”多视图的语义增强模型,构建DJ-TextRCNN(DianJi-recurrent convolutional neural networks for text classification)模型实现对典籍文本更细粒度、更深层次、更多维度的语义挖掘。研究结果发现,DJ-TextRCNN模型在不同视图下的古籍主题推荐任务的准确率均为最优。在“主体-关系-客体”视图下,精确率达到88.54%,初步实现了对古籍文本的精准主题推荐,对中华文化深层次、细粒度的语义挖掘具有一定的指导意义。 展开更多
关键词 数字人文 古籍文本 主题推荐 多视图融合 DJ-textRCNN
在线阅读 下载PDF
我国数据要素政策文本的多维分析 被引量:5
2
作者 奉国和 彭凯林 《图书馆论坛》 北大核心 2025年第2期92-100,共9页
数据是新型生产要素,其发展方向和实施举措集中体现在数据要素政策文本中。文章以我国2020—2024年4月颁布的中央级数据要素政策文本为研究对象,从政策主题、政策工具、政策效力等维度进行分析,基于PMC指数评估政策内部一致性与质量,探... 数据是新型生产要素,其发展方向和实施举措集中体现在数据要素政策文本中。文章以我国2020—2024年4月颁布的中央级数据要素政策文本为研究对象,从政策主题、政策工具、政策效力等维度进行分析,基于PMC指数评估政策内部一致性与质量,探究数据要素政策文本内外部特点。研究发现:中央级数据要素政策偏向以环境型工具引导数据要素与多元应用场景相融合,各数据要素政策样本评价结果良好,但有待增加政策工具的丰富度和出台高效力位阶的政策文本。文章据此提出应细化政策主题、平衡政策工具结构、优化政策效力结构和推动多部门群策群力。 展开更多
关键词 数据要素政策文本 政策工具 政策主题 政策效力 PMC指数
在线阅读 下载PDF
中国智慧城市政策主题与演进路径——基于文本挖掘的量化分析
3
作者 陆香怡 赵彦云 《技术经济与管理研究》 北大核心 2025年第5期15-21,共7页
基于文本挖掘法构建智慧城市政策文本量化分析框架,对2010—2023年国家和地方智慧城市政策文本进行系统性分析,深入挖掘我国智慧城市政策的演进路径与内在主题特征。研究发现:基础设施和底层技术支撑始终是智慧城市建设的首要任务;演进... 基于文本挖掘法构建智慧城市政策文本量化分析框架,对2010—2023年国家和地方智慧城市政策文本进行系统性分析,深入挖掘我国智慧城市政策的演进路径与内在主题特征。研究发现:基础设施和底层技术支撑始终是智慧城市建设的首要任务;演进特征上,初步探索、全面发展和精细调整三个阶段的智慧城市政策关注重点从“数字基础设施”向“服务创新”再向“数据治理”演进;内在主题上,分为基础信息体系建设、智慧应用与服务和政策制度保障3个维度;政策内容上,对数据资源的应用与管理、大数据平台建设、考核评价制度等方面的重视程度仍有待进一步提升。最后,为推动智慧城市建设深化升级提出政策建议。 展开更多
关键词 智慧城市 政策文本 文本挖掘 LDA主题模型 数字基础设施 服务创新 数据治理
在线阅读 下载PDF
基于LDA主题模型的服务业企业创新测度研究——兼与传统创新测度方法的对比分析 被引量:1
4
作者 冯晓华 顾金科 《科学管理研究》 CSSCI 北大核心 2024年第3期76-88,共13页
服务创新是新时代服务业高质量发展的重要内涵。以R&D投入、专利申请为代表的传统创新测度方法在衡量服务业企业创新时存在明显缺陷。使用隐含狄利克雷分配(LDA)主题模型对2008-2022年间914家服务业上市公司的创新水平进行了测度,... 服务创新是新时代服务业高质量发展的重要内涵。以R&D投入、专利申请为代表的传统创新测度方法在衡量服务业企业创新时存在明显缺陷。使用隐含狄利克雷分配(LDA)主题模型对2008-2022年间914家服务业上市公司的创新水平进行了测度,并从企业整体、行业归属、区域分布、企业规模、企业所有制维度与传统创新测度方法对比分析。研究发现:相较于传统创新测度方法,LDA方法能够①同时反映服务业企业创新中的技术和非技术创新部分,更适用于测度非研发和非专利服务业企业;②更好捕捉教育,文化、体育和娱乐业等生活性服务业企业的创新特征和形式;③向上纠偏中西部地区服务业企业创新水平,向下纠偏东部地区服务业企业创新水平,还原东部和中西部地区服务业企业真实创新差距;④向上纠偏中小型服务业企业创新水平,向下纠偏大型服务业企业创新水平;⑤深入挖掘国有和非国有服务业企业在创新词频和主题上的差异,揭示非国有服务业企业创新水平较高的本质原因。基于此,从拓展服务创新内涵新认知、加快生活性服务业企业创新、营造良好创新生态、深化数字技术渗透以及发挥差异性优势五个方面提出政策建议,以期为加快服务业企业创新发展提供政策启示。 展开更多
关键词 LDA主题模型 服务业企业 创新测度 分析师报告 文本分析
在线阅读 下载PDF
跨界颠覆性创新的早期识别方法及实证检验 被引量:6
5
作者 田红云 王铭瑟 田丰 《情报杂志》 CSSCI 北大核心 2024年第5期87-96,105,共11页
[研究目的]数字经济时代,越来越多的企业利用互联网技术开展跨界颠覆性创新。探讨跨界颠覆性创新的早期判断和识别方法,对于打破国外核心技术封锁,抢占科技制高点具有重大意义。[研究方法]根据跨界颠覆性创新的演进特点,从技术和市场两... [研究目的]数字经济时代,越来越多的企业利用互联网技术开展跨界颠覆性创新。探讨跨界颠覆性创新的早期判断和识别方法,对于打破国外核心技术封锁,抢占科技制高点具有重大意义。[研究方法]根据跨界颠覆性创新的演进特点,从技术和市场两个方面提出识别跨界颠覆性创新的理论框架:首先,基于专利文本,利用LDA主题模型提取跨界技术主题;其次,从成长性、融合性、影响力和引用行业外新知识等四个特征考察技术主题跨界颠覆的技术潜力;最后,基于专利、用户和专家评论数据,借助LDA主题模型与情感分析方法,从易扩散性、需求贴合度与市场吸引力趋势等特征考察技术主题跨界颠覆的市场潜力。[研究结论]以手机定位与导航技术为例,通过考察其跨界颠覆的技术潜力特征和市场潜力特征,验证了跨界颠覆性技术早期识别方法的可用性与有效性,为企业跨界颠覆性创新实践提供借鉴。 展开更多
关键词 跨界颠覆性创新 跨界技术主题 市场颠覆性特征 技术颠覆性特征 专利文本 手机导航 LDA 早期识别方法
在线阅读 下载PDF
避而不谈抑或巧言令色?薪酬不公平与非财务信息的薪酬辩护效应 被引量:1
6
作者 王雄元 胡彩霞 《中央财经大学学报》 CSSCI 北大核心 2024年第6期76-88,共13页
价值相关性越来越高的非财务信息是否具有薪酬辩护效应?既有文献仅在文本可读性上找到了证据。本文基于“管理层讨论与分析”(MD&A)文本,从文本相似度角度探讨非财务信息的薪酬辩护效应。研究发现:(1)存在超额薪酬时,公司会提高MD&a... 价值相关性越来越高的非财务信息是否具有薪酬辩护效应?既有文献仅在文本可读性上找到了证据。本文基于“管理层讨论与分析”(MD&A)文本,从文本相似度角度探讨非财务信息的薪酬辩护效应。研究发现:(1)存在超额薪酬时,公司会提高MD&A文本相似度,即公司对普遍存在的超额薪酬采取了“避而不谈”的辩护策略,而且这种策略更可能发生在业绩辩护手段匮乏的情形下,会减少风险、人力资源以及薪酬主题的信息披露。(2)但当超额薪酬较极端时,公司会降低MD&A文本相似度,“巧言令色”地为其辩护,而且这种策略更可能发生在业绩辩护手段较为有效的情形下,会增加风险、人力资源以及薪酬主题的信息披露。这些结论有助于从非财务信息文本操纵角度丰富薪酬辩护假说,以及从薪酬披露角度丰富非财务信息文本操纵的经济后果。 展开更多
关键词 超额薪酬 薪酬辩护 文本相似度 文本主题
在线阅读 下载PDF
中国共同富裕政策的结构特征与演变历程——基于中央层面政策文本的分析 被引量:2
7
作者 刘灵辉 程丹 柯子怡 《西南大学学报(社会科学版)》 CSSCI 北大核心 2024年第6期64-80,共17页
共同富裕是中华民族自古以来的理想与追求,也是中国共产党的初心和使命。基于1978—2023年中央颁布的301份政策文本,结合大数据技术,使用政策文献计量法、社会网络分析法和政策内容量化分析法探究中国共同富裕政策的结构特征与演变历程... 共同富裕是中华民族自古以来的理想与追求,也是中国共产党的初心和使命。基于1978—2023年中央颁布的301份政策文本,结合大数据技术,使用政策文献计量法、社会网络分析法和政策内容量化分析法探究中国共同富裕政策的结构特征与演变历程。研究发现,改革开放以来,中国共同富裕政策经历了“共富思路形成”“共富体制改革”“共富发展转型”和“共富目标落地”四个阶段,总体上形成了规划明确、路径清晰的完整政策体系,但还存在部门合作松散、政策工具使用结构失衡、对精神文明建设关注不足等问题。建议中央政府加强部门协作,打造上下互动的共同富裕政策运行模式,同时,增加精神文化方面的政策工具供给,优化政策工具结构,以完善共同富裕政策体系,推动共同富裕目标落地见效。 展开更多
关键词 共同富裕 政策量化分析 政策文本 政策结构 政策主题 政策工具
在线阅读 下载PDF
新中国成立以来学校体育政策的演进:基于政策文本的研究 被引量:123
8
作者 张文鹏 王健 《体育科学》 CSSCI 北大核心 2015年第2期14-23,共10页
采用文献资料调研、内容分析和聚类分析等,以新中国成立以来学校体育政策演进的时间维度为轴线,运用查尔斯·林德布洛姆的渐进主义模型,对新中国成立以来学校体育政策演进的数量变化、政策主题、政策工具以及政策制定主体进行了分... 采用文献资料调研、内容分析和聚类分析等,以新中国成立以来学校体育政策演进的时间维度为轴线,运用查尔斯·林德布洛姆的渐进主义模型,对新中国成立以来学校体育政策演进的数量变化、政策主题、政策工具以及政策制定主体进行了分析。研究发现,新中国成立以来学校体育政策演进的主要特征为3个方面:1)政策演进的主题围绕着学校体育教学展开;2)政策演进的方式体现为渐进调适;3)政策演进中的溢出效应不足在于文化、社会和心理对体育认同的缺失。从提升学校体育政策的耦合度和协同效应出发,提出了促进学校体育政策优化的现实路径是,加强政策制定主体之间的协调与协同作用;关键路径是,完善学校体育政策的评估体系;根本路径是,从政策上促进人们对学校体育的文化、社会及心理认同。 展开更多
关键词 学校体育 政策文本 政策主题 政策工具
在线阅读 下载PDF
采用可变时间窗口的TIF-LDA微博主题模型 被引量:6
9
作者 冯勇 屈渤浩 +1 位作者 徐红艳 王嵘冰 《小型微型计算机系统》 CSCD 北大核心 2018年第9期2067-2071,共5页
微博是社交网络的主要形式,其短文本和时效性的特点能够体现出当前大众最新兴趣取向.微博文本不同于传统文本,其时效性的特点使得在对其进行主题挖掘时容易忽略时间因素而造成结果不准确.针对此问题,提出了采用可变时间窗口的TIF-LDA微... 微博是社交网络的主要形式,其短文本和时效性的特点能够体现出当前大众最新兴趣取向.微博文本不同于传统文本,其时效性的特点使得在对其进行主题挖掘时容易忽略时间因素而造成结果不准确.针对此问题,提出了采用可变时间窗口的TIF-LDA微博主题模型对微博主题分析做出时间限定,并基于微博发布的时间为微博词条添加时间权重,使用词条的时间权重之和作为词条在LDA主题挖掘计算中的影响因子.实验结果表明,相较于标准的LDA主题模型,本文所提模型能够更加准确地反映用户最新的关注热点. 展开更多
关键词 短文本 主题挖掘 可变时间窗口 时间影响因子 LDA
在线阅读 下载PDF
基于多重文本术语关系叠加识别文本核心主题的有效性探索 被引量:7
10
作者 郭红梅 张智雄 《情报学报》 CSSCI CSCD 北大核心 2017年第11期1157-1164,共8页
目前基于图或网络进行文本主题挖掘的研究大多是基于单一文本术语关系,而文本是由一系列具有语义信息的术语,按照一定的逻辑结构构成的,这些术语除了物理位置上共现关系外,还存在句法上的支配从属关系和隐含的语义关联,仅利用单一术语... 目前基于图或网络进行文本主题挖掘的研究大多是基于单一文本术语关系,而文本是由一系列具有语义信息的术语,按照一定的逻辑结构构成的,这些术语除了物理位置上共现关系外,还存在句法上的支配从属关系和隐含的语义关联,仅利用单一术语关系对文本内容进行分析难免会造成信息的丢失,因此本文尝试将术语间的共现、句法和语义三种关系进行叠加,探索基于多重文本术语关系识别核心主题的有效性。文中选取PubMed数据库2012-2014年"migraine disorders"主题相关的249篇论文进行实验,结果表明术语和关系的叠加使文本主题信息更为凸显,同时存在三种关系的术语和边可表征文本的重要内容。对同时存在三种关系的术语和边组成多重文本术语关系图深度分析显示,叠加术语关系图中所包含的clique子团的边数和结点数少于术语共现关系图,但多于术语语义和句法关系图;在凝聚度最大的前20个clique中,叠加术语关系图中所含clique的凝聚度要高于共现、句法和语义三者中的任何一个,且这种差异具有统计学意义。多重术语关系的叠加平衡共现、句法和语义三种关系,在减少术语共现关系影响的同时增加术语语义和句法关系的优势,将三者含有的信息量进行叠加,克服了单独考虑一种术语关系时造成的信息丢失。 展开更多
关键词 文本术语关系叠加 文本主题识别 clique子团
在线阅读 下载PDF
政策工具视角下我国水安全政策文本分析三维框架 被引量:21
11
作者 周海炜 张蔚怡 +1 位作者 王腾 赵又霖 《情报杂志》 CSSCI 北大核心 2022年第9期62-70,共9页
[研究目的]采用政策工具分析现行水安全政策,为水安全政策体系优化提供理论支撑,对提高水安全保障能力水平具有重要意义。[研究方法]构建“政策工具-政策目标-政策力度”三维分析框架,采用内容分析法,从时间、空间角度出发,对1979-2021... [研究目的]采用政策工具分析现行水安全政策,为水安全政策体系优化提供理论支撑,对提高水安全保障能力水平具有重要意义。[研究方法]构建“政策工具-政策目标-政策力度”三维分析框架,采用内容分析法,从时间、空间角度出发,对1979-2021年中央及地方水安全政策进行量化分析。[研究结论]我国水安全政策存在政策工具使用单一、政策目标结构失衡,政策总力度不断增加而平均力度逐渐下降等问题,提出优化政策工具结构、丰富政策目标范围与加强政策稳定性、系统性等对策建议。 展开更多
关键词 水安全 政策工具 政策文本量化 政策目标 政策力度
在线阅读 下载PDF
文本聚类分析结果可视化方法研究 被引量:7
12
作者 吴江宁 王桂才 《情报学报》 CSSCI 北大核心 2011年第2期115-120,共6页
针对文本聚类分析结果表达中缺乏语义关系的缺陷,本文利用人们在可视化形式下对模型和结构的理解和获取能力,提出了一种新的可视化表达方法.通过改进的Force-directed模型对聚类分析结果进行文本布局,表现文本间的语义相似关系;使用等... 针对文本聚类分析结果表达中缺乏语义关系的缺陷,本文利用人们在可视化形式下对模型和结构的理解和获取能力,提出了一种新的可视化表达方法.通过改进的Force-directed模型对聚类分析结果进行文本布局,表现文本间的语义相似关系;使用等值线生成算法构建层次性主题图,聚集和提炼文本主题;最终实现文本聚类分析结果的语义直观表达.实验结果表明,这种可视化方法不仅能够有效地表达聚类结果,体现类间、文本间的语义相关程度,而且还有助于发现隐含的信息,并通过类别之间的关联实现有效的信息导航. 展开更多
关键词 可视化 布局算法 文本聚类 主题图
在线阅读 下载PDF
从功能语言学角度看寓言体儿童故事《小鸟与大熊》 被引量:4
13
作者 陈建生 谭青松 《湖南大学学报(社会科学版)》 CSSCI 北大核心 2009年第5期94-98,共5页
文章运用系统功能语言学的语篇分析方法,以一篇寓言体儿童故事为例,着重从语境、语篇结构和语篇衔接三个方面分析它的语言特征.全文从语义层面上探讨了寓言体儿童故事的语言特征及其与儿童认知能力之间的关系,证明了"通过意义构建... 文章运用系统功能语言学的语篇分析方法,以一篇寓言体儿童故事为例,着重从语境、语篇结构和语篇衔接三个方面分析它的语言特征.全文从语义层面上探讨了寓言体儿童故事的语言特征及其与儿童认知能力之间的关系,证明了"通过意义构建经验"的功能语言学的观点。同时也为儿童故事的评价和写作提供了一个语言学视角。 展开更多
关键词 寓言体儿童故事 语境及语篇 主述位结构 衔接
在线阅读 下载PDF
唐诗题材自动分类研究 被引量:16
14
作者 胡韧奋 诸雨辰 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第2期262-268,共7页
将文本分类技术引入唐诗研究。首先将唐诗按照题材分为爱情婚姻、边塞战争、交游送别、羁旅思乡、山水田园、咏史怀古和其他7类,并据此提出唐诗题材自动分类模型。所选500首诗歌样本以《唐诗三百首》为基础,并有所补充。采用向量空间模... 将文本分类技术引入唐诗研究。首先将唐诗按照题材分为爱情婚姻、边塞战争、交游送别、羁旅思乡、山水田园、咏史怀古和其他7类,并据此提出唐诗题材自动分类模型。所选500首诗歌样本以《唐诗三百首》为基础,并有所补充。采用向量空间模型(VSM)将唐诗文本转换为向量,通过卡方检验进行词语特征选择,最后基于朴素贝叶斯和支持向量机算法构造文本分类器,取得较好的题材分类效果。此外,还验证了作者关于题目、体制、作者等变量对题材分类产生影响的假设,为相关诗歌本体研究提供了科学依据。 展开更多
关键词 唐诗 题材 文本分类 卡方检验 朴素贝叶斯 支持向量机
在线阅读 下载PDF
基于主题本体扩展特征的短文本分类 被引量:4
15
作者 湛燕 陈昊 《河北大学学报(自然科学版)》 CAS 北大核心 2014年第3期307-311,共5页
短文本具有不同于普通文本的独有特点,例如文本长度较短,特征选择分散不一,这使得短文本文类需要处理这些特殊的问题.本文使用了基于主题本体的特征扩展方法,考虑了特征之间的语义关联,达到了较好的分类性能.同时,通过GC(扩展能力)算法... 短文本具有不同于普通文本的独有特点,例如文本长度较短,特征选择分散不一,这使得短文本文类需要处理这些特殊的问题.本文使用了基于主题本体的特征扩展方法,考虑了特征之间的语义关联,达到了较好的分类性能.同时,通过GC(扩展能力)算法使用了案例维护学习,在K-近邻算法中减少样例个数,从而可以提高搜索近邻样例的效率.数值型实验证明了这种学习算法的有效性. 展开更多
关键词 短文本分类 主题本体 案例维护
在线阅读 下载PDF
基于词汇链的中文短信主题语句抽取方法 被引量:3
16
作者 刘金岭 冯万利 张永军 《计算机工程与应用》 CSCD 2012年第7期132-134,共3页
提出一种基于词汇链的中文短信文本主题的抽取方法。该方法首先通过构造多条词汇链来表达短信文本的叙事线索,并从多条词汇链中抽取出富含主题信息的词汇链,将其作为构造短信文本主题语句的关键词序列。实验表明该方法抽取的短信文本主... 提出一种基于词汇链的中文短信文本主题的抽取方法。该方法首先通过构造多条词汇链来表达短信文本的叙事线索,并从多条词汇链中抽取出富含主题信息的词汇链,将其作为构造短信文本主题语句的关键词序列。实验表明该方法抽取的短信文本主题能够更全面地覆盖短信文本的信息,并能消除多个关键词序列表达同一主题信息的冗余。其效果明显优于采用统计信息进行短信文本主题抽取的方法。 展开更多
关键词 短信文本 词汇链 主题语句 抽取方法
在线阅读 下载PDF
理解教育现象学的研究方法 被引量:38
17
作者 朱光明 陈向明 《外国教育研究》 CSSCI 北大核心 2006年第11期1-6,共6页
教育现象学是受现象学运动的影响而产生的一种新的教育思想。教育现象学研究反对教育研究中的简化、经济原则,强调研究要关注教育生活中教师、学生丰富的体验世界,在教育的具体情境中整体地把握教育经验的意义,从而开创了一种新的教育... 教育现象学是受现象学运动的影响而产生的一种新的教育思想。教育现象学研究反对教育研究中的简化、经济原则,强调研究要关注教育生活中教师、学生丰富的体验世界,在教育的具体情境中整体地把握教育经验的意义,从而开创了一种新的教育研究取向,为多元化的教育研究增添了新的可能性。 展开更多
关键词 教育现象学 资料收集 主题反思 文本写作 研究方法 多元化 教育研究 教育经验
在线阅读 下载PDF
基于降维的短信文本语义分类及主题提取 被引量:18
18
作者 刘金岭 《计算机工程与应用》 CSCD 北大核心 2010年第23期159-161,174,共4页
为了对中文短信文本进行快速的舆情预测,利用对同义关系词汇归并和上下位词汇聚焦以及种子词汇的确定来实现对短信文本空间的降维,而后又给出了海量短信文本分类的算法及分类主题的提取。实验表明该方法可以大大提高舆情预测的速度和质量。
关键词 分类 短信文本 降维 主题
在线阅读 下载PDF
儿童视角下中美幼儿绘本的比较 被引量:15
19
作者 岳亚平 刘琦 《学前教育研究》 CSSCI 北大核心 2020年第7期64-72,共9页
作为儿童喜闻乐见的早期阅读材料,绘本应体现儿童视角。本研究运用质性分析软件NVivo对幼儿访谈资料进行编码,梳理出儿童视角下的绘本表现框架,然后以此为研究工具对中美各20本获奖绘本进行了文本分析和比较分析。结果发现中美绘本在题... 作为儿童喜闻乐见的早期阅读材料,绘本应体现儿童视角。本研究运用质性分析软件NVivo对幼儿访谈资料进行编码,梳理出儿童视角下的绘本表现框架,然后以此为研究工具对中美各20本获奖绘本进行了文本分析和比较分析。结果发现中美绘本在题材、文字和图画三个核心节点上既有相同的表现又存在差异。绘本评选的标准不同、绘本创作者秉持的价值取向不同、绘本创作模式的不同是中美绘本存在差异的主要原因。今后应明确和完善绘本的评选标准,培养专职的绘本创作者,鼓励并支持他们遵循儿童视角创作更多适合幼儿阅读的绘本。 展开更多
关键词 儿童视角 幼儿绘本 题材 文字 图画
在线阅读 下载PDF
基于主题的中文短信文本分类研究 被引量:14
20
作者 刘金岭 《计算机工程》 CAS CSCD 北大核心 2010年第4期30-32,共3页
根据中文短信文本分类的特点,提出同义概念归并、上下位概念的聚焦以及短信文本重点词汇的确定方法,利用主题句选取算法获取短信文本的主题,采用KNN算法将短信文本的主题进行分类。仿真实验结果表明,该算法能够有效提高短信文本的分类... 根据中文短信文本分类的特点,提出同义概念归并、上下位概念的聚焦以及短信文本重点词汇的确定方法,利用主题句选取算法获取短信文本的主题,采用KNN算法将短信文本的主题进行分类。仿真实验结果表明,该算法能够有效提高短信文本的分类速度。 展开更多
关键词 短信文本 KNN算法 主题句
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部