期刊文献+
共找到35篇文章
< 1 2 >
每页显示 20 50 100
基于BERTopic主题建模的“Assessing Writing”研究趋势演化分析
1
作者 李锦焱 张丹 高慧敏 《河南科技大学学报(自然科学版)》 北大核心 2025年第4期97-104,M0008,共9页
通过深入挖掘期刊研究主题与预测学术发展趋势,研究人员能够更精准地把握学科方向,紧跟前沿动态。然而,期刊摘要作为短文本,其结构化特点、高维稀疏的向量表示、语义结构复杂性以及数据噪声等因素,对传统主题建模方法构成了严峻挑战。... 通过深入挖掘期刊研究主题与预测学术发展趋势,研究人员能够更精准地把握学科方向,紧跟前沿动态。然而,期刊摘要作为短文本,其结构化特点、高维稀疏的向量表示、语义结构复杂性以及数据噪声等因素,对传统主题建模方法构成了严峻挑战。针对这一问题,提出了一种基于BERTopic的主题演化分析模型。模型融合了预训练语言模型在语义表征方面的优势与层次化聚类算法的结构建模能力,同时重构词项加权策略,引入词频的次线性变换机制以优化传统词权计算方法,从而有效削弱高频词的干扰,突出对区分主题具有关键意义的词项,显著提升了模型的主题区分度和语义表征能力。以“Assessing Writing”期刊为研究对象,围绕不同时期写作评估领域的研究成果开展实证分析。通过系统梳理各阶段的研究主题与发展方向,挖掘其动态演化规律。实验结果表明,能够准确捕捉写作评估领域的研究热点变化,清晰揭示其发展脉络,在处理期刊摘要等短文本数据时展现出良好的实用性与有效性,为相关领域的学术研究和趋势预测提供了可靠的技术支撑。 展开更多
关键词 主题建模 BERtopic 语义结构 主题表征 次线性变换
在线阅读 下载PDF
基于结构方程模型的区域货运结构影响因素研究
2
作者 伍慧 卢毅 +1 位作者 李玉凡 唐明珠 《北京交通大学学报》 北大核心 2025年第4期122-131,141,共11页
针对区域货运结构优化的关键影响因素及其作用机制不明确的问题,提出一套系统性研究方法.首先,基于潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)主题模型,系统挖掘并识别出影响区域货运结构优化的八大主要因素,包括经济社会发展... 针对区域货运结构优化的关键影响因素及其作用机制不明确的问题,提出一套系统性研究方法.首先,基于潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)主题模型,系统挖掘并识别出影响区域货运结构优化的八大主要因素,包括经济社会发展水平、产业结构、自然地理条件、能源结构、环境保护意识、技术经济特性、科技进步和交通运输业政策.然后,基于研究假设,构建结构方程模型(Structural Equation Modeling,SEM),深入分析这些因素对区域货运结构的影响及其相互关系.最后,引入弹性分析方法,量化这些因素对货运结构调整的贡献程度.研究结果表明:八大因素对区域货运结构调整均有显著促进作用,但在不同区域的作用程度和弹性存在差异;东部区域应聚焦优化产业结构,充分利用地理优势,加强环境保护意识,推动绿色货运技术的应用和政策引导,打造绿色高效货运体系;中部区域需注重地理条件的优化利用,推动交通基础设施建设,提升区域货运网络的连通性和效率,并加强投资引导,推动技术经济特性的提升,促进货运结构优化调整;西部区域应加快生态保护与技术发展的结合,注重技术经济特性的提升,推动货运技术创新和成本优化,促进货运结构的绿色创新发展;整体层面则应强化产业结构与技术经济特性的动态适配,提升政策精准性和协同性,推动运输方式和模式的创新升级. 展开更多
关键词 运输结构调整 货运结构 LDA主题模型 SEM模型 弹性分析
在线阅读 下载PDF
基于潜层主题结构表示增强的跨领域文本生成
3
作者 刘小明 赵梦婷 +1 位作者 杨关 刘杰 《中文信息学报》 北大核心 2025年第5期150-163,176,共15页
现有的低资源生成模型大多使用预训练的词嵌入来解决目标领域数据稀疏问题,但这种方法难以捕捉不同领域间的潜层结构信息,经常忽略潜在主题对捕捉关键信息的重要作用。为了解决这些问题,该文联合神经主题模型提取潜在主题,从而为生成的... 现有的低资源生成模型大多使用预训练的词嵌入来解决目标领域数据稀疏问题,但这种方法难以捕捉不同领域间的潜层结构信息,经常忽略潜在主题对捕捉关键信息的重要作用。为了解决这些问题,该文联合神经主题模型提取潜在主题,从而为生成的语句选择提供全局特征,并结合词嵌入和主题嵌入,增强模型对潜在主题信息的利用,然后通过对不同领域的主题对齐,捕捉相似潜层主题结构表示。在文本生成不同任务的数据集上进行的大量实验表明,该模型在摘要生成任务的六个低资源领域数据集、CNN/DailyMail数据集和SAMsum数据集上的ROUGE-1均值相较于基准模型分别提高了0.92%、3.71%和1.0%;在对话生成任务中,该模型在ESConv数据集上的各项指标也表现出良好的结果。 展开更多
关键词 低资源 结构特征 主题模型
在线阅读 下载PDF
我国智慧应急研究:主题、脉络、争鸣与盲区 被引量:2
4
作者 刘杨 闫绪娴 +2 位作者 王俊丽 杨佳萌 孔锋 《灾害学》 北大核心 2025年第2期119-125,共7页
智慧应急是我国提升重大突发事件风险防控能力与推进应急管理现代化的关键。该文结合潜在狄利克雷分布(LDA)主题模型与质性分析,探讨国内智慧应急研究的主题、脉络、争鸣与盲区。研究发现:①我国智慧应急研究围绕治理、技术、情景与环... 智慧应急是我国提升重大突发事件风险防控能力与推进应急管理现代化的关键。该文结合潜在狄利克雷分布(LDA)主题模型与质性分析,探讨国内智慧应急研究的主题、脉络、争鸣与盲区。研究发现:①我国智慧应急研究围绕治理、技术、情景与环境展开;②其时间脉络为“孕育起步—成长探索—快速增长—迭代升级”,研究脉络以“治理主体—治理要素—治理能力”为主线,“技术—情景—环境”为支线;③争鸣集中在“智慧应急理论体系本土建构”与“智慧应急赋能城市防灾减灾救灾”;而在“伦理管理”“合法性与合规性”“技术整合与经验推广”等方面存在空白。该研究旨在厘清国内智慧应急研究全景,为应急管理现代化建设提供参考。 展开更多
关键词 应急管理 智慧应急 LDA主题模型 数据结构 数智技术
在线阅读 下载PDF
基于STM和格兰杰因果分析的网络新闻媒体倾向研究 被引量:15
5
作者 吴俊 欧阳书凡 李晓华 《系统工程学报》 CSCD 北大核心 2020年第4期446-458,共13页
网络媒体报道倾向对互联网新闻舆情热点传播及公众认知有着重要影响.为揭示互联网媒体在新闻报道中存在语义和传播倾向,采用纳入文档协变量的结构化主题模型量化不同媒体报道热点主题的语义强度,同时结合格兰杰因果分析检验不同媒体对... 网络媒体报道倾向对互联网新闻舆情热点传播及公众认知有着重要影响.为揭示互联网媒体在新闻报道中存在语义和传播倾向,采用纳入文档协变量的结构化主题模型量化不同媒体报道热点主题的语义强度,同时结合格兰杰因果分析检验不同媒体对热点主题时间序列的影响.研究结果表明,5家互联网媒体在报道共享单车热点新闻时,存在主题选择及传播倾向性.表现在与用户关系密切的话题,媒体间存在跟风造势的倾向,与用户关联不大的话题,媒体间则较少传播或单向传播.提出的融合结构化主题模型的格兰杰因果分析方法为测度网络舆情主体对网络舆情事件的演化影响提供了新手段. 展开更多
关键词 结构化主题模型 格兰杰因果分析 共享单车新闻 媒体倾向
在线阅读 下载PDF
我国货币供应量预测:基于STM模型 被引量:2
6
作者 郇志坚 徐晓莉 《金融理论与实践》 北大核心 2016年第11期46-48,共3页
基于标准的结构时间序列模型,将原序列分解得到趋势、周期、季节及不规则成分,在此基础上增加干预成分,将其扩展为复杂结构时间序列模型。应用1997年1月—2015年6月的中国货币供应量进行了预测,比较了STM和ARIMA预测效果。实证研究表明,... 基于标准的结构时间序列模型,将原序列分解得到趋势、周期、季节及不规则成分,在此基础上增加干预成分,将其扩展为复杂结构时间序列模型。应用1997年1月—2015年6月的中国货币供应量进行了预测,比较了STM和ARIMA预测效果。实证研究表明,STM模型具有良好的预测效果。 展开更多
关键词 结构时间序列 状态空间 ARIMA stm
在线阅读 下载PDF
基于STM的科研资助对研究主题影响研究 被引量:3
7
作者 滕广青 吕晶 +2 位作者 江瑶 庹锐 彭洁 《现代情报》 CSSCI 2022年第5期58-68,共11页
[目的/意义]科研资助是科学研究工作中有效的激励政策,分析与揭示科研资助影响作用,对促进国家科技发展具有重要的积极作用。[方法/过程]基于Web of Science收录的我国计算机与人工智能领域的科研论文,按照有/无科研资助对其进行划分,... [目的/意义]科研资助是科学研究工作中有效的激励政策,分析与揭示科研资助影响作用,对促进国家科技发展具有重要的积极作用。[方法/过程]基于Web of Science收录的我国计算机与人工智能领域的科研论文,按照有/无科研资助对其进行划分,使用结构主题模型(STM)重点将科研资助对主题内容与主题契合度的影响进行分析。[结果/结论]研究发现,科研资助能够有效促进科技成果数量的增加,科研资助能够影响主题偏好和具体主题内容,科研资助与时间的交互作用会对主题的契合度产生积极的影响。 展开更多
关键词 科研资助 主题内容 主题偏好 主题契合度 结构主题模型
在线阅读 下载PDF
由规模化到精准化:国家中小学智慧教育平台教师研修的差异化需求及优化策略研究 被引量:16
8
作者 何春 冯晓英 《中国电化教育》 CSSCI 北大核心 2024年第3期44-52,共9页
立足常态化的新发展阶段,国家智慧教育平台教师寒暑假研修如何从规模化走向差异化、精准化,“按需施训”尤为关键。研究以基础教育阶段参训教师的9.06万条、149万余字反馈文本为研究对象,综合运用结构主题模型(STM)及重要性-绩效分析法(... 立足常态化的新发展阶段,国家智慧教育平台教师寒暑假研修如何从规模化走向差异化、精准化,“按需施训”尤为关键。研究以基础教育阶段参训教师的9.06万条、149万余字反馈文本为研究对象,综合运用结构主题模型(STM)及重要性-绩效分析法(IPA),构建了国家中小学智慧教育平台教师研修需求框架,并深入分析其差异、明确基于需求要素的优化方向。研究发现:参训教师需求包含个体发展和系统环境两个层面的五类需求,且均存在显著的区域及城乡差异,针对时间安排及学时认定等研修机制需求仍须优化改进。研究为教师寒暑假研修精准化、差异化发展提供实证依据与决策支持,为优化研修服务提供策略建议。 展开更多
关键词 教师研修 需求差异 结构主题模型 IPA分析 国家中小学智慧教育平台 精准
在线阅读 下载PDF
用户偏好-制造商偏好双重视阈下的产品创新机会识别路径研究 被引量:8
9
作者 王金凤 仵轩 +2 位作者 冯立杰 张珂 刘鹏 《计算机集成制造系统》 EI CSCD 北大核心 2024年第4期1433-1445,共13页
精准识别产品创新机会对制造商规避盲目创新风险,持续获取竞争优势至关重要。针对现有产品创新机会识别研究中因视角单一致使制造商价值创造的效率难以最大化,以及识别的创新机会聚焦度不清晰等诸多问题,基于用户偏好制造商偏好双重视... 精准识别产品创新机会对制造商规避盲目创新风险,持续获取竞争优势至关重要。针对现有产品创新机会识别研究中因视角单一致使制造商价值创造的效率难以最大化,以及识别的创新机会聚焦度不清晰等诸多问题,基于用户偏好制造商偏好双重视阈构建了产品创新机会识别路径。首先,运用结构主题模型从用户在线评论和产品描述文本中分别提取用户偏好及制造商偏好的产品属性主题;其次,基于两类主题之间的相似度进行主题分类以获取具象产品的创新需求;再次,从现有相关专利中提取创新要素并依托多维技术创新地图识别产品创新机会;最后,以老年智能手环靶向开展产品创新机会识别为例,验证了所提路径的可行性。应用结果表明,构建的用户偏好制造商偏好双重视阈下的产品创新机会识别路径能够为制造商高效开展产品创新活动提供可资借鉴的决策理论支持。 展开更多
关键词 产品创新机会识别 用户偏好制造商偏好双重视阈 多维技术创新地图 结构主题模型
在线阅读 下载PDF
基于结构主题模型的民航管制不安全事件主题识别
10
作者 张洪海 石宗北 +2 位作者 李一可 周锦伦 王雨菲 《中国安全生产科学技术》 CAS CSCD 北大核心 2024年第11期163-169,共7页
为探究民航管制运行不安全事件的发生规律及特点,采用结构主题模型捕捉报告中的词汇共现及层次结构。考虑结构主题的语义连贯性以及排他性等指标,辨识管制运行事件的最优主题数目。选取事件严重度及发生时间等协变量,构建融合多变量的... 为探究民航管制运行不安全事件的发生规律及特点,采用结构主题模型捕捉报告中的词汇共现及层次结构。考虑结构主题的语义连贯性以及排他性等指标,辨识管制运行事件的最优主题数目。选取事件严重度及发生时间等协变量,构建融合多变量的主题分析,挖掘不同类型事件的严重度差异性及在时间维度上的演化趋势。最后,基于航空安全自愿报告系统2018-2022年的4346起管制事件报告进行实证分析。研究结果表明:与管制运行有关的不安全事件可分为管制移交、恶劣天气、人为因素事件、夜航航班、场面滑行、起飞离场、部门协调、雷达间隔、设备故障、进近程序、陆空对话、复杂空域环境、飞行冲突、飞行高度、冲/偏出跑道及跑道侵入15类;飞行区滑行、进近程序、飞行冲突等事件更易产生严重事故;飞行高度有关的不安全事件呈逐年上升趋势。研究结果可为提升管制运行安全风险水平提供理论支持,并为管理人员针对性施策提供参考。 展开更多
关键词 空中交通管理 民航管制运行 安全水平 不安全事件 结构主题模型
在线阅读 下载PDF
基于文本挖掘的用餐体验对顾客满意的影响——以海底捞为例
11
作者 魏胜 梅抗杰 王长城 《美食研究》 北大核心 2024年第4期29-37,共9页
随着信息技术的迅速发展,顾客体验与网络联系更加紧密,用户生成内容愈加成为关键的研究数据来源。对海底捞的9万余条评论数据进行分析,首先,基于结构主题模型,挖掘顾客用餐体验所包含的主题及其所属维度;其次,综合考虑关注程度和顾客满... 随着信息技术的迅速发展,顾客体验与网络联系更加紧密,用户生成内容愈加成为关键的研究数据来源。对海底捞的9万余条评论数据进行分析,首先,基于结构主题模型,挖掘顾客用餐体验所包含的主题及其所属维度;其次,综合考虑关注程度和顾客满意,探究用餐体验主题的相对地位;最后,基于文本情感分析等方法,探究用餐体验如何通过顾客情感影响顾客满意。结果显示,用餐体验包含12个主题,归为7个维度,分别是服务、价格、食材、口味、环境、服务仪式和其他;服务员、菜品和等位服务是优势主题,价格和时间是劣势主题;价格正向影响顾客情感,但负向影响顾客满意;环境负向影响顾客情感,但正向影响顾客满意。研究结论能够为餐饮企业设计产品和服务提供针对性参考。 展开更多
关键词 用户生成内容 用餐体验 顾客满意 结构主题模型 美食消费
在线阅读 下载PDF
基于文献计量学的“结核”主题高被引文献特征分析 被引量:8
12
作者 郭萌 吴文 +1 位作者 李敬文 范永德 《中国防痨杂志》 CAS CSCD 北大核心 2024年第5期567-577,共11页
目的:研究国内“结核”领域的高被引文献,了解该研究领域的发展现状,研究未来的发展趋势。方法:借助CiteSpace可视化应用软件对“万方数据库”中以“结核”为主题的高被引文献(被引频次≥30次)的发表时间、期刊来源、作者和内容进行分... 目的:研究国内“结核”领域的高被引文献,了解该研究领域的发展现状,研究未来的发展趋势。方法:借助CiteSpace可视化应用软件对“万方数据库”中以“结核”为主题的高被引文献(被引频次≥30次)的发表时间、期刊来源、作者和内容进行分析。结果:国内“结核”领域的高被引文献主要集中在2012年和2013年,分别为106和100篇。《中国防痨杂志》《中华结核和呼吸杂志》和《临床肺科杂志》是“结核”领域高被引文献的主要刊载期刊,分别为127、34、25篇。研究者主要关注结核病诊断、危险因素、抗药性、糖尿病、利福平、脊柱结核、健康教育等议题,关键词词频分别为46、35、26、26、20、17、16次。结论:“结核”领域论文发表呈现繁荣景象,未来还需要持续关注结核病抗药性、糖尿病共病、脊柱结核和健康教育等热点领域;进一步与热点作者合作,创造出引领学术发展的高水平论文。 展开更多
关键词 结核 期刊(主题) 文献计量学 模型 结构
在线阅读 下载PDF
基于结构主题模型的医联体政策文本区域差异 被引量:1
13
作者 杨馨怡 王素芬 +1 位作者 余洋 于昊生 《东华大学学报(自然科学版)》 CAS 北大核心 2024年第3期178-184,共7页
为研究我国不同地区的医联体政策差异与特征,收集2010年10月至2022年12月地方政府发布的599份医联体相关政策,采用描述性统计和结构主题模型,从政策发布数量、政策类型和政策主题3个维度对比我国4大经济地区(西部、中部、东部、东北地区... 为研究我国不同地区的医联体政策差异与特征,收集2010年10月至2022年12月地方政府发布的599份医联体相关政策,采用描述性统计和结构主题模型,从政策发布数量、政策类型和政策主题3个维度对比我国4大经济地区(西部、中部、东部、东北地区)的医联体政策。研究发现:我国地方医联体政策体系结构不够均衡,呈重实施细则、轻标准规范的特点;分级诊疗服务体系建设和医联体管理模式是各地区医联体政策的热门主题,而配套措施和疾病防治与诊疗的相关主题尚未得到广泛关注;各地区的医联体建设整体呈多元化探索的特点。地方政府需根据地区差异有针对性地发布政策,以补足医联体政策短板,促进地区医联体政策体系完善。 展开更多
关键词 医疗联合体 结构主题模型 地方政策 区域差异 政策文本
在线阅读 下载PDF
AIGC议题的动态演进与传播结构:基于微博和Twitter的比较分析 被引量:7
14
作者 张尔坤 张洪忠 +1 位作者 姚俊臣 王诗然 《西安交通大学学报(社会科学版)》 CSSCI 北大核心 2024年第3期176-186,共11页
不同文化背景和社会情境可能会形成不同的技术认知,基于跨平台比较视角,采用动态主题模型等工具比较微博和Twitter中人工智能生成内容(AIGC)议题在发展趋势与传播结构上的差异,探讨促成这些差异的多维因素。研究发现:在微博中,用户更关... 不同文化背景和社会情境可能会形成不同的技术认知,基于跨平台比较视角,采用动态主题模型等工具比较微博和Twitter中人工智能生成内容(AIGC)议题在发展趋势与传播结构上的差异,探讨促成这些差异的多维因素。研究发现:在微博中,用户更关注AIGC的经济和商业价值,侧重探讨新技术与经济发展的关系;在Twitter中,AIGC讨论与技术逻辑具有更紧密的联系,诸多文化界、产业界博主将技术对产业、伦理的影响和对未来的想象推到更重要的讨论位置。研究认为,由经济要素驱动的AIGC讨论机遇与风险并存,在关注AIGC经济价值的同时,也要警惕资本、市场对技术认知和技术发展的过度干预,防止技术背离“以人为本”的价值初衷。最后,宏观层面的语境也并非稳定不变,未来应当继续关注技术认知的结构性变化以及其将如何影响新技术发展等问题。 展开更多
关键词 人工智能生成内容 主题建构 传播结构 技术认知 微博 TWITTER 动态主题模型 社交媒体
在线阅读 下载PDF
基于BERT嵌入与知识蒸馏的层次化课程主题分析研究
15
作者 郭振东 林民 李成城 《中文信息学报》 CSCD 北大核心 2024年第7期84-94,共11页
基于变分自编码器的树结构神经主题模型能有效挖掘文本的层次化语义特征,但现有的树结构神经主题模型仅利用了词频等统计特征,忽略了外部先验知识对获取主题的帮助。针对课程主题分析任务,该文融合迁移学习思想,提出了一种基于BERT嵌入... 基于变分自编码器的树结构神经主题模型能有效挖掘文本的层次化语义特征,但现有的树结构神经主题模型仅利用了词频等统计特征,忽略了外部先验知识对获取主题的帮助。针对课程主题分析任务,该文融合迁移学习思想,提出了一种基于BERT嵌入与知识蒸馏的树结构神经主题模型。首先,通过构建BERT-CRF分词模型,使用少量领域文本对BERT进行二次训练,优化领域字的表示,动态融合二次训练后的BERT字嵌入,获取粗粒度领域词嵌入,缓解字粒度BERT嵌入与词袋表示不匹配问题;其次,针对词袋表示数据稀疏问题,以文档重构为目标,构建BERT自编码器,蒸馏有监督的文档表示,指导主题模型的文档重构学习,提升主题质量;最后,优化树结构神经主题模型以拟合富含辅助信息的BERT词嵌入,并用有监督的蒸馏知识指导无监督主题模型的文档重构。实验表明,基于BERT嵌入与知识蒸馏的树结构神经主题模型具有预训练模型和主题模型的优良特性,能对课程主题进行更有效的归纳总结。 展开更多
关键词 树结构神经主题模型 BERT 知识蒸馏 变分自编码器
在线阅读 下载PDF
基于主题图的农业模型描述与表示方法 被引量:3
16
作者 傅兵 姜海燕 +2 位作者 张梅 朱艳 曹卫星 《农业工程学报》 EI CAS CSCD 北大核心 2011年第4期190-195,共6页
为了提升不同学科模型资源的共享与管理能力,提出了一种新的农业模型描述与表示方法。它以模型组件描述信息为元数据来生成不同层次主题图。首先分析农业模型特征,建立农业模型与模型组件之间的映射关系;然后,抽取农业模型组件刻面与关... 为了提升不同学科模型资源的共享与管理能力,提出了一种新的农业模型描述与表示方法。它以模型组件描述信息为元数据来生成不同层次主题图。首先分析农业模型特征,建立农业模型与模型组件之间的映射关系;然后,抽取农业模型组件刻面与关联描述信息,构建了农业模型组件描述模型(DM-AMC),进一步将DM-AMC表示为主题类型、关联类型、事件类型以及关联角色;最后,通过实例化并采用匹配融合算法生成了面向农业模型组件的主题图(TM-AMC)。研究以作物生育期模型为例,生成了统一描述与可动态扩展的原子主题图XTM文档。通过对农业模型信息的统一描述,并以DM-AMC为基础生成多层次、便于统一访问的TM-AMC,可提升农业模型信息的全局共享与管理能力。 展开更多
关键词 农业工程 模型 模型结构 主题图 模型表示 模型管理
在线阅读 下载PDF
融合句义结构模型的微博话题摘要算法 被引量:5
17
作者 林萌 罗森林 +3 位作者 贾丛飞 韩磊 原玉娇 潘丽敏 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2015年第12期2316-2325,共10页
为了更快地从海量微博中获取话题的核心内容,提出融合句义结构模型的微博话题摘要方法.该方法利用句义结构模型抽取句子的语义格得到句子的语义特征,并基于LDA主题模型使用句义结构计算句子两两之间的语义相似度构建相似度矩阵,划分子... 为了更快地从海量微博中获取话题的核心内容,提出融合句义结构模型的微博话题摘要方法.该方法利用句义结构模型抽取句子的语义格得到句子的语义特征,并基于LDA主题模型使用句义结构计算句子两两之间的语义相似度构建相似度矩阵,划分子主题类,得到句子的关联特征.融合句子的语义特征和关联特征,选取子主题内信息量最大的句子作为摘要结果.当压缩比为0.5%、1.0%和1.5%时,ROUGE值均明显优于对比系统.当压缩比为1.5%时,ROUGE-1值达到51.30%,ROUGE-SU*达到25.27%.实验结果表明:融合句义结构模型的分析方法能够深化句子的语义分析层次,提取的句义特征增强了语义信息的表达能力.综合考虑句子语义特征和关联特征的句子权重计算方法能够丰富句子的特征表示,减少语义信息丢失,使同类数据的语义相关性增强,有效降低了噪声的影响,从而提升摘要与话题的相关度.此外,所提出的方法处理不同话题的泛化能力较好,适用范围较广. 展开更多
关键词 微博 话题摘要 句义结构模型 自然语言处理
在线阅读 下载PDF
面向篇章机器翻译的英汉翻译单位和翻译模型研究 被引量:15
18
作者 宋柔 葛诗利 《中文信息学报》 CSCD 北大核心 2015年第5期125-135,共11页
篇章机器翻译的首要问题是确定翻译单位。基于汉语和英语的语言知识和英汉翻译的实践,该文提出面向篇章机器翻译的基本单位和复合单位的双层单位体系,讨论了这两种单位支持篇章翻译应满足的性质,并据此勾画了篇章机器翻译的拆分、翻译... 篇章机器翻译的首要问题是确定翻译单位。基于汉语和英语的语言知识和英汉翻译的实践,该文提出面向篇章机器翻译的基本单位和复合单位的双层单位体系,讨论了这两种单位支持篇章翻译应满足的性质,并据此勾画了篇章机器翻译的拆分、翻译、装配三步模型(PTA模型)。该文提出,汉语篇章机器翻译的复合单位为广义话题结构对应的文本块,基本单位则是根据广义话题结构流水模型得到的话题自足句;英语篇章机器翻译的复合单位为句号句,基本单位为naming-telling小句(NT小句),即指称性成分加上对它的陈述或后修饰成分所构成的小句。该文展示了在这样的翻译单位体系下采用PTA模型的英汉翻译过程实例,规划了面向篇章翻译的英汉小句对齐语料库的建设任务,讨论了PTA模型的可行性。 展开更多
关键词 翻译单位 翻译模型 广义话题结构 naming-telling小句
在线阅读 下载PDF
社区结构对微博舆论话题传播的影响研究 被引量:2
19
作者 朱恒民 胡炜 +1 位作者 马静 魏静 《系统仿真学报》 CAS CSCD 北大核心 2016年第7期1506-1513,1527,共9页
微博聚集了大量的用户群体,社区结构是微博网络的重要特征。为了探索微博网络的社区结构对舆论话题传播的影响规律,分析了微博用户选择关注对象的心理,基于此提出了微博社区网络的构造模型,该模型可以通过社区因子调节微博网络的社区结... 微博聚集了大量的用户群体,社区结构是微博网络的重要特征。为了探索微博网络的社区结构对舆论话题传播的影响规律,分析了微博用户选择关注对象的心理,基于此提出了微博社区网络的构造模型,该模型可以通过社区因子调节微博网络的社区结构特征。实验中验证了社区因子对微博网络社区结构的影响,基于SIR模型仿真分析了传播源节点和社区因子对微博舆论话题传播的影响机理。仿真结果表明,与名人效应相比,网络的社区结构对微博话题的传播具有一定的抑制作用。通过twitter实例数据对部分结论进行了验证。 展开更多
关键词 微博 话题传播 社区结构 网络建模
在线阅读 下载PDF
基于最大熵模型的汉语标点句缺失话题自动识别初探 被引量:4
20
作者 卢达威 宋柔 《计算机工程与科学》 CSCD 北大核心 2015年第12期2282-2293,共12页
本文的任务是判别标点句缺失话题是上句的主语还是宾语,将该任务作为标点句缺失话题自动识别研究的切入点。首先归纳了判别这一任务的一系列字面特征和语义特征,然后结合规则和最大熵模型,进行自动判别实验。结果显示,对特定类别动词的... 本文的任务是判别标点句缺失话题是上句的主语还是宾语,将该任务作为标点句缺失话题自动识别研究的切入点。首先归纳了判别这一任务的一系列字面特征和语义特征,然后结合规则和最大熵模型,进行自动判别实验。结果显示,对特定类别动词的实验F值达到82%。对实验结果的分析说明,动词特征和语义特征对判别该任务的作用最大,规则方法和统计方法在判别任务中不能偏废,精细化的知识对判别的性能有重要影响。 展开更多
关键词 广义话题结构 新支话题 自动识别 最大熵模型
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部