期刊文献+
共找到1,880篇文章
< 1 2 94 >
每页显示 20 50 100
基于Sentence-MacBERT模型的同源录波数据匹配方法
1
作者 戴志辉 张富泽 +1 位作者 韩笑 王冠南 《电力系统保护与控制》 北大核心 2025年第8期159-167,共9页
由于不同时期的录波数据记录标准有所不同,以及各个生产厂家对标准的解读存在偏差,造成同源录波数据的通道名称存在个性化差异,且通道索引号不同,难以进行录波数据的同源匹配。针对上述问题,提出基于句向量掩码纠错双向编码器表征语言模... 由于不同时期的录波数据记录标准有所不同,以及各个生产厂家对标准的解读存在偏差,造成同源录波数据的通道名称存在个性化差异,且通道索引号不同,难以进行录波数据的同源匹配。针对上述问题,提出基于句向量掩码纠错双向编码器表征语言模型(sentence-masked language model as correction bidirectional encoder representations from transformers,Sentence-MacBERT)的同源录波数据匹配方法。首先,分析录波文件的记录格式特点,根据录波文件的格式特点完成核查信息表的构建。然后,通过构建的核查信息表进行录波文件自动校核。最后,在双向编码器表征(bidirectional encoder representations from transformers,BERT)模型的基础上构建Sentence-MacBERT同源通道匹配模型,完成同源录波数据匹配。算例分析表明,根据核查信息表能够完成录波文件的自动校核,并对解析失败的录波文件发出告警信息。利用Sentence-MacBERT模型进行通道名称匹配的效果良好,能够有效地完成录波数据的同源匹配,帮助运行人员进行故障分析。 展开更多
关键词 录波数据 sentence-MacBERT 自动校核 通道名称 同源匹配
在线阅读 下载PDF
基于Sentence-BERT与孤立森林算法的专利新颖性评估
2
作者 邓娜 王雨佳 +1 位作者 杨洋 陈旭 《情报杂志》 北大核心 2025年第2期174-182,共9页
[研究目的]面对专利数量的迅猛增长,采用人工方法评估专利新颖性变得愈发困难,且目前专利新颖性评估研究过度聚焦于技术层面,未能综合考虑专利的其他信息因素。因此,实现更高效、客观的专利新颖性评估具有重要的现实意义。[研究方法]提... [研究目的]面对专利数量的迅猛增长,采用人工方法评估专利新颖性变得愈发困难,且目前专利新颖性评估研究过度聚焦于技术层面,未能综合考虑专利的其他信息因素。因此,实现更高效、客观的专利新颖性评估具有重要的现实意义。[研究方法]提出一种基于Sentence-BERT与孤立森林算法的专利新颖性评估方法。首先,使用专利标题与IPC分类号分别作为专利的应用方向与功能分类特征,再通过BiLSTM-CRF模型对专利摘要进行关键技术抽取作为实施方法特征;其次,采用Sentence-BERT对上述特征进行文本向量化表示后组合输入至孤立森林算法获得离群专利集;最后,通过技术量权值过滤法提高专利新颖性评估的精度。[研究结果/结论]以金融科技领域专利进行实证研究,结果表明,该评估方法准确率相较专业专利分析平台方法提升了9%~11%。证明了该方法在专利新颖性评估中的有效性,能为后续专利审核工作和高价值专利分析提供参考。 展开更多
关键词 专利评估 专利新颖性 BiLSTM-CRF sentence-BERT 孤立森林算法 机器学习
在线阅读 下载PDF
基于Sentence-BERT的专利技术主题聚类研究——以人工智能领域为例 被引量:12
3
作者 阮光册 周萌葳 《情报杂志》 CSSCI 北大核心 2024年第2期110-117,共8页
[研究目的]将Sentence-BERT模型应用于专利技术主题聚类,解决专利文献为突出新颖性,常使用独特技术术语造成词汇向量语义特征稀疏的问题。[研究方法]以人工智能领域2015年-2019年的22370篇专利为实验数据。首先,采用Sentence-BERT算法... [研究目的]将Sentence-BERT模型应用于专利技术主题聚类,解决专利文献为突出新颖性,常使用独特技术术语造成词汇向量语义特征稀疏的问题。[研究方法]以人工智能领域2015年-2019年的22370篇专利为实验数据。首先,采用Sentence-BERT算法对专利文献摘要文本进行向量化表示;其次,对向量化矩阵进行数据降维,利用HDBSCAN方式寻找原始数据中的高密度簇;最后,识别类簇文本集合中的主题特征,并完成主题呈现。[研究结论]对比LDA主题模型、K-means、doc2vec等方法,本文的实验结果提高了主题划分的细粒度和精确度,获得了较好的主题一致性。如何采用fine-tune策略进一步提升模型的效果,是未来该方法进一步深入探索的方向。 展开更多
关键词 sentence-BERT 专利文本 主题识别 文本聚类
在线阅读 下载PDF
融合Sentence-BERT和LDA的评论文本主题识别 被引量:22
4
作者 阮光册 黄韵莹 《现代情报》 CSSCI 2023年第5期46-53,共8页
[目的/意义]为了解决评论文本主题识别时语义描述不充分以及学习到的主题语义连贯性不强等问题。本文将Sentence-BERT句子嵌入模型和LDA模型相结合,提升评论文本主题的语义性。[方法/过程]采用Sentence-BERT模型获取评论文本句子层面的... [目的/意义]为了解决评论文本主题识别时语义描述不充分以及学习到的主题语义连贯性不强等问题。本文将Sentence-BERT句子嵌入模型和LDA模型相结合,提升评论文本主题的语义性。[方法/过程]采用Sentence-BERT模型获取评论文本句子层面的向量特征,同时,采用LDA模型获取评论文本的概率主题向量,随后使用自动编码器连接两组向量,运用K-means算法对潜在空间向量进行聚类,从类簇中获取上下文主题信息。[结果/结论]通过对评论文本数据集的实验,本文方法可以较好地获得具有语义信息的主题词。Sentence-BERT模型与LDA结合,增加了模型的复杂性。通过对比,本文方法获得的主题一致性指标(Coherence)优于目前常见的评论文本主题识别方法。 展开更多
关键词 sentence-BERT LDA模型 评论文本 主题识别
在线阅读 下载PDF
基于Sentence-Rank的图像句子标注 被引量:1
5
作者 徐守坤 徐坚 +2 位作者 李宁 周佳 刘楚秋 《计算机工程与应用》 CSCD 北大核心 2019年第2期121-127,共7页
传统的图像语义句子标注是利用句子模板完成对图像内容描述,但其标注句子很难做到符合语言逻辑。针对这一问题,提出基于统计思想从语料库中选出一条最优的句子来描述图像内容,设计以N-gram算法为主要思想的Sentence-Rank算法生成标注句... 传统的图像语义句子标注是利用句子模板完成对图像内容描述,但其标注句子很难做到符合语言逻辑。针对这一问题,提出基于统计思想从语料库中选出一条最优的句子来描述图像内容,设计以N-gram算法为主要思想的Sentence-Rank算法生成标注句子。首先执行机器视觉特征学习,选择标注性能最好的HSV-LBP-HOG融合特征完成图像分类,获得图像标注关键词。然后,利用字符串匹配算法从语料库中列出包含所有标注关键词的句子,并将得到的句子通过Sentence-Rank算法进行价值排序,选取评分最高的句子描述图像。实验结果表明,该方法得到的标注句子具有较低的困惑度,较好地解决了句子的语言逻辑问题。 展开更多
关键词 机器学习 自然语言处理 特征融合 sentence-Rank N-GRAM
在线阅读 下载PDF
基于Sentence-BERT语义表示的咨询问题提示列表自动构建方法研究——以糖尿病咨询为例 被引量:17
6
作者 唐晓波 刘亚岚 《现代情报》 CSSCI 2021年第8期3-15,共13页
[目的/意义]咨询问题提示列表能引导咨询者在智能问答和智能咨询系统进行咨询并为动态咨询引导提供基础。目前,关于问题提示列表构建的研究大多采用专家咨询法、访谈法,这些方法无法满足智能咨询服务要求,本文以有问必答网中糖尿病问答... [目的/意义]咨询问题提示列表能引导咨询者在智能问答和智能咨询系统进行咨询并为动态咨询引导提供基础。目前,关于问题提示列表构建的研究大多采用专家咨询法、访谈法,这些方法无法满足智能咨询服务要求,本文以有问必答网中糖尿病问答为例,提出了基于Sentence-BERT语义表示的咨询问题提示列表自动构建模型。[方法/过程]本文首先在糖尿病相关文献调查和分析的基础上确定糖尿病类目体系,并人工标注咨询问题类别;其次使用LDA模型对每类问题集进行主题聚类;然后各主题下通过Sentence-BERT预训练模型进行问题语义表示,textRank算法计算问题重要性并排序;最终冗余处理后构建出咨询问题提示列表。[结果/结论]实验结果表明,本文提出的模型能有效构建出信息质量较高的、内容丰富的咨询问题提示列表,对咨询引导有促进作用。 展开更多
关键词 问题提示列表 智能问答 智能咨询 问答社区 糖尿病咨询 LDA sentence-BERT
在线阅读 下载PDF
Integrating Intra-and Inter-document Evidences for Improving Sentence Sentiment Classification 被引量:6
7
作者 ZHAO Yan-Yan QIN Bing LIU Ting 《自动化学报》 EI CSCD 北大核心 2010年第10期1417-1425,共9页
关键词 数码相机 像素 富士 光学变焦
在线阅读 下载PDF
Contrastive Studies on Theories of Chinese Complex Sentences, Sentence Group and the SDRT
8
作者 Gao Yun 《学术界》 CSSCI 北大核心 2013年第9期281-287,共7页
Theories of Chinese complex sentences and sentence groups refer to the research of complex sentences and sentence groups in modern Chinese. The SDRTrefers to a dynamic semantic theory of discourse interpretation propo... Theories of Chinese complex sentences and sentence groups refer to the research of complex sentences and sentence groups in modern Chinese. The SDRTrefers to a dynamic semantic theory of discourse interpretation proposed in 1990s by Asher.Through contrastive studies on theories of Chinese complex sentences,sentence groups and the SDRT,we find that they have much in common. 展开更多
关键词 中国 子集 动态语义 句子
在线阅读 下载PDF
FUNCTION OF ADJECTIVE IN A SENTENCE
9
作者 沈洁方 《华东理工大学学报(社会科学版)》 1995年第2期40-58,共19页
In English grammar, an adjective is used to depict, qualify or modify a noun. In doing so, it may refer to the noun either directly, or through the medium of a link verb. Take the adjective "diligent" for ex... In English grammar, an adjective is used to depict, qualify or modify a noun. In doing so, it may refer to the noun either directly, or through the medium of a link verb. Take the adjective "diligent" for example. We can say, "a diligent student", or "The student is diligent." Thus, 展开更多
关键词 FUNCTION OF ADJECTIVE IN A sentence
在线阅读 下载PDF
基于SentencePiece的中医学分词模型建模研究 被引量:1
10
作者 刘双巧 周璐 +7 位作者 李彩艳 袁慧敏 张异卓 李昱达 刘锦钢 郑丰杰 孙燕 李宇航 《世界中医药》 CAS 2021年第6期981-985,990,共6页
目的:探索构建适用于中医学领域的分词模型。方法:采用基于SentencePiece的无监督学习分词方法,提出利用出版教材、名家著作及中医临床病历这3种不同类型的文献构建中医学分词模型;选择中医临床病历、名医医案作为测试集进行模型测试。... 目的:探索构建适用于中医学领域的分词模型。方法:采用基于SentencePiece的无监督学习分词方法,提出利用出版教材、名家著作及中医临床病历这3种不同类型的文献构建中医学分词模型;选择中医临床病历、名医医案作为测试集进行模型测试。结果:中医学分词模型在测试集中的Kappa系数为0.79(一致性程度很高),准确率为0.84,宏观精确率为0.84,宏观召回率为0.83,宏观f1得分为0.83。结论:所构建的分词模型对于中医学专业术语有着较好的切分效果,表明该方法可运用于中医学领域的分词模型的构建,可为进一步地研究中医学分词提供方法学参考。 展开更多
关键词 分词 中文分词 分词模型 无监督学习 无监督分词 sentencePiece
在线阅读 下载PDF
“既然”句的性质及归类问题
11
作者 刘利 朱光鑫 《语言科学》 北大核心 2025年第1期8-20,共13页
主流的汉语语法学论著认为“既然”与“因为”句同属于因果句,“如果”句则属于条件(假设)句,就是说“既然”句与“如果”句是对立的。但通过对语言事实的深入分析发现,问题并不那么简单。实际上,“既然”句具有两种不同性质的用法,据... 主流的汉语语法学论著认为“既然”与“因为”句同属于因果句,“如果”句则属于条件(假设)句,就是说“既然”句与“如果”句是对立的。但通过对语言事实的深入分析发现,问题并不那么简单。实际上,“既然”句具有两种不同性质的用法,据此应归入不同的复句类别:“既然1”句,表达因果关系,其句法语义特征与“因为”句一致,可归入因果句;“既然2”句,表达条件关系,其句法语义特征与“如果”句一致,应归入条件句。 展开更多
关键词 “既然” “如果” “因为” 条件句 因果句
在线阅读 下载PDF
后挂式骨导助听器听力干预短期效果的临床评估 被引量:1
12
作者 李蕴 张宏征 +5 位作者 蔡洁青 黄美萍 杨璐 闫冰岩 宋依航 郗昕 《听力学及言语疾病杂志》 北大核心 2025年第1期50-54,共5页
目的 比较韶音后挂式骨导助听器对不同类型听力损失患者的听力干预短期效果,探讨其临床应用前景。方法 55例听力损失患者(年龄18~82岁;传导性听力损失9例,感音神经性听力损失15例,混合性听力损失31例;左右耳0.5、1、2、4 kHz四个频率的... 目的 比较韶音后挂式骨导助听器对不同类型听力损失患者的听力干预短期效果,探讨其临床应用前景。方法 55例听力损失患者(年龄18~82岁;传导性听力损失9例,感音神经性听力损失15例,混合性听力损失31例;左右耳0.5、1、2、4 kHz四个频率的骨导纯音听阈均≤60 dB HL)配戴韶音后挂式骨导助听器,分别于配戴助听器前和配戴第14±2 d行声场总体听阈、单音节识别率及安静环境语句识别阈测试,比较配戴助听器前后的结果差异。并于配戴第14±2 d使用IOI-HA问卷对助听器使用效果进行评估。结果 患者配戴后挂式骨导式助听器后声场四个频率平均听阈(39.3±4.9 dB HL)较配戴前(56.5±8.2 dB HL)显著改善,差异有统计学意义(P<0.001)。患者助听前单音节识别率(给声强度:患者助听前双音节言语识别阈减5 dB)为29.8%±11.4%,配戴第14±2 d为72.4%±14.4%,配戴后单音节识别率显著提高,差异有统计学意义(P<0.001)。患者语句识别阈由配戴前的48.6±9.7 dB HL降至34.3±5.6 dB HL,差异有统计学意义(P<0.001)。配戴14±2 d时IOI-HA问卷评估总分平均值为29.0±3.8分。结论 后挂式骨导助听器可显著提高传导性、0.5~4 kHz骨导纯音听阈不超过60 dB HL的混合性及感音神经性听力损失患者的听力及言语识别能力。 展开更多
关键词 听力损失 骨导助听器 言语识别率 语句识别阈 IOI-HA问卷
在线阅读 下载PDF
单位犯罪刑事制裁的优化 被引量:1
13
作者 时延安 《政治与法律》 北大核心 2025年第3期50-63,共14页
单位犯罪刑事法律制度的完善,应统筹考虑实体法和程序法的立法活动,在刑法立法方面应考虑调整和增设有关单位犯罪及其刑事制裁的法律规范。全面构建单位刑事制裁体系,应当在坚持单位组织体责任理论并厘清其应有内涵的前提下,重新思考单... 单位犯罪刑事法律制度的完善,应统筹考虑实体法和程序法的立法活动,在刑法立法方面应考虑调整和增设有关单位犯罪及其刑事制裁的法律规范。全面构建单位刑事制裁体系,应当在坚持单位组织体责任理论并厘清其应有内涵的前提下,重新思考单位的刑事可罚性,进而明确对单位的刑罚目的,即一方面对单位犯罪同样要坚持责任报应理念,另一方面要突出预防目的的实现,重点强调改造和积极一般预防目的的意义,在少数情况下考虑剥夺犯罪能力的实现;应循宪法理论和现有规范,确定单位应享有的基本权利,进而将限制和剥夺单位基本权利的行为规定为对单位的刑罚类型;根据对单位的刑罚目的和应然的刑罚类型,结合量刑和行刑基本法理,构建单位量刑和行刑制度。 展开更多
关键词 单位刑事制裁 刑罚目的 刑罚类型 单位量刑 单位行刑
在线阅读 下载PDF
认罪认罚情节适用的从宽困惑与完善对策 被引量:1
14
作者 石经海 《政治与法律》 北大核心 2025年第5期129-145,共17页
研究表明,认罪认罚情节在适用中存在轻罪案从宽体现不明显、从宽范围等同于从轻处罚、从宽幅度适用缺少量刑正当性根据支撑等诸多困惑。这主要是因为认罪认罚情节为酌定量刑情节的固有缺陷、对禁止重复评价原则的片面把握、对量刑情节... 研究表明,认罪认罚情节在适用中存在轻罪案从宽体现不明显、从宽范围等同于从轻处罚、从宽幅度适用缺少量刑正当性根据支撑等诸多困惑。这主要是因为认罪认罚情节为酌定量刑情节的固有缺陷、对禁止重复评价原则的片面把握、对量刑情节正当性根据的认知不足和对宽严相济刑事政策的贯彻不够等。基于“认罪+认罚”的构成要素,认罪认罚情节与《刑法》上具有“认罪”或“认罚”因素的量刑情节,因成立条件不同而不具有竞合关系,不能适用禁止重复评价原则不予同时认定和从宽处罚。据此,认罪认罚情节的适用规则完善,既包括对凡符合“认罪+认罚”基本适用条件的,就应认定为认罪认罚情节和原则上给予从轻处罚,并基于认罪认罚的时间迟早确定其从轻处罚幅度,也包括对因认罪认罚而社会危害性或人身危险性明显减小的,不依附其他从宽情节认定其减轻或免除处罚并确定其减轻处罚幅度。 展开更多
关键词 认罪认罚情节 从宽困惑 酌定量刑情节 禁止重复评价 正当性根据
在线阅读 下载PDF
基于关系图卷积神经网络的跨句实体关系抽取
15
作者 陈千 关春祥 +1 位作者 郭鑫 王素格 《中文信息学报》 北大核心 2025年第7期62-71,共10页
相对于句子级关系抽取,涉及关系的实体存在于多个句子中的情况在实际场景中更常见。因此篇章级关系抽取逐渐成为近年来信息抽取领域的研究热点。为了充分利用上下文信息和篇章结构信息,该文采用实体嵌入表示和实体间的显式结构关系研究... 相对于句子级关系抽取,涉及关系的实体存在于多个句子中的情况在实际场景中更常见。因此篇章级关系抽取逐渐成为近年来信息抽取领域的研究热点。为了充分利用上下文信息和篇章结构信息,该文采用实体嵌入表示和实体间的显式结构关系研究跨句实体关系抽取。首先,对篇章进行编码和构图;进而,使用关系图卷积神经网络对图节点进行更新,并利用融合篇章全局信息的节点嵌入表示更新边嵌入表示;最后,该模型使用一种迭代算法完成边信息的推理,实现跨句实体关系抽取。实验结果表明,相比基线模型,在CDR和GDA数据集上的跨句实体关系抽取性能得到了显著提高。 展开更多
关键词 关系图卷积神经网络 跨句实体关系抽取 实体嵌入
在线阅读 下载PDF
两阶段式专利技术问题抽取方法
16
作者 吕学强 刘兆楠 +1 位作者 游新冬 罗艺雄 《中文信息学报》 北大核心 2025年第1期56-64,78,共10页
专利技术问题阐明了当前专利所在技术主题下存在的具体问题,同时也是当前专利需要解决的问题。专利中已有的摘要虽然实现了对整体专利文本的信息压缩,但部分专利文本的摘要中缺失了对专利技术问题的描述。针对专利技术问题缺失的情况,... 专利技术问题阐明了当前专利所在技术主题下存在的具体问题,同时也是当前专利需要解决的问题。专利中已有的摘要虽然实现了对整体专利文本的信息压缩,但部分专利文本的摘要中缺失了对专利技术问题的描述。针对专利技术问题缺失的情况,该文将专利技术问题挖掘转换为专利技术问题描述句抽取,提出了一种基于BERT的专利技术问题描述句两阶段式抽取方法,从专利说明书中挖掘对应描述专利技术问题的句子集合。第一阶段通过BERT获取专利说明书中各语句的向量表示,进一步通过Sigmoid函数获取各语句评分,筛选出评分高的若干句子作为候选技术问题描述句。第二阶段,取第一阶段抽取的句子集合的子集得到若干候选技术问题描述句集合,通过BERT得到候选句集合与专利说明书的向量表示,使用余弦相似度计算两者之间的语义相似度,语义相似度最高的候选句集合作为技术问题输出。实验结果表明,基于BERT的两阶段式抽取方法Rouge-L达到34.38,且与传统方法相比更加简练。 展开更多
关键词 专利技术问题 句子抽取 神经网络
在线阅读 下载PDF
语气、情态和汉语的句末语气词
17
作者 梁银峰 《汉语学报》 北大核心 2025年第3期29-44,共16页
语气和情态都涉及说话人对句子所述命题或事件的主观态度,两者不容易做出明确区分。文章认为,在分析汉语的情态和语气问题时,对于这两种范畴要注意区分其核心功能和非核心功能:典型的情态主要表达说话人对所说内容的确信程度和对信息的... 语气和情态都涉及说话人对句子所述命题或事件的主观态度,两者不容易做出明确区分。文章认为,在分析汉语的情态和语气问题时,对于这两种范畴要注意区分其核心功能和非核心功能:典型的情态主要表达说话人对所说内容的确信程度和对信息的真实性做出判断,典型的语气是表达句子的言语交际作用的范畴,它主要反映的是说话人和听话人之间的言语互动。文章认为汉语的句末语气词在功能上可分为三类,这三类句末语气词依据其主观性和所表达的语气的强弱程度以及虚化程度,大致存在如下等级:情态功能>语气功能>互动功能。句末语气词是表达言语行为和传达说话人的交际意图的重要语法手段,运用言语行为理论和从言语互动的视角研究汉语句末语气词的功能和意义是今后努力的一个方向。 展开更多
关键词 情态 语气 句末语气词 言语行为 言语互动
在线阅读 下载PDF
人工智能辅助量刑的证据化改造
18
作者 程龙 《现代法学》 北大核心 2025年第2期174-188,共15页
人工智能辅助量刑已在我国刑事司法中实现常态化应用,以达到统一量刑标准、确保量刑公正的预期目标。然而,其深度介入量刑裁判存在正当性风险,亟待构建符合法治原则的规制体系。对此,学术界提出了辅助司法论与算法正当程序论两种不同方... 人工智能辅助量刑已在我国刑事司法中实现常态化应用,以达到统一量刑标准、确保量刑公正的预期目标。然而,其深度介入量刑裁判存在正当性风险,亟待构建符合法治原则的规制体系。对此,学术界提出了辅助司法论与算法正当程序论两种不同方案,但均存在一定局限,即不当赋予人工智能辅助量刑系统以裁判主体地位,忽视了辩方的程序参与权,以及缺乏证据裁判的制度空间。鉴于此,应当将人工智能辅助量刑纳入司法审查对象范畴,对其进行证据化改造以满足诉讼化和可裁判化的基本要求。具体路径可依托现行刑事诉讼制度框架,将人工智能辅助量刑建议作为专门性报告,从证据规则、举证主体、证据形成阶段、质证认证,以及司法责任承担五个方面进行规制。 展开更多
关键词 人工智能辅助量刑 算法 审判权 证据 专门性报告
在线阅读 下载PDF
中文小说短句序列文本复述数据集
19
作者 万福成 雷鑫鹏 +1 位作者 王双 魏斌 《中国科学数据(中英文网络版)》 2025年第3期535-543,共9页
文本复述是自然语言处理、自然语言生成重要的研究内容。目前基于神经网络的复述生成研究大部分以英语和日语为研究对象,由于汉语语料资源稀少,导致汉语复述研究滞后。针对这一问题,本研究采用基于北大释义库(PKU Paraphrase Bank)的中... 文本复述是自然语言处理、自然语言生成重要的研究内容。目前基于神经网络的复述生成研究大部分以英语和日语为研究对象,由于汉语语料资源稀少,导致汉语复述研究滞后。针对这一问题,本研究采用基于北大释义库(PKU Paraphrase Bank)的中文小说复述语料,通过人工挑选和数据预处理得到高质量的短句复述对。数据集包括34770句对,69540句短文本序列,大小为2.91 MB。通过使用LaserTagger复述生成模型与大规模的中文问题匹配语料库(A Largescale Chinese Question Matching Corpus,LCQCM)进行对比,显示本数据集质量更高。本数据集可应用于机器翻译,缓解语料稀疏问题,对自动问答领域问句进行改写和扩展,对信息检索领域检索词、句进行扩展和泛化等。 展开更多
关键词 文本复述 短句序列 复述生成 低资源
在线阅读 下载PDF
对话构式视角下的辩驳式“才”字句研究
20
作者 邓川林 《汉语学报》 北大核心 2025年第1期29-38,共10页
本文从对话构式的视角来研究表示辩驳的“才”字句,认为其构式意义需要在对话中得到全面解读,不能仅由自身推导得出。辩驳式“才”字句具备平行性、类推性、促发性、对话性等特征,通过成分复现、并置结构、否定标记、前后对比等方式与... 本文从对话构式的视角来研究表示辩驳的“才”字句,认为其构式意义需要在对话中得到全面解读,不能仅由自身推导得出。辩驳式“才”字句具备平行性、类推性、促发性、对话性等特征,通过成分复现、并置结构、否定标记、前后对比等方式与先前话语建立语言学上的亲近关系,实现对话共鸣。该构式并非强调命题真值,而是组成了由负面评价、主观定位和反对态度构成的立场三角,有标示对方威胁面子行为(FTA)的功能。研究发现,对话构式作为对话结构中的形式和意义配对,其核心句法条件是特定语法成分的形式介入作用,而构式语义则是语用推理的结果。 展开更多
关键词 辩驳式“才”字句 对话构式 共鸣 立场三角
在线阅读 下载PDF
上一页 1 2 94 下一页 到第
使用帮助 返回顶部