[目的/意义]科技文献复杂知识对象对科技文献中的深度知识内容进行细粒度、全面的知识表示,可有效支撑数智驱动的科学发现与知识发现,是重要的科技创新要素。[方法/过程]首先,通过轻量级本体构建、BRAT知识标注和Neo4j知识存储等步骤实...[目的/意义]科技文献复杂知识对象对科技文献中的深度知识内容进行细粒度、全面的知识表示,可有效支撑数智驱动的科学发现与知识发现,是重要的科技创新要素。[方法/过程]首先,通过轻量级本体构建、BRAT知识标注和Neo4j知识存储等步骤实现领域知识图谱构建,其次,本地化部署大语言模型ChatGLM2-6B并通过低秩适应(Low-Rank Adaptation,LoRA)技术微调模型,最后基于思维记忆(Memory of Thoughts,MOT)机制将知识图谱中的复杂知识注入提示中,通过与大语言模型的多轮问答从科技文献中抽取出复杂知识对象。[结果/结论]以有机太阳能电池(Organic Solar Cells,OSC)为例验证方法的有效性,结果表明融合知识图谱与大语言模型的抽取方法优于大语言模型单独支撑的抽取方法,在准确率P、召回率R和F1值3个指标上分别提升14.1%、10.3%和12.3%。知识图谱能够增强大语言模型对科技文献的复杂知识对象抽取能力,提升OSC领域的科技文献挖掘效率与准确性。展开更多
[背景/意义]研究和对比不同主题建模方法在科学文献主题识别上的应用表现,对于合理选择使用主题建模技术开展科学文献主题挖掘具有重要意义。[方法/过程]通过构建中英文科学文献实验语料,选择3种主题建模方法(LDA、Top2vec、Bertopic)和...[背景/意义]研究和对比不同主题建模方法在科学文献主题识别上的应用表现,对于合理选择使用主题建模技术开展科学文献主题挖掘具有重要意义。[方法/过程]通过构建中英文科学文献实验语料,选择3种主题建模方法(LDA、Top2vec、Bertopic)和5种文本特征计算方法(Bag of Words、TFIDF、Doc2vec、MiniLM、SciBert)进行中英文科学文献主题建模实验,并对不同建模结果的主题多样性、主题一致性、主题稳定性和主题离散性指标进行对比分析。[结果/结论]不同建模工具的主题识别结果存在较大差异,其中LDA与Bertopic在英文和中文语料上识别出的主题中具有相似性关系的主题占比相对较高,但也仅为9.81%和7.46%;基于Doc2vec算法的Top2vec模型在主题多样性指标上的表现相对最优;基于文本预训练算法的Top2vec模型和Bertopic模型的主题稳定性和离散性指标优于传统主题建模方法。针对大语言模型技术的快速发展和广泛应用,加快推进科学文献预训练模型研发,并将之应用于科技情报业务实践是当前的重要研究方向。展开更多
采用CiteSpace 6.2.R5软件对2003年1月—2023年10月CNKI和Web of Science核心合集数据库中山茱萸研究相关文献进行了全面综合分析,共纳入3217篇中文文献和425篇英文文献。结果显示,蔡宝昌和Yokozawa分别是中、英文山茱萸研究发文量最多...采用CiteSpace 6.2.R5软件对2003年1月—2023年10月CNKI和Web of Science核心合集数据库中山茱萸研究相关文献进行了全面综合分析,共纳入3217篇中文文献和425篇英文文献。结果显示,蔡宝昌和Yokozawa分别是中、英文山茱萸研究发文量最多的作者,南京中医药大学是中、英文山茱萸研究发文量最多的机构,中、英文关键词分析显示山茱萸的研究内容主要涉及山茱萸化学成分、炮制工艺、药理作用以及临床应用等方面。山茱萸的活性成分和药理作用及作用机制是该药物研究热点,山茱萸临床应用、用药规律挖掘是未来的发展趋势,研究结果可为后期开展相关学术研究提供参考和借鉴。展开更多
文摘[目的/意义]科技文献复杂知识对象对科技文献中的深度知识内容进行细粒度、全面的知识表示,可有效支撑数智驱动的科学发现与知识发现,是重要的科技创新要素。[方法/过程]首先,通过轻量级本体构建、BRAT知识标注和Neo4j知识存储等步骤实现领域知识图谱构建,其次,本地化部署大语言模型ChatGLM2-6B并通过低秩适应(Low-Rank Adaptation,LoRA)技术微调模型,最后基于思维记忆(Memory of Thoughts,MOT)机制将知识图谱中的复杂知识注入提示中,通过与大语言模型的多轮问答从科技文献中抽取出复杂知识对象。[结果/结论]以有机太阳能电池(Organic Solar Cells,OSC)为例验证方法的有效性,结果表明融合知识图谱与大语言模型的抽取方法优于大语言模型单独支撑的抽取方法,在准确率P、召回率R和F1值3个指标上分别提升14.1%、10.3%和12.3%。知识图谱能够增强大语言模型对科技文献的复杂知识对象抽取能力,提升OSC领域的科技文献挖掘效率与准确性。
文摘一、论文结尾的引用文献格式样例 1.专著、论文集 主要责任者.出版年.题名:其他题名信息[文献类型标志].其他责任者.版本项(第一版不著录).出版地:出版者:引文页码[引用日期].示例如下:萨皮尔.1921/2001.语言论[M].陆卓元,译.北京:商务印书馆:186.束定芳,庄智象. 2008.现代外语教学——理论、实践与方法[M].修订版.上海:上海外语教育出版社.Bublitz,W.&Lenk,U.&Ventola,E.1999.Coherence in spoken and written discourse[C]. Amsterdam/Philadelphia:John Benjamin’s Publishing Company.Fried-Booth,D.L.2002.Project work[M]. 2nd ed.Oxford:Oxford University Press.2.专著、论文集中析出文献析出文献 主要责任者.出版年.析出文献题名[文献类型标志].其他责任者//专著主要责任者.专著题名:其他题名信息.版本项.出版地:出版者:析出文献的页码.
文摘[背景/意义]研究和对比不同主题建模方法在科学文献主题识别上的应用表现,对于合理选择使用主题建模技术开展科学文献主题挖掘具有重要意义。[方法/过程]通过构建中英文科学文献实验语料,选择3种主题建模方法(LDA、Top2vec、Bertopic)和5种文本特征计算方法(Bag of Words、TFIDF、Doc2vec、MiniLM、SciBert)进行中英文科学文献主题建模实验,并对不同建模结果的主题多样性、主题一致性、主题稳定性和主题离散性指标进行对比分析。[结果/结论]不同建模工具的主题识别结果存在较大差异,其中LDA与Bertopic在英文和中文语料上识别出的主题中具有相似性关系的主题占比相对较高,但也仅为9.81%和7.46%;基于Doc2vec算法的Top2vec模型在主题多样性指标上的表现相对最优;基于文本预训练算法的Top2vec模型和Bertopic模型的主题稳定性和离散性指标优于传统主题建模方法。针对大语言模型技术的快速发展和广泛应用,加快推进科学文献预训练模型研发,并将之应用于科技情报业务实践是当前的重要研究方向。
文摘采用CiteSpace 6.2.R5软件对2003年1月—2023年10月CNKI和Web of Science核心合集数据库中山茱萸研究相关文献进行了全面综合分析,共纳入3217篇中文文献和425篇英文文献。结果显示,蔡宝昌和Yokozawa分别是中、英文山茱萸研究发文量最多的作者,南京中医药大学是中、英文山茱萸研究发文量最多的机构,中、英文关键词分析显示山茱萸的研究内容主要涉及山茱萸化学成分、炮制工艺、药理作用以及临床应用等方面。山茱萸的活性成分和药理作用及作用机制是该药物研究热点,山茱萸临床应用、用药规律挖掘是未来的发展趋势,研究结果可为后期开展相关学术研究提供参考和借鉴。