基于语义关系和实体识别的潜在标准必要专利识别研究

Research on Potential Standard Essential Patent Recognition Based on Semantic Relationships and Entity Recognition

在线阅读下载PDF

导出

摘要 [目的/意义]为解决潜在标准必要专利识别任务中的序列信息的关键实体识别问题和序列建模的长距离依赖问题,实现识别精准度的提升和识别结果可解释性的增强。基于此,本文提出一种融合预训练模型XLNet和实体识别模型BiLSTM-CRF的潜在标准必要专利识别模型(XLNet-BiLSTM-CRF-CNN,XLBLCC)。[方法/过程]通过XLNet模型联合上下文语境实现专利文本的词向量化与语义关系表达,并基于BiLSTM-CRF模型生成NER标签,用于标注文本中的命名实体边界,再通过构建CNN模型来学习标准必要专利(SEP)文本中的特征,实现潜在标准必要专利的识别和预测。实证部分以ETSI数据库中检索的SEP和incopat数据库中检索的非SEP构建的数据集对模型性能进行验证。[结果/结论]研究发现:XLBLCC模型在准确率(86%)、F1值(89%)和AUC值(84%)上均超越其他基线模型;XLNet模型在全局语义理解上较之BERT等模型具备优越性;在高价值专利与标准必要专利的对比实验中,该模型表现出较强的泛化能力。 [Purpose/Significance]This study addresses the challenges of entity recognition and long-distance depen-dencies in sequence modeling for potential Standard Essential Patent(SEP)identification tasks.The goal is to improve rec-ognition accuracy and enhance the interpretability of results,based on which,a novel model,XLNet-BiLSTM-CRF-CNN(XLBLCC)is proposed to identify potential SEPs.[Method/Process]The XLNet model was used to capture contextual semantics in patent text,providing rich vector representations and semantic relations.The BiLSTM-CRF model was applied to generate Named Entity Recognition(NER)tags,which helped identify the boundaries of entities in the text.To further enhance feature extraction,a CNN model was employed to learn the important characteristics of SEP text for accu-rate prediction.The model’s performance was validated on a dataset containing SEPs from the ETSI database and non-SEPs from the Incopat database.[Result/Conclusion]The XLBLCC model outperform baseline models,achieving an accu-racy of 86%,an F1 score of 89%,and an AUC of 84%.The XLNet model demonstrate superior global semantic under-standing compared to models like BERT.In experiments comparing high-value patents with SEPs,the proposed model show strong generalization capabilities,making it an effective and robust tool for SEP identification in patent analysis.

作者窦路遥周志刚冯宇 Dou Luyao;Zhou Zhigang;Feng Yu(National Science Library(Wuhan),Chinese Academy of Sciences,Wuhan 430071,China;Department of Information Resources Management,School of Economics and Management,University of Chinese Academy of Sciences,Beijing 100190,China;School of Information,Shanxi University of Finance and Economics,Taiyuan 030006,China;School of Economics and Business Administration,Chongqing University,Chongqing 400000,China)

机构地区中国科学院武汉文献情报中心中国科学院大学经济与管理学院信息资源管理系山西财经大学信息学院重庆大学经济与工商管理学院

出处《现代情报》北大核心 2025年第10期16-25,共10页 Journal of Modern Information

基金国家自然科学基金项目“多源数据融合场景下的对抗式隐私洞察靶向保护技术研究”(项目编号:61902226)。

关键词语义关系潜在标准必要专利 XLNet BiLSTM-CRF CNN semantic relationships potential standard essential patent XLNet BiLSTM-CRF CNN

分类号 G255.53 [文化科学—图书馆学]

作者简介窦路遥(1999-),男,博士研究生,研究方向:专利分析与机器学习。;周志刚(1986-),男,副教授,博士,硕士生导师,研究方向:专利分析与数据融合。;通信作者:冯宇(1998-),女,博士研究生,研究方向:专利分析与自然语言处理。

引文网络
相关文献

参考文献17

1崔维军,岑珊,陈光,吴杰,韩硕,孙成.标准必要专利产生背景、运行机制与影响:文献回顾与研究展望[J].科学学与科学技术管理,2020,41(5):140-158. 被引量：32
2龙小宁,王禹诺.如何评价专利主张实体在创新市场中的作用?——基于全球标准必要专利的实证分析[J].经济科学,2023(6):144-163. 被引量：2
3易继明,胡小伟.标准必要专利实施中的竞争政策——“专利劫持”与“反向劫持”的司法衡量[J].陕西师范大学学报（哲学社会科学版）,2021,50(2):82-95. 被引量：25
4张华,蒋勇.基于公平偏好的标准必要专利许可与利益协调[J].系统工程,2018,36(11):147-152. 被引量：5
5王卫军,宁致远,董昊,乔子越,杜一,周园春.基于语义相似关系的学科交叉主题识别方法[J].情报学报,2024,43(1):34-47. 被引量：4
6张玉蓉,吴文飞.标准必要专利FRAND许可费确定的影响因素实证研究[J].科研管理,2023,44(2):146-155. 被引量：6
7乔岳,郭晶晶.标准必要专利FRAND许可费计算——经济学原理和司法实践[J].财经问题研究,2021(4):47-55. 被引量：10
8赵辉,肖翔.标准必要专利评估筛选研究——以5G专利为例[J].高技术通讯,2020,30(1):101-108. 被引量：10
9刘鑫,张栋,林晶晶.高铁潜在标准必要专利的竞争预警分析及其政策启示——一个标准与专利关联分析的新框架[J].中国软科学,2020(8):36-46. 被引量：12
10翟东升,金苑苑,徐硕,何喜军,胡涵清,甄柳林.基于语义特征的潜在标准必要专利识别研究[J].科研管理,2022,43(3):183-191. 被引量：11

二级参考文献163

1马费成,张帅.我国图书情报领域新兴交叉学科发展探析[J].中国图书馆学报,2023,49(2):4-14. 被引量：32
2文嫮.技术标准中专利分布影响下的价值链治理模式研究——以移动通信产业为例[J].中国工业经济,2007(4):119-127. 被引量：19
3梁志文.反思知识产权请求权理论——知识产权要挟策略与知识产权请求权的限制[J].清华法学,2008,2(4):124-136. 被引量：34
4徐瑄.专利权垄断性的法哲学分析[J].中国法学,2002(4):95-101. 被引量：13
5俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：165
6汤维建,沈磊.论诉权滥用及其法律规制[J].山东警察学院学报,2007,19(2):21-28. 被引量：28
7赵启杉,黄良才.技术标准中的事先披露原则——VITA新专利政策介评[J].电子知识产权,2007(6):23-27. 被引量：11
8国家标准委、国家知识产权局.《国家标准涉及专利的管理规定(暂行)》的公告[EB ]. [ 2013-12-26]. http://www. sac.gov. cn/gybzheb/zxtz_850/201312/t20131226_149313. htm.
9European Telecommunications Standards Institute. ETSI Guideon Intellectual Property Rights [EB]. [2014-03-05]. Version a-dopted by Board #94 on 19 September 2013, ETSI Rules of Pro-cedure, 20 March 2013. http://www. etsi. org/aboul/569-etsi-ipr-policy-faqs. highlight = YToxOntpOjA7czo20iJwYX Rlbn-Qi030 = .
10Rysman M,Simcoe T. Patents and the Perfonnance of VoluntaryStandard-Setting Organizations!^],Management Science,2008,54(11):1920-1934.

共引文献205

1张俊艳,杨沫涵,王迪,张芸苓.数字经济时代标准必要专利许可三方演化博弈研究[J].管理评论,2023,35(2):268-279. 被引量：9
2崔维军,岑珊,陈光,吴杰,韩硕,孙成.标准必要专利产生背景、运行机制与影响:文献回顾与研究展望[J].科学学与科学技术管理,2020,41(5):140-158. 被引量：32
3许琦.专利池组建和管理策略分析:关于若干专利侵权诉讼案件的思考[J].法制与经济,2021(8):71-77. 被引量：3
4宁立志,龚涛.标准必要专利全球费率裁判:实践、争议与对策[J].北方法学,2022,16(3):38-52. 被引量：14
5孙汝福.悠悠为农心报得三春晖:诩产度市劳动模范,优秀共产党员张玉刚[J].新世纪领导者,2000(1):45-45.
6刘华楠.如何发现潜在的有价值专利[J].中国发明与专利,2018,15(3):34-39. 被引量：1
7冯敏,李清涛,赵红.商用后5G技术专利布局演进分析[J].现代信息科技,2020,4(9):1-4. 被引量：1
8张静,李玉洁,雷孝平,陈亮.国际标准化组织标准必要专利评析[J].全球科技经济瞭望,2020,35(5):50-59. 被引量：10
9刘鑫,张栋,林晶晶.高铁潜在标准必要专利的竞争预警分析及其政策启示——一个标准与专利关联分析的新框架[J].中国软科学,2020(8):36-46. 被引量：12
10廉龙颖.Bi-LSTM+CRF的网络空间安全领域命名实体的识别[J].黑龙江科技大学学报,2020,30(6):717-722. 被引量：6

1华珉,齐晓曼,李永,安静.多模态数据融合与生存预测算法在高价值专利识别中的实践[J].中国信息界,2025(8):133-135.
2张祥.指向深度学习的逆向教学设计——以高中生物学“细胞中的糖类和脂质”教学为例[J].江苏教育,2025(31):62-65.
3ETSI发布《保障人工智能安全技术规范》[J].信息技术与标准化,2025(9):9-9.
4吴春燕.指向学习适应的小幼衔接校本课程开发与实施[J].教育视界,2025(16):28-31.
5陈东晖,于学伟,胡丽宁.金融科技能否赋能企业新质生产力发展——来自银行专利文本信息的经验证据[J].国际金融研究,2025(7):51-62.
6许家宁.高新技术企业核心专利识别与布局路径优化研究[J].高科技与产业化,2025,31(7):123-125.
7邓娜,喻卓群,但文俊,陈旭,刘树栋.一种融合语义特征和多层交叉注意力机制的中药专利文本实体关系联合抽取模型[J].数据分析与知识发现,2025,9(7):141-153.
8马永强,刘家伟,高影繁.面向可溯源文本生成的科技文献伪反馈训练数据合成研究[J].情报学报,2025,44(7):830-845.
9李建青,王天勤,滕跃发,郭磊,黄杨,李斐.新污染物诱导12种细胞核受体相关活性的机器学习预测模型[J].色谱,2025,43(8):959-970.
10李嘉哲.美国中小学教育数字化实践综述[J].中国数字出版,2025,3(4):141-146.

现代情报

2025年第10期

浏览历史

内容加载中请稍等...

基于语义关系和实体识别的潜在标准必要专利识别研究

参考文献17

二级参考文献163

共引文献205

相关作者

相关机构

相关主题

浏览历史