期刊文献+
共找到69篇文章
< 1 2 4 >
每页显示 20 50 100
Automatic Keyphrase Extraction from Scientific Chinese Medical Abstracts Based on Character-Level Sequence Labeling 被引量:4
1
作者 Liangping Ding Zhixiong Zhang +2 位作者 Huan Liu Jie Li GaihongYu 《Journal of Data and Information Science》 CSCD 2021年第3期35-57,共23页
Purpose:Automatic keyphrase extraction(AKE)is an important task for grasping the main points of the text.In this paper,we aim to combine the benefits of sequence labeling formulation and pretrained language model to p... Purpose:Automatic keyphrase extraction(AKE)is an important task for grasping the main points of the text.In this paper,we aim to combine the benefits of sequence labeling formulation and pretrained language model to propose an automatic keyphrase extraction model for Chinese scientific research.Design/methodology/approach:We regard AKE from Chinese text as a character-level sequence labeling task to avoid segmentation errors of Chinese tokenizer and initialize our model with pretrained language model BERT,which was released by Google in 2018.We collect data from Chinese Science Citation Database and construct a large-scale dataset from medical domain,which contains 100,000 abstracts as training set,6,000 abstracts as development set and 3,094 abstracts as test set.We use unsupervised keyphrase extraction methods including term frequency(TF),TF-IDF,TextRank and supervised machine learning methods including Conditional Random Field(CRF),Bidirectional Long Short Term Memory Network(BiLSTM),and BiLSTM-CRF as baselines.Experiments are designed to compare word-level and character-level sequence labeling approaches on supervised machine learning models and BERT-based models.Findings:Compared with character-level BiLSTM-CRF,the best baseline model with F1 score of 50.16%,our character-level sequence labeling model based on BERT obtains F1 score of 59.80%,getting 9.64%absolute improvement.Research limitations:We just consider automatic keyphrase extraction task rather than keyphrase generation task,so only keyphrases that are occurred in the given text can be extracted.In addition,our proposed dataset is not suitable for dealing with nested keyphrases.Practical implications:We make our character-level IOB format dataset of Chinese Automatic Keyphrase Extraction from scientific Chinese medical abstracts(CAKE)publicly available for the benefits of research community,which is available at:https://github.com/possible1402/Dataset-For-Chinese-Medical-Keyphrase-Extraction.Originality/value:By designing comparative experiments,our study demonstrates that character-level formulation is more suitable for Chinese automatic keyphrase extraction task under the general trend of pretrained language models.And our proposed dataset provides a unified method for model evaluation and can promote the development of Chinese automatic keyphrase extraction to some extent. 展开更多
关键词 automatic keyphrase extraction Character-level sequence labeling Pretrained language model Scientific chinese medical abstracts
在线阅读 下载PDF
A method for improving the accuracy of automatic indexing of Chinese-English mixed documents
2
作者 Yan ZHAO Hui SHI 《Chinese Journal of Library and Information Science》 2012年第4期77-92,共16页
Purpose: The thrust of this paper is to present a method for improving the accuracy of automatic indexing of Chinese-English mixed documents.Design/methodology/approach: Based on the inherent characteristics of Chines... Purpose: The thrust of this paper is to present a method for improving the accuracy of automatic indexing of Chinese-English mixed documents.Design/methodology/approach: Based on the inherent characteristics of Chinese-English mixed texts and the cybernetics theory,we proposed an integrated control method for indexing documents. It consists of 'feed-forward control','in-progress control' and 'feed-back control',aiming at improving the accuracy of automatic indexing of Chinese-English mixed documents. An experiment was conducted to investigate the effect of our proposed method.Findings: This method distinguishes Chinese and English documents in grammatical structures and word formation rules. Through the implementation of this method in the three phases of automatic indexing for the Chinese-English mixed documents,the results were encouraging. The precision increased from 88.54% to 97.10% and recall improved from97.37% to 99.47%.Research limitations: The indexing method is relatively complicated and the whole indexing process requires substantial human intervention. Due to pattern matching based on a bruteforce(BF) approach,the indexing efficiency has been reduced to some extent.Practical implications: The research is of both theoretical significance and practical value in improving the accuracy of automatic indexing of multilingual documents(not confined to Chinese-English mixed documents). The proposed method will benefit not only the indexing of life science documents but also the indexing of documents in other subject areas.Originality/value: So far,few studies have been published about the method for increasing the accuracy of multilingual automatic indexing. This study will provide insights into the automatic indexing of multilingual documents,especially Chinese-English mixed documents. 展开更多
关键词 chinese-English mixed documents String matching Accuracy of automatic indexing CYBERNETICS Dedicated hepatitis B virus(HBV) database
在线阅读 下载PDF
Effective Analysis of Chinese Word-Segmentation Accuracy
3
作者 MA Weiyin 《现代电子技术》 2007年第4期108-110,共3页
Automatic word-segmentation is widely used in the ambiguity cancellation when processing large-scale real text,but during the process of unknown word detection in Chinese word segmentation,many detected word candidate... Automatic word-segmentation is widely used in the ambiguity cancellation when processing large-scale real text,but during the process of unknown word detection in Chinese word segmentation,many detected word candidates are invalid.These false unknown word candidates deteriorate the overall segmentation accuracy,as it will affect the segmentation accuracy of known words.In this paper,we propose several methods for reducing the difficulties and improving the accuracy of the word-segmentation of written Chinese,such as full segmentation of a sentence,processing the duplicative word,idioms and statistical identification for unknown words.A simulation shows the feasibility of our proposed methods in improving the accuracy of word-segmentation of Chinese. 展开更多
关键词 中文信息处理 汉字处理 自动分割 效率分析
在线阅读 下载PDF
全自动人参移栽机设计与试验
4
作者 左胜甲 丁旭旭 +2 位作者 孔德刚 刘倾城 左胜悦 《农机化研究》 北大核心 2025年第6期127-132,共6页
人参是具有重要药用价值的特种经济作物和中药材之一,一般播种2~3年需要移栽,而目前人参移栽作业多为人工方式,劳动强度大、作业效率低且存在标准不统一等问题。为此,对一键式人参移栽机进行了设计和试验。机具主要由动力机构、行走机... 人参是具有重要药用价值的特种经济作物和中药材之一,一般播种2~3年需要移栽,而目前人参移栽作业多为人工方式,劳动强度大、作业效率低且存在标准不统一等问题。为此,对一键式人参移栽机进行了设计和试验。机具主要由动力机构、行走机构、间歇机构、挖掘覆土机构等组成,可实现一键启动后在不停车的情况下自动完成挖槽(摆参槽)、覆土、行走等关键作业环节。对整机的基本结构参数和工作参数进行了设计计算,对关键部件进行了结构设计,利用机械三维设计仿真软件SolidWorks对其进行虚拟样机构建,并进行了田间试验。结果表明:移栽机挖槽深度约为18 cm,槽面与眭基约呈45°角,槽距约为25 cm,符合人参移栽农艺标准;作业速度约为90 m/h,具有作业速度高、标准化程度高且作业面平整等特点。研究结果对人参和其它中药材种植的机械化作业具有较好的参考与应用价值。 展开更多
关键词 人参 移栽机 全自动 中药材
在线阅读 下载PDF
RPH4、中药超声雾化熏洗联合超声刀治疗混合痔的疗效
5
作者 沈雷斌 杨沔 +2 位作者 金梁斌 徐园 费正磊 《浙江临床医学》 2025年第1期93-95,共3页
目的 探讨自动弹力线痔疮套扎术(RPH4)、中药超声雾化熏蒸联合超声刀手术治疗混合痔的疗效。方法 选择2022年8月至2024年7月混合痔患者240例。根据手术治疗方法不同分为对照组(RPH4+中药超声雾化熏洗+电刀外剥内扎术)和观察组(RPH4+中... 目的 探讨自动弹力线痔疮套扎术(RPH4)、中药超声雾化熏蒸联合超声刀手术治疗混合痔的疗效。方法 选择2022年8月至2024年7月混合痔患者240例。根据手术治疗方法不同分为对照组(RPH4+中药超声雾化熏洗+电刀外剥内扎术)和观察组(RPH4+中药超声雾化熏洗+超声刀手术)。比较两组围术期指标、术后疼痛程度、肛缘水肿、创面渗液及创面出血评分、疗效和术后并发症发生率。结果与对照组比,观察组疗效更佳,手术时间及创面修复时间更短,术中出血量更少,术后疼痛程度低,肛缘水肿评分、创面渗液评分、创面出血评分及术后并发症发生率更低(P<0.05)。结论 应用RPH4联合超声刀手术及术后中药超声雾化熏洗治疗混合痔,可获得更好的治疗效果,术后恢复更快,且并发症较少,值得推广。 展开更多
关键词 自动弹力线痔疮套扎术 超声刀手术 混合痔 中药超声雾化熏洗
在线阅读 下载PDF
基于二阶段对比学习的中文自动文本摘要方法研究 被引量:1
6
作者 杨子健 郭卫斌 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第4期586-593,共8页
在中文自动文本摘要中,暴露偏差是一个常见的现象。由于中文文本自动摘要在序列到序列模型训练时解码器每一个词输入都来自真实样本,但是在测试时当前输入用的却是上一个词的输出,导致预测词在训练和测试时是从不同的分布中推断出来的,... 在中文自动文本摘要中,暴露偏差是一个常见的现象。由于中文文本自动摘要在序列到序列模型训练时解码器每一个词输入都来自真实样本,但是在测试时当前输入用的却是上一个词的输出,导致预测词在训练和测试时是从不同的分布中推断出来的,而这种不一致将导致训练模型和测试模型直接的差异。本文提出了一个两阶段对比学习框架以实现面向中文文本的生成式摘要训练,同时从摘要模型的训练以及摘要评价的建模进行对比学习。在大规模中文短文本摘要数据集(LCSTS)以及自然语言处理与中文计算会议的文本数据集(NLPCC)上的实验结果表明,相比于基线模型,本文方法可以获得更高的面向召回率的摘要评价方法(ROUGE)指标,并能更好地解决暴露偏差问题。 展开更多
关键词 中文自动文本摘要 对比学习 暴露偏差 预处理模型 ROUGE指标
在线阅读 下载PDF
中药自动抓配系统的设计
7
作者 张存毅 黎莲花 +2 位作者 唐凯康 吕龙楚 曾瑞涛 《现代信息科技》 2024年第14期172-176,共5页
随着中医药的发展,中药文化在传统医学体系中扮演着重要的角色,为了解决医药医生抓配中药困难的问题,设计了一款基于STM32的中药抓配系统。设备上位机接收医生开出的药单,通过串口通信下发指令给抓配设备的主控,抓药设备根据接收的指令... 随着中医药的发展,中药文化在传统医学体系中扮演着重要的角色,为了解决医药医生抓配中药困难的问题,设计了一款基于STM32的中药抓配系统。设备上位机接收医生开出的药单,通过串口通信下发指令给抓配设备的主控,抓药设备根据接收的指令,控制药柜前的横向与纵向步进电机、称重传感器等设备,实现对中药材的自动抓配。医生通过上位机对中药抓配过程进行远程监控。该系统通过数字化、智能化的手段,提高了中药抓配的精准性和效率,也促进了中医药的传统文化与现代科技的融合。 展开更多
关键词 自动出药 动态称量 自动抓药系统 STM32 中药
在线阅读 下载PDF
用于中药中农药残留检测的全自动快速样品处理仪验证与评价
8
作者 陈树东 梁金钊 +1 位作者 蒋超 胡文军 《化学分析计量》 CAS 2024年第10期99-104,共6页
采用中药农药残留的样品处理方法作为验证方式,建立了全自动快速样品处理(QuEChERS)设备的验证与评价方法。验证的设备按照标准方法的步骤执行样品处理过程,对影响最终实验结果的基本性能和应用效果进行验证。验证的农药化合物在0.005~0... 采用中药农药残留的样品处理方法作为验证方式,建立了全自动快速样品处理(QuEChERS)设备的验证与评价方法。验证的设备按照标准方法的步骤执行样品处理过程,对影响最终实验结果的基本性能和应用效果进行验证。验证的农药化合物在0.005~0.25μg/mL质量浓度范围内与其相应的色谱峰面积具有较好的线性关系,相关系数均大于0.99,检出限均为0.002 mg/kg。中药样品在不同浓度的加标水平下的加标平均回收率为71.6%~128.8%,相对标准偏差为0.1%~8.1%。全自动快速样品处理设备实验操作的一致性程度较高,设备在分液、移液和加盐等步骤的操作可以满足实验的要求。采用自动化样品处理方式应用于中药农药残留检测,能有效减少人为误差,提高检测的准确性、重现性和溯源性,为分析仪器的自动化和智能化技术验证提供了技术支持。 展开更多
关键词 设备验证 设备评价 农药残留 中药 全自动QuEChERS实验仪
在线阅读 下载PDF
高速铁路列控系统地面设备技术发展及展望 被引量:2
9
作者 贺昌寿 《铁道通信信号》 2024年第12期1-11,共11页
自第六次大提速以来,中国列车运行控制系统经历了从引进吸收到自主创新的发展历程,构建了符合我国国情、路情的中国列车运行控制系统技术体系和完整的技术标准体系。20年来,中国列车运行控制系统持续提升系统安全性、可靠性、可维护性,... 自第六次大提速以来,中国列车运行控制系统经历了从引进吸收到自主创新的发展历程,构建了符合我国国情、路情的中国列车运行控制系统技术体系和完整的技术标准体系。20年来,中国列车运行控制系统持续提升系统安全性、可靠性、可维护性,实施了区间占用逻辑检查、轨道电路调谐区检查、股道设置防护区段、无线闭塞中心及列控中心增加独立安全检查软件等安全补强措施,以及维护终端统型化等运维手段提升措施;开展了应答器读写工具报文读写接口简统化、列控系统临时限速功能优化、反向追踪运行等新技术研究工作,并在高速铁路自动驾驶、基于卫星定位的新型列控系统研制、基于国产芯片的列控系统研制等技术领域均取得了重大突破,为进一步提升我国铁路装备现代化水平,构建发达、完善的现代化铁路网做出了重要贡献。 展开更多
关键词 中国列车运行控制系统 地面设备 标准体系 关键技术提升 自动驾驶 新型列控系统
在线阅读 下载PDF
自动烹饪机器人 被引量:9
10
作者 刘银华 闫维新 +4 位作者 周晓燕 唐建华 刘小勇 付庄 赵言正 《上海交通大学学报》 EI CAS CSCD 北大核心 2007年第1期119-122,共4页
根据中式菜肴的烹饪原理对烹饪步骤和动作进行了分类,综合各种动作的特点,将烹饪划分为4个模块:送料模块、中间出料和送回模块、烹饪模块以及火控模块,各模块由相应的动作机构实现.自动烹饪机器人包括送料机构、中间出料机构、锅具动作... 根据中式菜肴的烹饪原理对烹饪步骤和动作进行了分类,综合各种动作的特点,将烹饪划分为4个模块:送料模块、中间出料和送回模块、烹饪模块以及火控模块,各模块由相应的动作机构实现.自动烹饪机器人包括送料机构、中间出料机构、锅具动作机构、划散机构、火控系统和控制系统.实验验证表明,该自动烹饪机器人可以在预定的程序下完成大多数中式菜肴特别是炒菜类菜肴的烹饪,并将成为迈向烹饪自动化的关键一步. 展开更多
关键词 自动烹饪机器人 烹饪原理 中式菜肴
在线阅读 下载PDF
OA-1.4 版中文自动摘要系统 被引量:9
11
作者 王永成 许慧敏 《高技术通讯》 EI CAS CSCD 1998年第1期19-23,共5页
研究与开发了OA中文自动摘要系统1.4版,概括地介绍了该系统的特点、技术关键及实现。
关键词 OA-1.4版 中文自动摘要 文摘 文献 人民日报
在线阅读 下载PDF
汉语自动分词中中文地名识别 被引量:10
12
作者 高红 黄德根 杨元生 《大连理工大学学报》 EI CAS CSCD 北大核心 2006年第4期576-581,共6页
以词语级的中文地名为识别对象,根据地名内部用字的统计信息和地名构成特点产生潜在地名.在汉语自动分词中将可信度较高的潜在地名等同于句子的候选切分词,利用候选切分词本身的可信度和上下文接续关系评价句子的各种切分方案.在确定句... 以词语级的中文地名为识别对象,根据地名内部用字的统计信息和地名构成特点产生潜在地名.在汉语自动分词中将可信度较高的潜在地名等同于句子的候选切分词,利用候选切分词本身的可信度和上下文接续关系评价句子的各种切分方案.在确定句子最佳切分时识别句子中的中文地名.对真实语料进行封闭和开放测试,封闭测试结果为召回率93.55%,精确率94.14%,F-1值93.85%;开放测试结果为召回率91.27%,精确率73.48%,F-1值81.42%.取得了比较令人满意的结果. 展开更多
关键词 中文地名识别 汉语自动分词 未登录词识别
在线阅读 下载PDF
最大概率分词问题及其解法 被引量:16
13
作者 刘挺 吴岩 王开铸 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 1998年第6期37-41,共5页
提出了一种新的汉语自动分词算法,该算法运用人工智能中的问题求解技术,先将汉语句子的切分问题归约为若干字段的切分问题,再用启发式状态空间搜索技术将每个字段分别转换为概率最大的词序列.
关键词 自然语言理解 自动分词 汉语分词 最大概率分词
在线阅读 下载PDF
自动化静态顶空/气相色谱-质谱对胶州大白菜中风味物质的快速分析 被引量:5
14
作者 吴澎 周涛 +1 位作者 寇丽娟 王超 《食品科学》 EI CAS CSCD 北大核心 2009年第12期215-218,共4页
采用静态顶空和气质联用的方来来分析对比"胶白"与泰安当地产普通大白菜的挥发性成分,通过GC-MS分析和NIST质谱谱库计算机检索,对样品进行定性分析,并采用面积归一化法进行定量分析。结果表明:十八烯酸(Z)-甲酯和十六烷酸-甲... 采用静态顶空和气质联用的方来来分析对比"胶白"与泰安当地产普通大白菜的挥发性成分,通过GC-MS分析和NIST质谱谱库计算机检索,对样品进行定性分析,并采用面积归一化法进行定量分析。结果表明:十八烯酸(Z)-甲酯和十六烷酸-甲酯是对胶白风味起决定作用的物质,静态顶空-气相色谱-质谱分析是一种快速有效分析蔬菜中风味物质成分的方法。 展开更多
关键词 静态顶空-气相色谱-质谱分析 风味物质 胶州大白菜 泰安大白菜
在线阅读 下载PDF
基于PageRank算法的汉语同义词自动识别 被引量:10
15
作者 陆勇 侯汉清 《西华大学学报(自然科学版)》 CAS 2008年第2期13-15,94,共4页
同义词的自动发现和识别在信息检索领域有着重要的研究意义和应用价值。为了提高同义词自动识别的效率,本文提出了基于PageRank算法的汉语同义词自动识别方法。该方法把词汇之间解释与被解释的关系看成是一种超链接,把PageRank值看成是... 同义词的自动发现和识别在信息检索领域有着重要的研究意义和应用价值。为了提高同义词自动识别的效率,本文提出了基于PageRank算法的汉语同义词自动识别方法。该方法把词汇之间解释与被解释的关系看成是一种超链接,把PageRank值看成是体现词汇之间语义相似性的衡量指标,然后根据语义相似度的大小识别同义词。通过算法提取测试,结果表明:利用基于PageRank算法来自动发现和识别同义词具有可行性和实用性。 展开更多
关键词 汉语同义词 自动识别 PAGERANK算法
在线阅读 下载PDF
基于特征聚类的舌下络脉自动提取方法 被引量:12
16
作者 孙丹萍 吴佳 +3 位作者 张永红 白净 翁维良 吴煜 《中国生物医学工程学报》 CAS CSCD 北大核心 2008年第2期265-269,共5页
舌下络脉诊是中医舌诊中十分重要的一种手段,本研究提出了一种基于特征聚类分析的舌下络脉自动提取方法,该算法在L*a*b*色彩空间下,利用K-均值聚类算法对舌下区域按颜色进行聚类,根据聚类中心的位置,确定舌下络脉所在的聚类,并计算出舌... 舌下络脉诊是中医舌诊中十分重要的一种手段,本研究提出了一种基于特征聚类分析的舌下络脉自动提取方法,该算法在L*a*b*色彩空间下,利用K-均值聚类算法对舌下区域按颜色进行聚类,根据聚类中心的位置,确定舌下络脉所在的聚类,并计算出舌下络脉的特征参数,对每一例舌下数据给出6个参数,表征络脉的长度,宽度以及颜色。应用此算法对北京东直门医院886例肝病病人的舌下图像数据进行分析,经中医医生判断,成功提取舌下络脉839例,成功率达96.88%。 展开更多
关键词 中医舌诊 舌下络脉 自动提取 K-均值聚类算法 L*a*b*色彩空间
在线阅读 下载PDF
上下文相关汉语自动分词及词法预处理算法 被引量:10
17
作者 黄河燕 李渝生 《应用科学学报》 CAS CSCD 1999年第2期148-155,共8页
提出了一种适合于汉英机器翻译的上下文相关汉语自动分词及词法预处理算法.该算法采用正向多路径匹配算法和基于上下文相关知识的歧义切分消解算法,充分利用汉英机译系统词典库中的大量语法和语义等知识进行上下文相关的规则推导消歧... 提出了一种适合于汉英机器翻译的上下文相关汉语自动分词及词法预处理算法.该算法采用正向多路径匹配算法和基于上下文相关知识的歧义切分消解算法,充分利用汉英机译系统词典库中的大量语法和语义等知识进行上下文相关的规则推导消歧,使自动分词的准确率达到了99%以上.同时,该算法还对汉语中意义冗余的重叠词和可以与中心词离合的虚词等进行了词法预处理,从而一方面可以减少系统词典的收词量。 展开更多
关键词 汉语自动分词 词法预处理 机器翻译 上下文相关
在线阅读 下载PDF
中文信息自动抽取 被引量:24
18
作者 朱靖波 姚天顺 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 1998年第1期52-54,共3页
论述了信息抽取与信息检索的区别,信息抽取与深入的自然语言处理的区别,中文信息自动抽取的目的、任务和基本模型;然后介绍了一些国外的IE系统;讨论了关于中文信息自动抽取的一些问题和正在开展的中文信息抽取研究工作.
关键词 中文信息 信息检索 信息处理 信息抽取
在线阅读 下载PDF
中文自动文摘系统CAAS的研究与实现 被引量:2
19
作者 刘挺 吴岩 王开铸 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 1999年第6期59-62,共4页
介绍了一种中文自动文摘系统;该系统在高精度的汉语自动分词、关键词自动抽取等算法的基础上,引入了文本结构的统计分析和句间指代关系的识别等技术,使得生成的摘要更加准确、全面、连贯. 该系统适用于科技文献、政论文、公文等实... 介绍了一种中文自动文摘系统;该系统在高精度的汉语自动分词、关键词自动抽取等算法的基础上,引入了文本结构的统计分析和句间指代关系的识别等技术,使得生成的摘要更加准确、全面、连贯. 该系统适用于科技文献、政论文、公文等实用文体的摘要生成. 展开更多
关键词 中文信息处理 应用软件 自动文摘 CAAS 自动分词
在线阅读 下载PDF
汉语自动分词研究综述 被引量:16
20
作者 骆正清 陈增武 +1 位作者 王泽兵 胡上序 《浙江大学学报(自然科学版)》 EI CSCD 1997年第3期306-312,共7页
本文对汉语自动分词的方法进行了概述,并在考察分词精度和分词知识的基础上。
关键词 汉语自动分词 分词精度 中文信息处理 机械分词
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部