-
题名基于大语言模型的自杀意念文本数据增强与识别技术
被引量:2
- 1
-
-
作者
章彦博
黄峰
莫柳铃
刘晓倩
朱廷劭
-
机构
中国科学院心理研究所行为科学重点实验室
中国科学院大学心理学系
香港城市大学计算学院数据科学系
南开大学社会学院社会心理学系
-
出处
《心理学报》
北大核心
2025年第6期987-1000,I0011,共15页
-
基金
国家自然科学基金面上项目(62272206)
北京市自然科学基金(IS23088)资助。
-
文摘
自杀已成为全球性公共卫生难题,传统的自杀意念识别方法主要依赖患者主动求助,而基于文本分析的自动识别模型则受限于标注数据的稀缺性。本研究创新性地提出一种基于大语言模型的数据增强方法,旨在提升自杀意念文本识别的精度。研究采用双阶段设计:研究1聚焦于数据增强,研究2验证增强效果。在研究1中,选用ChatGLM3-6B和Qwen-7B-Chat作为底层模型,结合有监督学习策略与零样本和少样本学习方法,优化训练数据集质量。通过8组严谨的对比实验,结果显示两类自研模型在数据增强方面表现卓越,其处理后数据集的综合得分分别达到0.90和0.92,显著优于基线模型(p<0.001)。研究2进一步评估了数据增强对识别模型性能的影响,结果表明,增强后的模型在识别准确率和正确拒绝率指标上全面超越最佳基线模型(p<0.001)。本研究不仅验证了基于大语言模型的数据增强方法在提升自杀意念识别模型性能方面的有效性,还为心理健康领域的人工智能应用开辟了新方向。这种方法有望在保护用户隐私的同时,提供及时、有效的自杀风险早期预警,为自杀预防工作提供重要的技术支持和研究思路。未来研究可着眼于扩大数据异质性、优化提示工程设计、引入人机交互范式等,进一步拓展该方法在促进临床心理诊断领域的应用。
-
关键词
自杀意念
数据增强
自杀文本识别
大语言模型
人工智能
-
Keywords
suicidal ideation
data augmentation
suicide text recognition
large language models
artificial intelligence
-
分类号
B841
[哲学宗教—基础心理学]
-