它可以提供关于自我成长、情感、爱情、人际关系等方面的心理健康对话,为用户提供非专业的支持和指导。
中文心理健康对话大模型是基于InternLM2-7B-Chat微调后中文心理健康对话模型,可针对例如自我成长、情感、爱情问题、人际关系、行为、家庭、治疗、婚姻和职业等方面提供心理健康对话。 模型可以提供共情和非判断性的回应,为用户提供情感支持。
模型的数据来源主要有2个,共167229轮对话
数据来源 | 描述 | 用途 |
---|---|---|
SMILE | 数据集通过 ChatGPT 改写真实的心理互助 QA 为多轮的心理健康支持多轮对话,该数据集SmileChat含有 55,165k 个多轮对话,其对话主题、词汇和篇章语义更加丰富多样,更加符合在长程多轮对话的应用场景。 | 提供多轮对话的训练素材 |
PsyQA | 壹心理论坛数据构建了一份高质量的中文心理咨询数据集,提供了丰富的援助策略标注。可用于生成富有援助策略的长咨询文本。 | 提供长对话的训练素材 |
形式 | 输入 | 输出 |
---|---|---|
多轮对话 |
|
|
长文本 |
|
|
模型采用4张80G显存的A100进行LoRA训练,总计优化了5个epoch。使用OpenXlab的开源训练工具Xtuner
NPROC_PER_NODE=4 xtuner train internlm2_chat_7b_qlora_mentalhealth_e3.py
@inproceedings{sun-etal-2021-psyqa,
title = "PsyQA: A Chinese Dataset for Generating Long Counseling Text for Mental Health Support",
author = "Sun, Hao and
Lin, Zhenru and
Zheng, Chujie and
Liu, Siyang and
Huang, Minlie",
booktitle = "Findings of the Association for Computational Linguistics: ACL 2021",
year = "2021",
}
@misc{qiu2023smile,
title={SMILE: Single-turn to Multi-turn Inclusive Language Expansion via ChatGPT for Mental Health Support},
author={Huachuan Qiu and Hongliang He and Shuai Zhang and Anqi Li and Zhenzhong Lan},
year={2023},
eprint={2305.00450},
archivePrefix={arXiv},
primaryClass={cs.CL}
}