生成式大模型作为当前发展势头最为强劲的人工智能前沿技术,其在临床心理学领域中的创新应用已成为社会关注和医学聚焦的热点之一。
心理大模型在落地应用过程中可能面临的痛点主要包括以下几个方面:
- 数据隐私与安全:确保敏感的个人信息在模型训练和应用中的保护,遵循严格的隐私法规。
- 数据质量与多样性:缺乏足够高质量、多样化且标注准确的心理健康数据,影响模型准确性。
- 技术和算力挑战:大模型对计算资源的需求高,成本昂贵,边缘部署时的芯片性能与功耗平衡尤为重要。
- 应用实践的融合:将模型无缝整合进临床流程,满足实际工作场景的特定需求。
- 专业培训与协作:跨学科团队建设,实现心理医疗专业人员与IT专业人员的合作。
景联文科技是一家专业的大模型数据服务商,推出心理大模型数据库,致力于为不同训练阶段的算法精准匹配高质量数据资源。
数据集包含:
- 心理学知识体系
- 心理学题库
- 心理学prompt
- 情绪,疾病分类
- 心理咨询数据
心理学知识体系
景联文科技对共计2500本相关心理学文献、期刊等进行领域分类。
分为:基础心理学、人格与社会心理学、心理统计与策略、发展心理学、心理咨询与治疗、认知心理学、社会心理学、变态心理学、心理学研究方法、教育心理学、临床与咨询、心理学史等。
并从五个维度进行打分。
由多位著名的心理学专家从心里学知识的专业性、科学性、深度广度、创新性和实用性等多维度将书籍、心理学文献和期刊等进行专业打分排列。
心理学题库
景联文科技构建心理学最新全量考题数据,拥有国内最大、正确率最高的适用于GPT训练的数据库。
数据版本有:数据库、word、json格式。
数据准确率高达99%,所有数据均经过严格流程清洗。
清洗流程:挑题、录入、排查、筛重、解答、复核、校稿
题库类型包括:心理各学科阶段重点试题、各学校考研真题、各院校考博真题。
内容包括:答案、解析、考点。
心理学prompt
人类的心理情绪分为六大类、500多种不同情绪颗粒度,景联文科技按照情绪颗粒度、情绪名词解释进行整理。
情绪、疾病分类
将心理疾病的分类、心理疾病的名词解释、心理疾病的患病程度以及心理疾病的触发原因进行标注。
景联文科技具备丰富的心理测量量表(非临床)及临床诊断量表的标准化常模,可用于评估(非临床)和诊断(临床)用户心理状态。
量表应用流程:
对同一个ID的非临床量表结果进行解析,分析每个量表得分的意义以及在人群中的位置。
对临床诊断量表进行判断,判断其是否达到临床诊断cut off值,并根据对临床诊断量表辅助以专家诊断。
心理学prompt对话
根据真实咨询场景,将心理问题划分为不同维度/水平。可达3000以上颗粒度,构建300万高质量对话数据。
场景主要分为以下十大类:
恋爱问题、家庭关系问题、校园生活、职业生涯问题、一般人际关系问题、成长/发展/自我相关议题、情绪问题(临床诊断)、生活重大事件、健康/饮食/睡眠等躯体相关问题、其他
样例
手工精细构建专业的心理学对话数据(5-15轮)
心理咨询数据
100万小时的语音和视频
拥有100万小时真实咨询过程的语音、视频、咨询记录、督导记录、逐字稿(专业心理咨询师超10年的真实咨询实录,覆盖全年龄段、不同心理困扰的来访者数据)。
通过综合这些数据,大模型可以在多个维度上获得进步:
情感识别与理解
通过语音和视频数据,模型可以更好地识别和理解人类的情感和心理状态
非言语交流的解读
视频数据使模型能够学习到非言语交流的重要性和含义
专业伦理与自我反思
督导记录还能帮助模型理解心理咨询的伦理原则和自我反思的重要性
语言处理能力
逐字稿提供了大量的语言数据,有助于提升模型的自然语言处理能力,包括理解、生成和沟通
还拥有多模态数据:包括问卷、行为测量、神经生理指标等。
在数据安全与合规方面,景联文科技已通过ISO9001质量、ISO27001信息安全、ISO27701国际隐私安全管理认证,积极参与8项国家数据交换格式和数据安全标准制定,牢固构筑数据保护的基石。
获取样例请登录景联文科技官网咨询客服。https://www.jinglianwen.com/ai/
或直接发送需求至邮箱:lx@jinglianwen.com
景联文科技|数据采集|数据标注| 心理大模型数据库
助力人工智能技术,赋能传统产业智能化转型升级
文章图文著作权归景联文科技所有,商业转载请联系景联文科技获得授权,非商业转载请注明出处。