【AI私人家庭医生day01】—— 项目介绍

大家好～从今天开始，我将开启一个全新的系列教程，带大家从零搭建一个「AI私人家庭医生」项目，全程干货无废话，新手也能跟着一步步上手，最终做出一个可直接用于家庭日常健康管理的实用AI工具，同时也会把每一步的技术细节、踩坑经验同步分享给大家，话不多说，正式开启我们的day01------项目整体介绍！

先跟大家明确一下，这个项目不是单纯的理论demo，而是一个可落地、可扩展的完整项目，核心目标是利用大模型技术，解决家庭日常健康管理的痛点，同时也能让大家在实战中掌握大模型微调、RAG、前后端开发等热门技术，一举两得～

一、项目核心：AI私人家庭医生

我们做这个项目的初衷很简单：现在很多疾病都受遗传、家庭饮食、生活习惯的影响极大，比如高血压、糖尿病、胃肠道疾病等，往往呈现"家庭聚集性"。而普通家庭想要实现专业的健康管理，要么需要花费高额费用请私人医生，要么只能在身体不适时临时去医院咨询，无法实现长期跟踪、提前预防。

基于这个痛点，我们的「AI私人家庭医生」项目应运而生，核心功能就是：为每个家庭成员打造专属的健康数据管理体系和私人陪伴式医疗服务，永久记忆所有家庭成员的历史诊疗记录、医学检查报告、用药情况、饮食生活习惯等，实现以下核心服务：

医学报告专业解读：上传体检报告、化验结果，AI快速解读关键指标，标注异常项，用通俗语言讲解，不用再对着专业术语一头雾水；
健康状况跟踪：长期记录家庭成员的健康数据（如血压、血糖、体重等），跟踪变化趋势，及时提醒异常波动；
疾病风险评估：结合遗传因素、生活习惯、历史健康数据，评估潜在疾病风险，给出针对性预防建议；
随访提醒与建议：针对慢性疾病、术后恢复等场景，设置个性化随访提醒，给出饮食、运动、用药等具体指导；
日常健康答疑：家庭日常遇到的健康小问题（如感冒护理、儿童辅食、老人用药注意事项等），AI实时答疑，不用再反复查百度、问医生。

简单来说，就是把"私人医生"搬进家里，24小时待命，既专业又便捷，还能实现长期的家庭健康管理，尤其适合有老人、小孩的家庭。

二、项目技术栈（全程实战，不玩虚的）

这个项目的技术栈涵盖了当前大模型应用开发的核心技术，从大模型微调、知识检索到前后端部署，全程实战，大家跟着做，既能完成项目，也能掌握一套完整的大模型应用开发流程。具体技术栈如下，每一项都会在后续教程中详细讲解，新手不用慌：

核心技术栈：HuggingFace、Swift、RAG、LangChain、FastAPI、React、Vite

1. Swift大模型微调（核心模块）

我们的AI医生核心能力，来自于对开源大模型的医疗方向微调，让模型具备专业的医疗知识和对话能力，具体细节如下：

微调模型：选用 Qwen/Qwen-1_8B-Chat（通义千问1.8B对话模型），这个模型的优势很明显------低成本部署（int4量化版本推理仅需不到2GB显存，微调最低仅需6GB显存）、支持8192上下文长度（能完整记忆长文本的体检报告、诊疗记录），且在中文任务上表现优秀，非常适合家庭场景的轻量化部署。
微调数据集（3个核心数据集，已整理就绪）：
- 复旦大学数据智能与社会计算实验室（Fudan-DISC）：DISC-Med-SFT_released.jsonl，包含大量专业的医疗对话、问诊数据，用于提升模型的医疗专业度；
- 阿里云天池实验室：train_data.json（来源于中文医疗对话数据集MedDialog），该数据集包含110万条医患对话，时间跨度从2010-2020年，覆盖各类常见疾病的问诊场景，能让模型快速掌握医患对话逻辑；
- 自定义自我认知微调数据集：med_self_cog.jsonl，主要用于定义模型的"角色认知"，让模型明确自己是"AI私人家庭医生"，而非通用对话模型，同时规范回答风格（专业、温和、易懂，避免夸大病情、给出绝对化诊疗建议）。

2. 其他核心技术模块（后续逐步拆解）

LangChain：用于搭建对话流程、管理上下文记忆，实现"永久记忆"家庭成员的健康数据，让AI能记住之前的问诊记录、体检情况，避免重复提问；
RAG（检索增强生成）：整合医疗知识库，当模型遇到不确定的专业问题时，通过检索知识库给出准确回答，提升回答的专业性和准确性，避免误导；
FastAPI：搭建后端接口，实现前后端数据交互、模型调用、健康数据存储与查询等核心功能，接口简洁高效，便于后续部署；
前端：采用微信开发者工具 + React + Vite，打造简洁易用的前端界面，支持家庭成员管理、健康数据上传、报告解读、对话咨询等功能，适配手机端，方便家庭日常使用；
待补充：后续会根据项目进度，补充数据存储（如MySQL）、部署上线（如Docker）等相关技术，确保项目能真正落地使用。

三、项目结构（提前熟悉，后续不迷路）

为了让大家提前了解项目的整体架构，避免后续开发混乱，这里先给大家展示完整的项目目录结构（基于Linux/macOS环境，Windows环境可稍作调整，注：当前前端、后端尚未开发，目录仅为预设，相关笔记会随项目进度持续更新），每一个目录的作用，后续教程会逐一讲解：

bash 复制代码

.
├── fortend
│   ├── ATTRIBUTIONS.md
│   ├── guidelines
│   │   └── Guidelines.md
│   ├── index.html
│   ├── package.json
│   ├── postcss.config.mjs
│   ├── README.md
│   ├── src
│   │   ├── app
│   │   ├── main.tsx
│   │   └── styles
│   └── vite.config.ts
├── llm
│   ├── medical_lora_output
│   │   └── final_medical_model
│   ├── model-test.py
│   ├── ms-swift
│   │   ├── asset
│   │   ├── CODE_OF_CONDUCT.md
│   │   ├── CONTRIBUTING.md
│   │   ├── CONTRIBUTING_CN.md
│   │   ├── docs
│   │   ├── examples
│   │   ├── LICENSE
│   │   ├── Makefile
│   │   ├── MANIFEST.in
│   │   ├── ms_swift.egg-info
│   │   ├── README.md
│   │   ├── README_CN.md
│   │   ├── requirements
│   │   ├── requirements.txt
│   │   ├── scripts
│   │   ├── setup.cfg
│   │   ├── setup.py
│   │   ├── swift
│   │   └── tests
│   ├── output
│   │   ├── v0-20260414-211212
│   │   ├── v1-20260414-211621
│   │   ├── v2-20260414-211803
│   │   ├── v3-20260414-213218
│   │   └── v4-20260414-213322
│   ├── Qwen
│   │   └── Qwen-1_8B-Chat
│   ├── train_data
│   │   ├── custom_dataset.json
│   │   ├── data_prossing.py
│   │   ├── DISC-Med-SFT
│   │   ├── MedDialog_processed
│   │   └── Model-Self-cog
│   └── work.ipynb
├── llm_env.yml
└── notes
    └── day01.md

简单说明几个核心目录：

fortend：前端项目目录，预设用于存放React+Vite开发的前端代码（当前未开发），后续将逐步实现家庭成员管理、健康数据上传等界面；
llm：大模型相关目录，包含模型文件（Qwen-1_8B-Chat）、微调代码（ms-swift）、训练数据（train_data）、微调输出模型（medical_lora_output）等，是整个项目的核心；
llm_env.yml：conda环境配置文件，后续会教大家如何根据这个文件配置开发环境，避免环境冲突；
notes：教程笔记目录，存放每天的开发笔记、踩坑记录，将随项目开发进度持续更新，与教程同步；

四、后续教程规划（清晰明确，跟着走就对了）

最后跟大家说一下后续的教程安排，避免大家迷路，全程循序渐进，从环境搭建到最终部署，每一步都有详细讲解：

day01：项目介绍（本文），明确项目目标、技术栈、项目结构；
day02：开发环境搭建，配置conda环境、安装所需依赖（HuggingFace、Swift等）；
day03：数据集准备与预处理，讲解3个核心数据集的下载、清洗、格式转换；
day04：Swift大模型微调实战，手把手教大家用Swift微调Qwen-1_8B-Chat模型；
day05：LangChain+RAG整合，实现健康知识检索、上下文记忆功能；
day06：FastAPI后端开发，搭建接口，实现前后端数据交互；
day07：前端开发（React+Vite），实现核心界面与交互；
后续：数据存储、项目部署（Docker）、功能优化、踩坑总结。

注意：本项目所有代码、数据集链接、环境配置文件，后续都会逐步分享，大家不用提前准备，跟着教程一步步来即可。另外，项目中遇到的所有问题（比如环境配置失败、微调报错、接口调用异常等），我都会在后续教程中给出解决方案，新手也能轻松上手。

好了，day01的项目介绍就到这里～下一篇我们正式开始搭建开发环境，手把手教大家配置所有依赖，为后续的模型微调、前后端开发做好准备。

如果大家有任何疑问，欢迎在评论区留言，我会及时回复～关注我，后续持续更新「AI私人家庭医生」系列教程，一起从0到1做出实用的AI项目！