致力于解决用户入睡问题的ai小项目(1)

一、第一阶段内容要求

  1. 从 PhysioNet Sleep-EDFx 公开数据集实时读取EEG/EOG/EMG,这一步我们还需要提前下载好指定的数据库,在官方网站这一条的指引也足够清楚,只需要跟随他们的指引就可以磨刀霍霍了,只不过八个g的数据确实要花很大时间
  2. 如果没有下好数据库就去操作,大概率会一直报错,并且pycharm的尿性会一直说是没有检测符合编号的样本,能检测到就怪了
  3. 用自监督模型 TS2Vec 做"无监督"预训练
  4. 在线推断 30-秒窗口的睡眠阶段
  5. 实时刷新睡眠指标(总睡眠时间、REM 占比等)
  6. 其实本来想要再在更为早期的部分加入ai自己在新的专业论文或者更新的互联网上能免费调用的数据库里自己寻找数据给自己更新参数的功能,但是这样其实增加运行和维护成本,本质上也需要活人负责审查数据或者论文的可靠性真实性,或者说这一套的代码也需要自己能做反向,更新别人的同时更新自己,综合考虑还是决定从这一期的内容开始考虑

二、框架考虑

1.本次代码部分我打算使用以下七个库

作用
mne 从 PhysioNet 下载、读取 .edf 睡眠记录,并把原始 EEG/EOG/EMG 信号切成 30 秒窗口给模型用。
numpy 做所有底层数值计算:矩阵乘法、滑动缓存、距离度量等
torch 提供张量、自动求导和 GPU 加速,让自监督模型 TS2Vec 能跑起来
ts2vec 现成的自监督时序编码器;我们用它「无标签」地把 30 秒信号转成 128 维特征向量
sklearn.preprocessing.StandardScaler 对每 30 秒窗口做标准化(零均值单位方差),避免不同通道幅值差异影响模型
collections.deque 充当「实时缓冲区」,不断丢掉旧采样点、追加新采样点,实现 30 秒滑动窗口
time / datetime 控制实时流速(sleep 1/FS 秒)和打印当前时间戳,让终端看起来像实时监测
复制代码
整体来讲这一阶段我们粗略地解决了获取初始数据并以此为基础训练出能够实时监测用户睡眠状态下各个数据的代码

三、魔性思考

相关推荐
QYR_1137 分钟前
2025-2031年全球 MT 插芯市场全景分析报告:技术演进、供需格局与投资前景
人工智能·自然语言处理·机器翻译
mwq3012337 分钟前
从GPT-1到GPT-2的性能飞跃及其驱动因素分析
人工智能
mwq301231 小时前
GPT-2技术范式解析:无监督多任务学习的概率视角
人工智能
荼蘼1 小时前
使用 Flask 实现本机 PyTorch 模型部署:从服务端搭建到客户端调用
人工智能·pytorch·python
后端小肥肠1 小时前
【n8n 入门系列】10 分钟部署 n8n,手把手教你搭第一个自动化工作流,小白可学!
人工智能·aigc
mwq301231 小时前
从 Word2Vec 到 GPT:词向量的上下文进化史
人工智能
爱读源码的大都督1 小时前
RAG效果不理想?试试用魔法打败魔法:让大模型深度参与优化的三阶段实战
java·人工智能·后端
极客BIM工作室2 小时前
机器学习之规则学习(Rule Learning)
人工智能·机器学习
mwq301232 小时前
GPT vs BERT:一个是预言家,一个是侦探|深入理解语言模型的两大范式
人工智能
mwq301232 小时前
AI模型的“返璞归真”:为何设计越来越简单,性能却持续爆发?
人工智能