时序数据分析:短时序分类问题

在短序列时序分类中,一个特殊情况就是每个批次的时序长度可能不同(例如化工过程不同生产周期长度略微不同)​。通常预处理策略包括(如图1所示)​:

1)在原始数据强行截取,通常采用掐头去尾的启发式策略。

2)通过特征提取,将其转化为等长的特征向量。

3)在聚类中,采用允许不同长度的时序相似度评价方法(例如DTW)进行聚类,后面利用聚类信息进行分析。
图1 单个时序变量聚类后形成分类特征量

短时序分析的另外一个问题就是降维,有变量间、记录间降维两种方式。

1)变量间可以做PCA(主成分分析)​(如图2所示)

图2 变量间的PCA形成分类特征向量

2)记录间可以做聚类(提取典型变化)​(如图3所示)
图3 记录间聚类形成分类特征量

短时序(例如示功图、一次机加工过程)分类问题,通常的思路是采用时序再表征、时序聚类或特征提取的方式,将原始的时序转化为特征向量,然后采用通用的分类算法进行建模,整体路线如图4所示。针对短时序,形状也可以被用来作为决策树算法的判据。例如,Shapelet能够表征某个类别的相位无关(Phase-Independent)的子序列,也就是说Shapelet出现在序列的什么位置不重要(重要的是有没有出现)​。在具体实现中,通常采用Shapelet Transformation生成特征向量,并将其作为经典的分类算法的输入。根据信息增益对给定的备选Shapelet进行排序。对于给定的k个Shapelet,将它们与每个样本的距离作为特征向量。
图4 时序特征提取过程

这样就可以用经典分析算法对特征向量进行后续处理,如图5所示。
图5 短序列聚类的过程示意图

相关推荐
小糖学代码几秒前
LLM系列:3.nlp基础入门:nlp与循环神经网络
人工智能·pytorch·python·rnn·深度学习·神经网络·自然语言处理
devpotato2 分钟前
人工智能(十五)- 从 CoT 到 ReAct,用 LangChain4j 手写一个能思考 + 行动的 Agent
人工智能·语言模型·langchain
xixixi777773 分钟前
《从心理诱导突破Claude到AI仿冒直播首张拘留单:AI安全、监管与商用的三重转折点》
大数据·网络·人工智能·安全·ai·大模型·风险
爱吃香芋派OvO3 分钟前
ComfyUI 视频创作实战手册:节点搭建 + 性能优化 + 批量生成
人工智能·算法·机器学习
立控信息LKONE5 分钟前
门禁机、控制器等库室安防设施、实现库室智能联动,一体报警
大数据·人工智能·安全
数智工坊5 分钟前
【深度学习RL】A3C:异步强化学习的革命——用CPU打败GPU的深度RL算法
论文阅读·人工智能·深度学习·算法·transformer
小真zzz7 分钟前
中立第三方:搜极星的突围之路
大数据·人工智能
Jackzaker8 分钟前
Prompt工程在代码中的实现
人工智能·python·prompt
数智工坊9 分钟前
【深度学习RL】DQN:深度强化学习的里程碑——让AI从像素中学会玩Atari游戏
论文阅读·人工智能·深度学习·游戏·transformer
源码之家10 分钟前
计算机毕业设计:Python基于知识图谱与深度学习的医疗智能问答系统 Django框架 Bert模型 深度学习 知识图谱 大模型(建议收藏)✅
python·深度学习·机器学习·数据分析·flask·知识图谱·课程设计