时序数据分析:短时序分类问题

在短序列时序分类中,一个特殊情况就是每个批次的时序长度可能不同(例如化工过程不同生产周期长度略微不同)​。通常预处理策略包括(如图1所示)​:

1)在原始数据强行截取,通常采用掐头去尾的启发式策略。

2)通过特征提取,将其转化为等长的特征向量。

3)在聚类中,采用允许不同长度的时序相似度评价方法(例如DTW)进行聚类,后面利用聚类信息进行分析。
图1 单个时序变量聚类后形成分类特征量

短时序分析的另外一个问题就是降维,有变量间、记录间降维两种方式。

1)变量间可以做PCA(主成分分析)​(如图2所示)

图2 变量间的PCA形成分类特征向量

2)记录间可以做聚类(提取典型变化)​(如图3所示)
图3 记录间聚类形成分类特征量

短时序(例如示功图、一次机加工过程)分类问题,通常的思路是采用时序再表征、时序聚类或特征提取的方式,将原始的时序转化为特征向量,然后采用通用的分类算法进行建模,整体路线如图4所示。针对短时序,形状也可以被用来作为决策树算法的判据。例如,Shapelet能够表征某个类别的相位无关(Phase-Independent)的子序列,也就是说Shapelet出现在序列的什么位置不重要(重要的是有没有出现)​。在具体实现中,通常采用Shapelet Transformation生成特征向量,并将其作为经典的分类算法的输入。根据信息增益对给定的备选Shapelet进行排序。对于给定的k个Shapelet,将它们与每个样本的距离作为特征向量。
图4 时序特征提取过程

这样就可以用经典分析算法对特征向量进行后续处理,如图5所示。
图5 短序列聚类的过程示意图

相关推荐
code 小楊9 小时前
英伟达免费开源大参数模型 Nemotron 3 Super 全解析
人工智能·开源
AC赳赳老秦9 小时前
DeepSeek优化多智能体指令:避免协同冲突,提升自动化流程稳定性
android·大数据·运维·人工智能·自然语言处理·自动化·deepseek
Shining05969 小时前
AI编译器系列(二)《AI 编译器中的前端优化》
人工智能·学习·其他·学习方法·infinitensor
北京耐用通信10 小时前
耐达讯自动化CC-Link IE转DeviceNet网关:破解三菱与欧姆龙PLC协同壁垒的工业实践
人工智能·科技·物联网·网络协议·自动化
zhangshuang-peta10 小时前
安全地将人工智能助手与企业系统和数据集成
人工智能·安全·chatgpt·ai agent·mcp·peta
AI专业测评10 小时前
2026年全景基准测试:7款主流AI写小说工具底层架构与工程化实践对比
人工智能·架构
sbjdhjd10 小时前
一些感想 | AI:一场没有陨石的末日
人工智能
人工智能AI技术10 小时前
AWE2026现场直击:脑机接口、意念控无人机,中国家电正进入“物理AI“时代
人工智能
愈努力俞幸运10 小时前
llm+agent,使用与 OpenAI 兼容的 API 格式
人工智能
IT_陈寒10 小时前
Vue组件复用率提升300%?这5个高阶技巧让你的代码焕然一新!
前端·人工智能·后端