处理Excel表不等长时间序列用tsfresh提取时序特征

我原本的时间序列格式是excel表记录的,每一行是一条时间序列,时间序列不等长。

要把excel表数据读取出来之后转换成extract_features需要的格式。

1.读取excel表数据

python 复制代码
import pandas as pd
import numpy as np
from tsfresh import extract_features
mdata = pd.read_excel('文件位置',header = None)
"读取出来的dataframe中每一行是一个时间序列,不满足要求,要进行行列转置"
transposed = mdata.transpose()

2.把dataframe数据格式转换成extract_features需要的格式

python 复制代码
def convert_to_extract_df(dataframe:pd.DataFrame):
    """把dataframe格式转变为extract_features需要的格式"""
    covert_df = pd.DataFrame(columns=['value', 'id'])
    for _col, col_series in dataframe.iteritems():
        col_ser = col_series.dropna()#把nan值去掉
        _col_df = pd.DataFrame(data=[col_ser.values]).T
        _col_df.columns = ['value']
        _col_df['id'] = _col
        covert_df = pd.concat([covert_df, _col_df], axis=0, ignore_index=True)
    covert_df['value'] = covert_df['value'].astype("float")
    return covert_df

3.接下来就可以直接调用extract_features函数了。

python 复制代码
cdf = convert_to_extract_df(transposed)
ext_feature = extract_features(cdf, column_id="id")
相关推荐
Allen_LVyingbo3 分钟前
面向70B多模态医疗大模型预训练的工程落地(医疗大模型预训练扩展包)
人工智能·python·分类·知识图谱·健康医疗·迁移学习
Deng8723473483 分钟前
电脑使用 Gemini出了点问题解决办法
人工智能·python
我送炭你添花7 分钟前
Pelco KBD300A 模拟器:18. 按依赖顺序 + 复杂度由低到高逐步推进pytest单元测试
python·单元测试·log4j·pytest
程序员杰哥10 分钟前
如何写出高效的测试用例?
自动化测试·软件测试·python·功能测试·测试工具·职场和发展·测试用例
2301_8223776511 分钟前
数据分析师的Python工具箱
jvm·数据库·python
无垠的广袤20 分钟前
【VisionFive 2 Lite 单板计算机】SoC 温度的 Home Assistant 物联网终端显示
linux·python·物联网
强化试剂瓶20 分钟前
全面掌握Ergosterol-PEG-Biotin,麦角甾醇PEG生物素的使用与注意事项
python·scrapy·flask·scikit-learn·pyqt
人工智能AI技术23 分钟前
【Agent从入门到实践】45 与后端系统集成:Agent作为服务,嵌入业务流程
人工智能·python
JERRY. LIU24 分钟前
realsense识别目标距离的传感器及其工作原理
python·opencv·目标检测
工程师老罗26 分钟前
Pytorch自定义数据集的用法
开发语言·pytorch·python