【深度学习 | 输入数据】张量

Tensor

    • 在喂给模型前,必须将输入数据转为`NumPy数组`!
      • [为什么喂给深度学习框架的数据集,在最后一步必须转为 np.array(NumPy数组)?](#为什么喂给深度学习框架的数据集,在最后一步必须转为 np.array(NumPy数组)?)
      • [:"Python 中使用 list 列表来表示数组的" ------ 这句话在科学计算的语境下是错误的。](#:“Python 中使用 list 列表来表示数组的” —— 这句话在科学计算的语境下是错误的。)
      • [数据 | 数据类型流转全流程解析(从 DataFrame 到最终模型输入)](#数据 | 数据类型流转全流程解析(从 DataFrame 到最终模型输入))
  • ============
    • [最终生成的特征数据 X 的形状是 (样本数, 时间步长, 特征数)shape,我们怎么推理/晓得的?](#最终生成的特征数据 X 的形状是 (样本数, 时间步长, 特征数)shape,我们怎么推理/晓得的?)

在喂给模型前,必须将输入数据转为NumPy数组!

为什么喂给深度学习框架的数据集,在最后一步必须转为 np.array(NumPy数组)?

  1. 框架
  2. 内存 计算
  3. 维度属性

:"Python 中使用 list 列表来表示数组的" ------ 这句话在科学计算的语境下是错误的。

  • \[\] 定义的是 列表(List) 动态增删,且什么都能装
  • () 定义的是 元组(Tuple) 它是不可变的(只读)

在这里插入图片描述

总结区分:在整个预处理代码中,list(列表)扮演的是**"临时收集用的塑料袋",而 NumPy Array 扮演的是"最终送入产线的标准集装箱"**。

数据 | 数据类型流转全流程解析(从 DataFrame 到最终模型输入)

数据类型流转全流程解析(从 DataFrame 到最终模型输入)

  1. 最初数据读取:df = pd.read_csv(...) 二维表

二维表。适合看,适合数据筛选,不能做矩阵计算。

  1. 读取后提取特征**&临时**收集数据记录 列表

seqs = \[\] # 或者写成 seqs = list()

for col in cols:

seq = dfcol.values.reshape(-1, 1)

seqs.append(seq)
列表

dfcol.values,此时我们是纯粹提取数值,我们不需要多数值也不能对数值(记录中的任何数据)做修改,且list列表恰好有这个特性(只可读性)。而且,Python 的 List 的 .append() 方法执行速度极快

总之,在中间处理数据时,用list列表做好不过了

  1. 压制成完整大矩阵 dataset = np.hstack((seqs)) 当前类型:NumPy 2D Array(完整的二维大矩阵)。

收集工作结束了。我们把装满 9 个独立列向量的"塑料袋(List)"倒出来,用 np.hstack 将它们横向焊死成一个完整、连续的矩阵内存块。此时数据不再是零散的了。

  1. 最终数据处理结束后,输入到模型前需要保存成/定型为return np.array(X), np.array(y) 当前类型:NumPy 3D Array (X) 和 NumPy 1D/2D Array (y)。

整个流程的底层逻辑是:"需要频繁动态增加元素时,使用 Python List (\[\] 或 list());需要执行数学组合操作或最终交付给模型时,转化为 NumPy Array。"

复制代码
数据的类型确实在**随着处理目的的不同而不断切换**。

============

最终生成的特征数据 X 的形状是 (样本数, 时间步长, 特征数)shape,我们怎么推理/晓得的?

  • 特征数: 所有列?
相关推荐
阿瑞IT2 分钟前
AI Agent 从 Demo 到生产:被低估的四个工程问题
人工智能
小锋java12342 分钟前
【技术专题】LangChain4j 开发Java Agent智能体 - 整合SpringBoot4
java·人工智能
MemOS2 分钟前
产品更新 |MemOS CLI 上线:让能跑命令行的 Agent 更轻量接入长期记忆
人工智能
独秀不如众秀2 分钟前
AI Coding 的最大问题不是写错代码,而是反复犯同一个错
人工智能
CV实验室4 分钟前
Remote Sensing 29个SITS基准数据集综述:多模态遥感分类的新起点
人工智能·深度学习·计算机视觉·音视频
m0_4665252911 分钟前
锚定场景深耕数据 东软探索城市全域数字化新路径
大数据·人工智能
Data-Miner13 分钟前
智慧城市数据中台建设方案深度解析PPT解读
人工智能·智慧城市
喵了几个咪19 分钟前
AI重构软件开发范式:框架与脚手架为何仍是生产级开发的刚需?
vue.js·人工智能·react.js·重构·golang·ai编程
星辰AI23 分钟前
告别翻译腔:用 AI Agent 自动化构建开源项目的多语言技术文档
人工智能·ai·语言模型
KJ_BioMed26 分钟前
突破“不可成药”靶点:科晶生物AI互作蛋白与纳米抗体设计技术解析
人工智能·抗体药物·多肽药物·多肽设计·抗体设计