【深度学习 | 输入数据】张量

Tensor

    • 在喂给模型前,必须将输入数据转为`NumPy数组`!
      • [为什么喂给深度学习框架的数据集,在最后一步必须转为 np.array(NumPy数组)?](#为什么喂给深度学习框架的数据集,在最后一步必须转为 np.array(NumPy数组)?)
      • [:"Python 中使用 list 列表来表示数组的" ------ 这句话在科学计算的语境下是错误的。](#:“Python 中使用 list 列表来表示数组的” —— 这句话在科学计算的语境下是错误的。)
      • [数据 | 数据类型流转全流程解析(从 DataFrame 到最终模型输入)](#数据 | 数据类型流转全流程解析(从 DataFrame 到最终模型输入))
  • ============
    • [最终生成的特征数据 X 的形状是 (样本数, 时间步长, 特征数)shape,我们怎么推理/晓得的?](#最终生成的特征数据 X 的形状是 (样本数, 时间步长, 特征数)shape,我们怎么推理/晓得的?)

在喂给模型前,必须将输入数据转为NumPy数组!

为什么喂给深度学习框架的数据集,在最后一步必须转为 np.array(NumPy数组)?

  1. 框架
  2. 内存 计算
  3. 维度属性

:"Python 中使用 list 列表来表示数组的" ------ 这句话在科学计算的语境下是错误的。

  • \[\] 定义的是 列表(List) 动态增删,且什么都能装
  • () 定义的是 元组(Tuple) 它是不可变的(只读)

在这里插入图片描述

总结区分:在整个预处理代码中,list(列表)扮演的是**"临时收集用的塑料袋",而 NumPy Array 扮演的是"最终送入产线的标准集装箱"**。

数据 | 数据类型流转全流程解析(从 DataFrame 到最终模型输入)

数据类型流转全流程解析(从 DataFrame 到最终模型输入)

  1. 最初数据读取:df = pd.read_csv(...) 二维表

二维表。适合看,适合数据筛选,不能做矩阵计算。

  1. 读取后提取特征**&临时**收集数据记录 列表

seqs = \[\] # 或者写成 seqs = list()

for col in cols:

seq = dfcol.values.reshape(-1, 1)

seqs.append(seq)
列表

dfcol.values,此时我们是纯粹提取数值,我们不需要多数值也不能对数值(记录中的任何数据)做修改,且list列表恰好有这个特性(只可读性)。而且,Python 的 List 的 .append() 方法执行速度极快

总之,在中间处理数据时,用list列表做好不过了

  1. 压制成完整大矩阵 dataset = np.hstack((seqs)) 当前类型:NumPy 2D Array(完整的二维大矩阵)。

收集工作结束了。我们把装满 9 个独立列向量的"塑料袋(List)"倒出来,用 np.hstack 将它们横向焊死成一个完整、连续的矩阵内存块。此时数据不再是零散的了。

  1. 最终数据处理结束后,输入到模型前需要保存成/定型为return np.array(X), np.array(y) 当前类型:NumPy 3D Array (X) 和 NumPy 1D/2D Array (y)。

整个流程的底层逻辑是:"需要频繁动态增加元素时,使用 Python List (\[\] 或 list());需要执行数学组合操作或最终交付给模型时,转化为 NumPy Array。"

复制代码
数据的类型确实在**随着处理目的的不同而不断切换**。

============

最终生成的特征数据 X 的形状是 (样本数, 时间步长, 特征数)shape,我们怎么推理/晓得的?

  • 特征数: 所有列?
相关推荐
冬奇Lab5 分钟前
每日一个开源项目(第139篇):Voicebox - 本地运行的开源 ElevenLabs 替代品
人工智能·开源·资讯
冬奇Lab13 分钟前
Skill 系列(03):Skill 设计范式——5 个模式让输出从混沌到可预测
人工智能·开源·agent
IT_陈寒2 小时前
Python搞不定字符串编码?这破玩意坑我两小时!
前端·人工智能·后端
大模型真好玩4 小时前
什么是Loop Engineering?最通俗易懂的Loop Engineering核心概念
人工智能·agent·deepseek
叁两4 小时前
前端转型AI Agent该如何学习?(前置篇)
前端·人工智能·node.js
LaiYoung_4 小时前
🎁 送你一套超好用超实用的 FE AI-Coding Skills
前端·人工智能·开源
ZzT7 小时前
怎么做才不会被 AI 替代?
人工智能·程序员
道友可好7 小时前
从今天开始:你的第一个 Harness Engineering 实践
前端·人工智能·后端
小姜前线技术8 小时前
AI回答代码块高亮加一键复制
人工智能
洛阳泰山8 小时前
从 0 到 1.6K Star:一个 Java 开源项目的增长复盘
人工智能·后端·开源