TensorFlow文件读取 --TFRecords文件

TFRecords文件

是一种二进制文件,能够很好的利用内存,更方便复制和移动,并且不需要单独的标签文件

使用步骤

1)获取数据

2)将数据填入到Example协议内存块(protocol buffer)

3)将协议内存块序列化为字符串,并且通过 tf.python_io.TFRecordWriter写入到TFRecords文件

文件格式 *.tfrecords

Example结构

●tf. train. Example协议内存块(protocol buffer)(协议内存块包含了字段 Features )

●Features包含了一个Feature 字段

●Feature 中包含要写入的数据、并指明数据类型。

这是一个样本的结构,批数据需要循环存入这样的结构

  • tf.train.Example(features=None)

写入tfrecords文件

features: tf.train.Features类型的特征实例

return: example格式协议块

  • tf.train.Features(feature=None)

构建每个样本的信息键值对

feature: 字典数据,key为要保存的名字

value为tf.train.Feature实例

return: Features类型

  • tf.train.Feature(options)

options: 例如

bytes_ litftrain. BytesList(value=Bytes)

int64. lststf.train. Int64List(value=[Value)

支持存入的类型如下

tf.train.Int64List(value=Malue])

tf.train.BytesList(value=Bytes)

tf.train.FloatList(value=value

流程分析

1)构造存储实力 tf.python_io.TFRecordWriter(patch)

2)循环将数据填入到Example协议内存块(protocol buffer)

example解析

●tf.parse. single_ example(serialized, features=None, name=None)

解析一个单一的Example原型

serialized: 标量字符串Tensor, - 一个序列化的Example

features: dict字典数据,键为读取的名字,值为FixedLenFeature

return:一 个键值对组成的字典,键为读取的名字

●tf.FixedL enFeature(shape, dtype)

shape: 输入数据的形状,一般不指定,为空列表

dtype: 输入数据类型,与存储进文件的类型要一致

类型只能是float32, int64, string

案例:

写入:

读取:

流程:

1)构造文件名队列

2)读取和解码

读取

解析example

解码

3)构造批处理队列

相关推荐
黄忠3 小时前
大模型之LangGraph技术体系
python·llm
这token有力气3 小时前
Function Calling 格式漂移
人工智能
onething3653 小时前
Spring Boot + Spring AI 从入门到实战:7天转型计划 Day 5 —— SSE 流式输出 + 打字机效果
人工智能·后端·全栈
onething3654 小时前
Spring Boot + Spring AI 从入门到实战:7天转型计划 Day 6 —— 业务完善 + 会话消息预览
人工智能·后端·全栈
IT_陈寒4 小时前
SpringBoot自动配置的坑,我爬了三天才出来
前端·人工智能·后端
甲维斯6 小时前
笑抽了!DeepSeek识图,豆包完胜了!
人工智能·deepseek
Lei活在当下14 小时前
【AI手记系列-2026/6/18】iSparto & Harness,Caveman 以及AI时代的生存指南
人工智能·llm·openai
冬奇Lab15 小时前
每日一个开源项目(第134篇):Zvec - 阿里开源的嵌入式向量数据库,向量搜索界的 SQLite
数据库·人工智能·llm
冬奇Lab15 小时前
Agent 系列(22):Context Engineering 深度——三种上下文管理策略的量化对比
人工智能·agent
hboot15 小时前
AI工程师第二课 - 数据处理
人工智能·python·数据分析