TensorFlow文件读取 --TFRecords文件

TFRecords文件

是一种二进制文件,能够很好的利用内存,更方便复制和移动,并且不需要单独的标签文件

使用步骤

1)获取数据

2)将数据填入到Example协议内存块(protocol buffer)

3)将协议内存块序列化为字符串,并且通过 tf.python_io.TFRecordWriter写入到TFRecords文件

文件格式 *.tfrecords

Example结构

●tf. train. Example协议内存块(protocol buffer)(协议内存块包含了字段 Features )

●Features包含了一个Feature 字段

●Feature 中包含要写入的数据、并指明数据类型。

这是一个样本的结构,批数据需要循环存入这样的结构

  • tf.train.Example(features=None)

写入tfrecords文件

features: tf.train.Features类型的特征实例

return: example格式协议块

  • tf.train.Features(feature=None)

构建每个样本的信息键值对

feature: 字典数据,key为要保存的名字

value为tf.train.Feature实例

return: Features类型

  • tf.train.Feature(options)

options: 例如

bytes_ litftrain. BytesList(value=[Bytes])

int64. lststf.train. Int64List(value=[Value)

支持存入的类型如下

tf.train.Int64List(value=Malue])

tf.train.BytesList(value=[Bytes])

tf.train.FloatList(value=[value]

流程分析

1)构造存储实力 tf.python_io.TFRecordWriter(patch)

2)循环将数据填入到Example协议内存块(protocol buffer)

example解析

●tf.parse. single_ example(serialized, features=None, name=None)

解析一个单一的Example原型

serialized: 标量字符串Tensor, - 一个序列化的Example

features: dict字典数据,键为读取的名字,值为FixedLenFeature

return:一 个键值对组成的字典,键为读取的名字

●tf.FixedL enFeature(shape, dtype)

shape: 输入数据的形状,一般不指定,为空列表

dtype: 输入数据类型,与存储进文件的类型要一致

类型只能是float32, int64, string

案例:

写入:

读取:

流程:

1)构造文件名队列

2)读取和解码

读取

解析example

解码

3)构造批处理队列

相关推荐
杜子不疼.1 小时前
计算机视觉热门模型手册:Spring Boot 3.2 自动装配新机制:@AutoConfiguration 使用指南
人工智能·spring boot·计算机视觉
无心水3 小时前
【分布式利器:腾讯TSF】7、TSF高级部署策略全解析:蓝绿/灰度发布落地+Jenkins CI/CD集成(Java微服务实战)
java·人工智能·分布式·ci/cd·微服务·jenkins·腾讯tsf
北辰alk8 小时前
RAG索引流程详解:如何高效解析文档构建知识库
人工智能
九河云8 小时前
海上风电“AI偏航对风”:把发电量提升2.1%,单台年增30万度
大数据·人工智能·数字化转型
wm10438 小时前
机器学习第二讲 KNN算法
人工智能·算法·机器学习
沈询-阿里8 小时前
Skills vs MCP:竞合关系还是互补?深入解析Function Calling、MCP和Skills的本质差异
人工智能·ai·agent·ai编程
xiaobai1788 小时前
测试工程师入门AI技术 - 前序:跨越焦虑,从优势出发开启学习之旅
人工智能·学习
盛世宏博北京9 小时前
云边协同・跨系统联动:智慧档案馆建设与功能落地
大数据·人工智能
Learn-Python9 小时前
MongoDB-only方法
python·sql
TGITCIC9 小时前
讲透知识图谱Neo4j在构建Agent时到底怎么用(二)
人工智能·知识图谱·neo4j·ai agent·ai智能体·大模型落地·graphrag