TensorFlow文件读取 --TFRecords文件

TFRecords文件

是一种二进制文件,能够很好的利用内存,更方便复制和移动,并且不需要单独的标签文件

使用步骤

1)获取数据

2)将数据填入到Example协议内存块(protocol buffer)

3)将协议内存块序列化为字符串,并且通过 tf.python_io.TFRecordWriter写入到TFRecords文件

文件格式 *.tfrecords

Example结构

●tf. train. Example协议内存块(protocol buffer)(协议内存块包含了字段 Features )

●Features包含了一个Feature 字段

●Feature 中包含要写入的数据、并指明数据类型。

这是一个样本的结构,批数据需要循环存入这样的结构

  • tf.train.Example(features=None)

写入tfrecords文件

features: tf.train.Features类型的特征实例

return: example格式协议块

  • tf.train.Features(feature=None)

构建每个样本的信息键值对

feature: 字典数据,key为要保存的名字

value为tf.train.Feature实例

return: Features类型

  • tf.train.Feature(options)

options: 例如

bytes_ litftrain. BytesList(value=[Bytes])

int64. lststf.train. Int64List(value=[Value)

支持存入的类型如下

tf.train.Int64List(value=Malue])

tf.train.BytesList(value=[Bytes])

tf.train.FloatList(value=[value]

流程分析

1)构造存储实力 tf.python_io.TFRecordWriter(patch)

2)循环将数据填入到Example协议内存块(protocol buffer)

example解析

●tf.parse. single_ example(serialized, features=None, name=None)

解析一个单一的Example原型

serialized: 标量字符串Tensor, - 一个序列化的Example

features: dict字典数据,键为读取的名字,值为FixedLenFeature

return:一 个键值对组成的字典,键为读取的名字

●tf.FixedL enFeature(shape, dtype)

shape: 输入数据的形状,一般不指定,为空列表

dtype: 输入数据类型,与存储进文件的类型要一致

类型只能是float32, int64, string

案例:

写入:

读取:

流程:

1)构造文件名队列

2)读取和解码

读取

解析example

解码

3)构造批处理队列

相关推荐
qq_5290252918 分钟前
Torch.gather
python·深度学习·机器学习
数据小爬虫@18 分钟前
如何高效利用Python爬虫按关键字搜索苏宁商品
开发语言·爬虫·python
Cachel wood1 小时前
python round四舍五入和decimal库精确四舍五入
java·linux·前端·数据库·vue.js·python·前端框架
IT古董1 小时前
【漫话机器学习系列】017.大O算法(Big-O Notation)
人工智能·机器学习
凯哥是个大帅比1 小时前
人工智能ACA(五)--深度学习基础
人工智能·深度学习
終不似少年遊*1 小时前
pyecharts
python·信息可视化·数据分析·学习笔记·pyecharts·使用技巧
Python之栈1 小时前
【无标题】
数据库·python·mysql
m0_748232921 小时前
DALL-M:基于大语言模型的上下文感知临床数据增强方法 ,补充
人工智能·语言模型·自然语言处理
袁袁袁袁满1 小时前
100天精通Python(爬虫篇)——第113天:‌爬虫基础模块之urllib详细教程大全
开发语言·爬虫·python·网络爬虫·爬虫实战·urllib·urllib模块教程
szxinmai主板定制专家1 小时前
【国产NI替代】基于FPGA的32通道(24bits)高精度终端采集核心板卡
大数据·人工智能·fpga开发