深度学习基础之《TensorFlow框架(14)—TFRecords》

一、什么是TFRecords文件

1、TFRecords其实是一种二进制文件,虽然它不如其他格式好理解,但是它能更好的利用内存,更方便复制和移动,并且不需要单独的标签文件

2、使用步骤

(1)获取数据

(2)将数据填入到Example协议内存块(protocol buffer)

(3)将协议内存块序列化为字符串,并且通过tf.io.TFRecordWriter写入到TFRecords文件

3、文件格式*.tfrecords

二、Example结构解析

1、Example

python 复制代码
features {
	feature {
		key: "image"
		value {
			bytes_list {
				value: "\377\374\375\372\356\351\365\31\350\356\352\350"
			}
		}
	}
	feature {
		key: "lable"
		value {
			int64_list {
				value: 9
			}
		}
	}
}

特征值 - image - 3072字节

目标值 - label - 1个字节

说明:

(1)tf.train.Example

协议内存块(protocol buffer)(协议内存块包含了字段features)

(2)features

包含了feature字段

(3)feature

中包含要写入的数据、并指明数据类型

2、相关对象

tf.train.Example(features=None)

说明:

(1)写入tfrecords文件

(2)features:tf.train.Features类型的特征实例

(3)return:example格式协议块

tf.train.Features(feature=Nona)

说明:

(1)构建每个样本的信息键值对

(2)feature:字段数据,key为要保存的名字,value为tf.train.Feature实例

(3)return:Features实例

tf.train.Feature(options)

说明:

(1)options

bytes_list=tf.train.BytesList(value=[Bytes])

int64_list=tf.train.Int64List(value=[Value])

float_list=tf.train.FloatList(value=[Value])

(2)支持存入的类型如下

tf.train.BytesList(value=[Bytes])

tf.train.Int64List(value=[Value])

tf.train.FloatList(value=[Value])

3、一个样本的对象

python 复制代码
example = tf.train.Example(features=tf.train.Features(feature={"image":tf.train.Feature(bytes_list=tf.train.BytesList(value=[image])"label":tf.train.Feature(int64_list=tf.train.Int64List(value=[label])))}))

三、CIFAR-10数据存入TFRecords文件

四、读取TFRecords文件API

五、读取CIFAR的TFRecords文件

相关推荐
聆风吟º7 分钟前
CANN runtime 全链路拆解:AI 异构计算运行时的任务管理与功能适配技术路径
人工智能·深度学习·神经网络·cann
User_芊芊君子17 分钟前
CANN大模型推理加速引擎ascend-transformer-boost深度解析:毫秒级响应的Transformer优化方案
人工智能·深度学习·transformer
智驱力人工智能1 小时前
小区高空抛物AI实时预警方案 筑牢社区头顶安全的实践 高空抛物检测 高空抛物监控安装教程 高空抛物误报率优化方案 高空抛物监控案例分享
人工智能·深度学习·opencv·算法·安全·yolo·边缘计算
人工不智能5771 小时前
拆解 BERT:Output 中的 Hidden States 到底藏了什么秘密?
人工智能·深度学习·bert
h64648564h1 小时前
CANN 性能剖析与调优全指南:从 Profiling 到 Kernel 级优化
人工智能·深度学习
心疼你的一切1 小时前
解密CANN仓库:AIGC的算力底座、关键应用与API实战解析
数据仓库·深度学习·aigc·cann
学电子她就能回来吗3 小时前
深度学习速成:损失函数与反向传播
人工智能·深度学习·学习·计算机视觉·github
Coder_Boy_4 小时前
TensorFlow小白科普
人工智能·深度学习·tensorflow·neo4j
大模型玩家七七4 小时前
梯度累积真的省显存吗?它换走的是什么成本
java·javascript·数据库·人工智能·深度学习
kkzhang4 小时前
Concept Bottleneck Models-概念瓶颈模型用于可解释决策:进展、分类体系 与未来方向综述
深度学习