【昇思初学入门】第四天打卡

数据变换Transforms

心得体会

  1. MindSpore提供了丰富的数据变换工具,针对图像数据可以使用如Rescale、Normalize和HWC2CHW等,且使用Compose类允许我们定义一个变换序列,并将它们作为一个整体应用到数据上。
python 复制代码
composed = transforms.Compose(
    [
        vision.Rescale(1.0 / 255.0, 0),
        vision.Normalize(mean=(0.1307,), std=(0.3081,)),
        vision.HWC2CHW()
    ]
)
train_dataset = train_dataset.map(composed, 'image')
  1. MindSpore 还提供了处理文本数据常用步骤,分词(Tokenize)和词表映射(Lookup)
python 复制代码
# 分词
texts = ['Welcome to Beijing']
test_dataset = GeneratorDataset(texts, 'text')
def my_tokenizer(content):
    return content.split()
test_dataset = test_dataset.map(text.PythonTokenizer(my_tokenizer))
print(next(test_dataset.create_tuple_iterator()))

3.MindSpore 还支持Lambda函数对数据进行自定义处理

python 复制代码
test_dataset.map(lambda x: x * 2)
相关推荐
W.KN20 小时前
关于论文如何开始的学习笔记
人工智能·笔记·学习
有Li20 小时前
MIRAGE:针对嘈杂环境鲁棒性的医学图像-文本预训练|文献速递-医疗影像分割与目标检测最新技术
论文阅读·人工智能·深度学习·计算机视觉·文献·医学生
上天夭20 小时前
目标跟踪篇
人工智能·计算机视觉·目标跟踪
胡伯来了20 小时前
12 Transformers - 使用Pipeline处理计算机视觉
人工智能·计算机视觉·transformer·transformers·大数据模型
wuwangwo120 小时前
从朴素实现到40倍性能提升的优化之旅
人工智能
CoderIsArt20 小时前
Lepton AI 平台的实现原理
人工智能
神州问学20 小时前
阿里开源通义DeepResearch:智能体训练全流程揭秘
人工智能
rayufo20 小时前
AI思考步骤解析
人工智能
胡伯来了20 小时前
10 Transformers - 任务容器类 Pipeline
人工智能·pipeline·transformer·transformers·大数据模型
拓端研究室20 小时前
2025人工智能AI研究报告:算力、应用、风险与就业|附1000+份报告PDF、数据、可视化模板汇总下载
人工智能