【昇思初学入门】第四天打卡

数据变换Transforms

心得体会

  1. MindSpore提供了丰富的数据变换工具,针对图像数据可以使用如Rescale、Normalize和HWC2CHW等,且使用Compose类允许我们定义一个变换序列,并将它们作为一个整体应用到数据上。
python 复制代码
composed = transforms.Compose(
    [
        vision.Rescale(1.0 / 255.0, 0),
        vision.Normalize(mean=(0.1307,), std=(0.3081,)),
        vision.HWC2CHW()
    ]
)
train_dataset = train_dataset.map(composed, 'image')
  1. MindSpore 还提供了处理文本数据常用步骤,分词(Tokenize)和词表映射(Lookup)
python 复制代码
# 分词
texts = ['Welcome to Beijing']
test_dataset = GeneratorDataset(texts, 'text')
def my_tokenizer(content):
    return content.split()
test_dataset = test_dataset.map(text.PythonTokenizer(my_tokenizer))
print(next(test_dataset.create_tuple_iterator()))

3.MindSpore 还支持Lambda函数对数据进行自定义处理

python 复制代码
test_dataset.map(lambda x: x * 2)
相关推荐
Java中文社群4 分钟前
国内直连GPT、Claude和Gemini?N8N这次更新真的绝了!
人工智能·后端
小真zzz8 分钟前
Nano Banana Pro 深度解析与 AI PPT 工具全面评测报告
人工智能·ai·powerpoint·ppt·chatppt·banana pro
半空扫地僧一枚19 分钟前
D02期:档位切换
人工智能
风雨中的小七21 分钟前
解密Prompt系列67. 智能体的经济学:从架构选型到工具预算
人工智能·llm
软件算法开发24 分钟前
基于蘑菇繁殖优化的LSTM深度学习网络模型(MRO-LSTM)的一维时间序列预测算法matlab仿真
深度学习·算法·matlab·lstm·时间序列预测·蘑菇繁殖优化·mro-lstm
Deepoch24 分钟前
智能硬件新纪元:Deepoc开发板如何重塑清洁机器人的“认知内核“
人工智能·清洁机器人·具身模型·deepoc
Blockbuater_drug26 分钟前
SDF 格式文件的前世今生:从化学信息学基石到 AI 时代的分子通用语言
数据库·人工智能·化学信息学·sdf格式
AlanHou29 分钟前
AI 智能体从入门到进阶再到落地完整教程
人工智能·agent
彼岸花开了吗29 分钟前
构建AI智能体:六十九、Bootstrap采样在大模型评估中的应用:从置信区间到模型稳定性
人工智能·python·llm