【昇思初学入门】第四天打卡

数据变换Transforms

心得体会

  1. MindSpore提供了丰富的数据变换工具,针对图像数据可以使用如Rescale、Normalize和HWC2CHW等,且使用Compose类允许我们定义一个变换序列,并将它们作为一个整体应用到数据上。
python 复制代码
composed = transforms.Compose(
    [
        vision.Rescale(1.0 / 255.0, 0),
        vision.Normalize(mean=(0.1307,), std=(0.3081,)),
        vision.HWC2CHW()
    ]
)
train_dataset = train_dataset.map(composed, 'image')
  1. MindSpore 还提供了处理文本数据常用步骤,分词(Tokenize)和词表映射(Lookup)
python 复制代码
# 分词
texts = ['Welcome to Beijing']
test_dataset = GeneratorDataset(texts, 'text')
def my_tokenizer(content):
    return content.split()
test_dataset = test_dataset.map(text.PythonTokenizer(my_tokenizer))
print(next(test_dataset.create_tuple_iterator()))

3.MindSpore 还支持Lambda函数对数据进行自定义处理

python 复制代码
test_dataset.map(lambda x: x * 2)
相关推荐
3Bronze1Pyramid40 分钟前
【RNAErnie 大模型】
人工智能·深度学习·算法
良策金宝AI8 小时前
让端子排接线图“智能生成”,良策金宝AI推出变电站二次智能设计引擎
大数据·人工智能·工程设计·变电站ai
天云数据8 小时前
神经网络,人类表达的革命
人工智能·深度学习·神经网络·机器学习
xixixi777778 小时前
2026 年 02 月 13 日 AI 前沿、通信和安全行业日报
人工智能·安全·ai·大模型·通信·市场
独自归家的兔8 小时前
深度学习之 CNN:如何在图像数据的海洋中精准 “捕捞” 特征?
人工智能·深度学习·cnn
X54先生(人文科技)9 小时前
20260211_AdviceForTraditionalProgrammers
数据库·人工智能·ai编程
梦想画家9 小时前
数据治理5大核心概念:分清、用好,支撑AI智能化应用
人工智能·数据治理
yhdata9 小时前
锁定2032年!区熔硅单晶市场规模有望达71.51亿元,赛道前景持续向好
大数据·人工智能
deephub10 小时前
RAG 文本分块:七种主流策略的原理与适用场景
人工智能·深度学习·大语言模型·rag·检索