【昇思初学入门】第四天打卡

数据变换Transforms

心得体会

  1. MindSpore提供了丰富的数据变换工具,针对图像数据可以使用如Rescale、Normalize和HWC2CHW等,且使用Compose类允许我们定义一个变换序列,并将它们作为一个整体应用到数据上。
python 复制代码
composed = transforms.Compose(
    [
        vision.Rescale(1.0 / 255.0, 0),
        vision.Normalize(mean=(0.1307,), std=(0.3081,)),
        vision.HWC2CHW()
    ]
)
train_dataset = train_dataset.map(composed, 'image')
  1. MindSpore 还提供了处理文本数据常用步骤,分词(Tokenize)和词表映射(Lookup)
python 复制代码
# 分词
texts = ['Welcome to Beijing']
test_dataset = GeneratorDataset(texts, 'text')
def my_tokenizer(content):
    return content.split()
test_dataset = test_dataset.map(text.PythonTokenizer(my_tokenizer))
print(next(test_dataset.create_tuple_iterator()))

3.MindSpore 还支持Lambda函数对数据进行自定义处理

python 复制代码
test_dataset.map(lambda x: x * 2)
相关推荐
SickeyLee6 分钟前
AI产品经理-大模型的智力之源与能力边界
大数据·人工智能
dtsola12 分钟前
AI独立开发的道法术器:一个解决方案架构师的实践与思考
人工智能·ai编程·ai创业·独立开发者·vibecoding·个人开发者·一人公司
2501_9269783314 分钟前
概率分形理论--从离散到连续--从向量到模型
人工智能·经验分享·agi
A小码哥17 分钟前
Cowork 开源平替 OpenWork:打破 AI 协助垄断
人工智能·开源
paopao_wu23 分钟前
解析 skill-creator:如何编写高质量的 AI Skill
人工智能·ai编程
IvanCodes24 分钟前
人工智能、机器学习和深度学习,其实不是一回事
人工智能·机器学习
前端Fusion24 分钟前
一文讲透 MCP 和 Skills 的分工与协作
人工智能·vibecoding
逐梦苍穹31 分钟前
谷歌新研究:训练大模型时“偷懒跳过“50%更新,性能反而提升20%?
人工智能·google·论文·梯度更新
向哆哆32 分钟前
单车/共享单车目标检测数据集(适用YOLO系列)(已标注+划分/可直接训练)
人工智能·yolo·目标检测
新缸中之脑33 分钟前
轻量AI助手的兴起
人工智能