【昇思初学入门】第四天打卡

数据变换Transforms

心得体会

  1. MindSpore提供了丰富的数据变换工具,针对图像数据可以使用如Rescale、Normalize和HWC2CHW等,且使用Compose类允许我们定义一个变换序列,并将它们作为一个整体应用到数据上。
python 复制代码
composed = transforms.Compose(
    [
        vision.Rescale(1.0 / 255.0, 0),
        vision.Normalize(mean=(0.1307,), std=(0.3081,)),
        vision.HWC2CHW()
    ]
)
train_dataset = train_dataset.map(composed, 'image')
  1. MindSpore 还提供了处理文本数据常用步骤,分词(Tokenize)和词表映射(Lookup)
python 复制代码
# 分词
texts = ['Welcome to Beijing']
test_dataset = GeneratorDataset(texts, 'text')
def my_tokenizer(content):
    return content.split()
test_dataset = test_dataset.map(text.PythonTokenizer(my_tokenizer))
print(next(test_dataset.create_tuple_iterator()))

3.MindSpore 还支持Lambda函数对数据进行自定义处理

python 复制代码
test_dataset.map(lambda x: x * 2)
相关推荐
两万五千个小时12 小时前
构建mini Claude Code:12 - 从「文件冲突」到「分身协作」:Worktree 如何让多 Agent 安全并行
人工智能·python·架构
老纪的技术唠嗑局12 小时前
OpenClaw 是怎么让 AI 变得 “像人” 的?
人工智能
算法备案代理12 小时前
深度合成算法备案:生成式AI需要备案吗?
人工智能·算法·算法备案
沪漂阿龙12 小时前
大模型选型决策全流程:从需求分析到生产上线的六步法
人工智能·数据挖掘·需求分析
琅琊榜首202012 小时前
移动端AI挂机新范式:YOLOv8+NCNN实现无Root视觉自动化
人工智能·yolo·自动化
甲枫叶13 小时前
【claude+weelinking产品经理系列16】数据可视化——用图表讲述产品数据的故事
java·人工智能·python·信息可视化·产品经理·ai编程
大模型真好玩13 小时前
LangChain DeepAgents 速通指南(二)—— Summarization中间件为Agent作记忆加减法
人工智能·langchain·agent
北辰alk13 小时前
大模型微调技术全景解析:从LoRA到RLHF的演进之路
人工智能
未来之窗软件服务13 小时前
AI人工智能(二十一)pt模型转onnx sensvoice—东方仙盟练气期
人工智能·python·仙盟创梦ide·东方仙盟
2501_9464903813 小时前
Hirender MTC时间码技术实操——PH®CLUB激光投影声光电精准同步实现方案
大数据·运维·人工智能·hirender·hecoos