【昇思初学入门】第四天打卡

数据变换Transforms

心得体会

  1. MindSpore提供了丰富的数据变换工具,针对图像数据可以使用如Rescale、Normalize和HWC2CHW等,且使用Compose类允许我们定义一个变换序列,并将它们作为一个整体应用到数据上。
python 复制代码
composed = transforms.Compose(
    [
        vision.Rescale(1.0 / 255.0, 0),
        vision.Normalize(mean=(0.1307,), std=(0.3081,)),
        vision.HWC2CHW()
    ]
)
train_dataset = train_dataset.map(composed, 'image')
  1. MindSpore 还提供了处理文本数据常用步骤,分词(Tokenize)和词表映射(Lookup)
python 复制代码
# 分词
texts = ['Welcome to Beijing']
test_dataset = GeneratorDataset(texts, 'text')
def my_tokenizer(content):
    return content.split()
test_dataset = test_dataset.map(text.PythonTokenizer(my_tokenizer))
print(next(test_dataset.create_tuple_iterator()))

3.MindSpore 还支持Lambda函数对数据进行自定义处理

python 复制代码
test_dataset.map(lambda x: x * 2)
相关推荐
用户51914958484510 分钟前
Linux PAM环境变量注入漏洞利用工具解析
人工智能·aigc
哔哔龙11 分钟前
Langchain中“logprobs”的作用
人工智能
智谱开放平台11 分钟前
理解 Claude 的 Agentic 生态:把零散能力组织成可持续的工作流
人工智能·claude
光算科技14 分钟前
AI重写工具导致‘文本湍流’特征|如何人工消除算法识别标记
大数据·人工智能·算法
合力亿捷-小亿30 分钟前
沉浸式体验店咨询转化难?在智能客服机器人如何把“体验预约→到店→复购”串成一条链路
人工智能·机器人
狼爷32 分钟前
为什么大小公司都在all in AI Agent?这不是炒作,是AI时代的必然突围
人工智能·aigc
qwerasda12385242 分钟前
基于RetinaNet的校园建筑物识别与分类系统研究_1
人工智能·分类·数据挖掘
lfPCB1 小时前
数据决策替代人工判断:AI 重构 PCB 质检标准适配高端电子场景
人工智能·重构
财经三剑客1 小时前
比亚迪2025年销量超460万辆 同比增长7.73%
人工智能·物联网·汽车
love530love1 小时前
EPGF 新手教程 22教学模板不是压缩包:EPGF 如何设计“可复制、可检查、可回收”的课程模板?
ide·人工智能·windows·python·架构·pycharm·epgf