【昇思初学入门】第四天打卡

数据变换Transforms

心得体会

  1. MindSpore提供了丰富的数据变换工具,针对图像数据可以使用如Rescale、Normalize和HWC2CHW等,且使用Compose类允许我们定义一个变换序列,并将它们作为一个整体应用到数据上。
python 复制代码
composed = transforms.Compose(
    [
        vision.Rescale(1.0 / 255.0, 0),
        vision.Normalize(mean=(0.1307,), std=(0.3081,)),
        vision.HWC2CHW()
    ]
)
train_dataset = train_dataset.map(composed, 'image')
  1. MindSpore 还提供了处理文本数据常用步骤,分词(Tokenize)和词表映射(Lookup)
python 复制代码
# 分词
texts = ['Welcome to Beijing']
test_dataset = GeneratorDataset(texts, 'text')
def my_tokenizer(content):
    return content.split()
test_dataset = test_dataset.map(text.PythonTokenizer(my_tokenizer))
print(next(test_dataset.create_tuple_iterator()))

3.MindSpore 还支持Lambda函数对数据进行自定义处理

python 复制代码
test_dataset.map(lambda x: x * 2)
相关推荐
OpenCSG几秒前
XNet :面向大模型与数据集的块级存储与传输能力
人工智能·开源·opencsg·agentichub
文档伴侣1 分钟前
体验访答:我的私有知识库新选择
人工智能·aigc·ocr
海边夕阳20061 分钟前
【每天一个AI小知识】:什么是自注意力?
人工智能·经验分享·机器学习·强化学习·自注意力
DX_水位流量监测7 分钟前
城市易涝点水位雨量监测设备技术体系与实践应用
大数据·运维·服务器·网络·人工智能
2501_921649499 分钟前
日本股票 API 对接,接入东京证券交易所(TSE)实现 K 线 MACD 指标
大数据·人工智能·python·websocket·金融
weixin_4462608511 分钟前
探索大语言模型:基础知识与应用指南
人工智能·语言模型·自然语言处理
大山同学11 分钟前
薄膜透光度原理
linux·运维·人工智能
J_Xiong011712 分钟前
【VLMs篇】11:用于端到端目标检测的可变形Transformers(Deformable DETR)
人工智能·深度学习·目标检测
SEO_juper13 分钟前
谷歌AI搜索模式全景图:深度解析它如何重塑搜索生态与排名逻辑
人工智能·ai·数字营销
掘金酱13 分钟前
🏆2025 AI/Vibe Coding 对我的影响 | 年终技术征文
前端·人工智能·后端