机器学习---自编码器

末世灯光2023-08-10 16:31

自编码器过程

输入一个图片，经过encoder变成一个向量，再通过decoder将这个向量反向生成输入的图片。

这里我们希望输入和输出越接近越好。这个过程我们称为重建。

特点：不需要任何的标注资料。

在2006年这个思想就被提出来了：

常见变形：试图还原加入噪声之前的图片---消除噪声的功能

自编码器不仅用在图像上，也可以用在音频、文本中。

FD技术希望可以在压缩完的数据中分析出对应的信息类型。

应用场景

不可能在实现每一句话都找两个人同时发音记录，我们期望两个人记录一些对话之后就可以训练一个模型，任何语音都可以实现转化。

技术实现：

可以实现将声音和内容进行互换：

应用：Discrete Representation

应用：text as representation

可以实现摘要总结，但是这个摘要属于EN和DN之间的暗号，我们直接查看是看不懂的，所以我们应该怎么做呢？

应用：压缩技术

应用：异常检测