自编码器过程

输入一个图片,经过encoder变成一个向量,再通过decoder将这个向量反向生成输入的图片。
这里我们希望输入和输出越接近越好。这个过程我们称为重建。
特点:不需要任何的标注资料。
在2006年这个思想就被提出来了:

常见变形:试图还原加入噪声之前的图片---消除噪声的功能


自编码器不仅用在图像上,也可以用在音频、文本中。

FD技术希望可以在压缩完的数据中分析出对应的信息类型。

应用场景

不可能在实现每一句话都找两个人同时发音记录,我们期望两个人记录一些对话之后就可以训练一个模型,任何语音都可以实现转化。

技术实现:

可以实现将声音和内容进行互换:

应用:Discrete Representation


应用:text as representation

可以实现摘要总结,但是这个摘要属于EN和DN之间的暗号,我们直接查看是看不懂的,所以我们应该怎么做呢?

应用:压缩技术

应用:异常检测


