AGI自学分享，简单有用的理论与实践

开始必备

谷歌邮箱

没有谷歌邮箱简直"寸步难行"。

GitHub · Build and ship software on a single, collaborative platform · GitHub

GitHub上有所有开源项目的源代码，当然还有许许多多资源的分享。

huggingface

huggingface上的space可以试用许多模型demo，当然也可以下载众多的模型。

通往AGI之路

通过AGI之路

包含了AI生成内容的所有方面，教程与资源，文本，绘画，视频，语音，音乐...

这样超大集合网站，推荐先粗略看看每种AGI是做什么，然后专注到某一个方面学习。

并不推荐分散精力什么都去看看，太多太杂真的劝退人，还是去看最想看的东西。

AIGC知识库

Wiki

AI之旅工具导航

AI之旅 | 为用户提供全面的AI工具和资源导航平台

包含了AI各种实用工具的导航网站，既可以直接用，也能用来学习目前"AI到底能做什么"。

AI文本

目前生成内容应用最广泛的AI应用，也是大模型名称来源，所谓Large Language Models，也就ChatGTP等文本对话应用，不同于之前，对话AI目前的差距并没有天壤之别了，对于多数常见区别不大。

做什么

询问办法：你只需要提出需求，给出它专业身份，它会给出主流办法，比如如何实现批量解压压缩包。
解释技术：特别是计算机相关的知识，因为网络资源丰富，GTP非常擅长而且专业，比如解释transformer。
工具编程：GTP对于简单的需求已经能够非常好实现了，比如写一个python处理数据输出excel，bash批量解压。
推荐工具：直接告诉它你要做什么，让它直接给出相关工具的网址。
....

应用网站

https://poe.com/

poe：各种GTP导航网站，主要是可以用ChatGTP-mini很多次。

Kimi.ai - 会推理解析，能深度思考的AI助手

kimi：长文本对话，一个对话框可以上下文聊很多很多，支持读取图片内容，可以联网搜索。

智谱清言

智谱清言：多模态AI，文本，绘画，视频都可以尝试。

Prompt

结构化Prompt模板与技巧 | GPTPMT

深入浅出学习如何写一个prompt，了解必要的AI对话基本概念，也是AI智能体的基础。

云中江树的prompt

超大合集资源，可以看看各种专业的prompt是如何写的，但我感觉没必要那么复杂。

理论原理

GTP发展历程

你可以看看GTP的发展历程，了解GTP的训练过程，也是神经网络和机器学习的通用过程，了解模型的训练过程有助于明白数据标注在做什么，当然更有利于使用GTP这件事情，写出更准确的prompt。

Generative AI exists because of the transformer

这里你可以深入浅出的了解GTP到底是如何处理你的输入，给出它的输出（精致的动画演示），而且还有更为重要的算法核心-transformer。是一种神经网络，是大模型真正实用的开端。

transformer到底是如何工作的

解释transformer是如何工作的，说不上研究算法，但对使用GTP有更交心的对话体验。

AI绘画

面向创造最成熟的AI应用，无论是工作还是娱乐，都可以。

做什么

媒体编辑配图，再也不用各种费尽心思寻找，独一无二又简单方便。
分享灵感观点，再怎么说也不如给出一个草图来的直接。
创造艺术分享，不会画画的我终于可以创造脑海想法了，表达审美。
....

应用网站

目前主流是midjourney和stable diffusion。下面只是官方网站，并不能直接使用。

https://www.midjourney.com/home

不同于文本应用的点击即用，AI绘画需要巨大的计算性能，还要复杂的配置参数，对于只想简单表达想法小白真是复杂呀，所以我主要推荐一些点击即用的model，但也足够了日常使用了。

下面的网址是huggingface上space免费的试用接口，点击即用。

https://dreamstudio.ai/generate

stable diffusion demo

midjourney demo

able diffusion的试用model更为强大，模型效果更好。但并不是说那个模型更好，AI绘画相对AI文本复杂很多，绘画效果不仅跟使用的底层模型，还有调优模型，还有prompt，还有许许多多的参数有关。

Prompt

对于AI绘画简单使用者，prompt可比模型如何配置重要的多。

prompt的关键还是自己多尝试，找到"词语的实际感觉"

AI绘画分享社区，prompt

对于第一次的新手，模仿才是最快的理解方式，去看别人的prompt结构。

这份 Stable diffusion 提示词攻略，记得收好了！ - 大模型知识库|大模型训练|开箱即用的企业大模型应用平台|智能体开发|53AI

简单但实用的入门教程。

开源图像模型Stable Diffusion入门手册

https://proximacentaurib.notion.site/e28a4f8d97724f14a784a538b8589e7d?v=ab624266c6a44413b42a6c57a41d828c

全面可以参考的艺术家风格。

全面介绍stablediffusion各方面的参数，包括如何生成原理和prompt书写原则。

https://prompt.qpipi.com/

上面链接是在线的提示词选择网站，基本够用了。

理论原理

stable diffusion工作原理

stablediffusion是如何工作的，也是AI绘画通用的原理。

Docs

stable diffusion技术完整解读

深入浅出，全面完整各方面专业的stable diffusion技术解读。

AI语音

应用已经非常成熟了，模仿人的声音，还是变声。

语音合成（TTS）技术原理简介：如何一步步将文字变成语音-腾讯云开发者社区-腾讯云

做什么

数字人+语音生成AI视频。
AI声音对视频配音。
模仿特定人物声音娱乐。
...

应用网站

不同于AI文本和AI绘画，需要自己提供素材进行训练。要么使用别人训练好的模型，也就是对应的角色声音，要么就只能自己训练模型，从步骤上说更加复杂。

https://gsv.acgnai.top/

上面可以输入参考文本合成原神和星穹铁道的角色语音。可以发现很受制于人。如果想要其他声音只能不断寻找别人训练好的网站，更现实的是自己训练。

当然如果只是体验完全足够了。

Text To Speech - 在线文本转语音

上面这个在线网站，有多种人声可以合成10000字文本，可以用于配音等等。

GitHub - LokerL/tts-vue: 🎤 微软语音合成工具，使用 Electron + Vue + ElementPlus + Vite 构建。

上面这个软件本地使用

理论原理

此处为语雀内容卡片，点击链接查看：整合包教程 · 语雀

一个通用的TTS训练过程。