AGI自学分享,简单有用的理论与实践

开始必备

谷歌邮箱

没有谷歌邮箱简直"寸步难行"。

GitHub · Build and ship software on a single, collaborative platform · GitHub

GitHub上有所有开源项目的源代码,当然还有许许多多资源的分享。

huggingface

huggingface上的space可以试用许多模型demo,当然也可以下载众多的模型。

通往AGI之路

通过AGI之路

包含了AI生成内容的所有方面,教程与资源,文本,绘画,视频,语音,音乐...

这样超大集合网站,推荐先粗略看看每种AGI是做什么,然后专注到某一个方面学习。

并不推荐分散精力什么都去看看,太多太杂真的劝退人,还是去看最想看的东西。

AIGC知识库

Wiki

AI之旅工具导航

AI之旅 | 为用户提供全面的AI工具和资源导航平台

包含了AI各种实用工具的导航网站,既可以直接用,也能用来学习目前"AI到底能做什么"。

AI文本

目前生成内容应用最广泛的AI应用,也是大模型名称来源,所谓Large Language Models,也就ChatGTP等文本对话应用,不同于之前,对话AI目前的差距并没有天壤之别了,对于多数常见区别不大。

做什么
  • 询问办法:你只需要提出需求,给出它专业身份,它会给出主流办法,比如如何实现批量解压压缩包。
  • 解释技术:特别是计算机相关的知识,因为网络资源丰富,GTP非常擅长而且专业,比如解释transformer。
  • 工具编程:GTP对于简单的需求已经能够非常好实现了,比如写一个python处理数据输出excel,bash批量解压。
  • 推荐工具:直接告诉它你要做什么,让它直接给出相关工具的网址。
  • ....
应用网站

https://poe.com/

poe:各种GTP导航网站,主要是可以用ChatGTP-mini很多次。

Kimi.ai - 会推理解析,能深度思考的AI助手

kimi:长文本对话,一个对话框可以上下文聊很多很多,支持读取图片内容,可以联网搜索。

智谱清言

智谱清言:多模态AI,文本,绘画,视频都可以尝试。

Prompt

结构化Prompt模板与技巧 | GPTPMT

深入浅出学习如何写一个prompt,了解必要的AI对话基本概念,也是AI智能体的基础。

云中江树的prompt

超大合集资源,可以看看各种专业的prompt是如何写的,但我感觉没必要那么复杂。

理论原理

GTP发展历程

你可以看看GTP的发展历程,了解GTP的训练过程,也是神经网络和机器学习的通用过程,了解模型的训练过程有助于明白数据标注在做什么,当然更有利于使用GTP这件事情,写出更准确的prompt。

Generative AI exists because of the transformer

这里你可以深入浅出的了解GTP到底是如何处理你的输入,给出它的输出(精致的动画演示),而且还有更为重要的算法核心-transformer。是一种神经网络,是大模型真正实用的开端。

transformer到底是如何工作的

解释transformer是如何工作的,说不上研究算法,但对使用GTP有更交心的对话体验。

AI绘画

面向创造最成熟的AI应用,无论是工作还是娱乐,都可以。

做什么
  • 媒体编辑配图,再也不用各种费尽心思寻找,独一无二又简单方便。
  • 分享灵感观点,再怎么说也不如给出一个草图来的直接。
  • 创造艺术分享,不会画画的我终于可以创造脑海想法了,表达审美。
  • ....
应用网站

目前主流是midjourney和stable diffusion。下面只是官方网站,并不能直接使用。

Sign in to Diffus

https://www.midjourney.com/home

不同于文本应用的点击即用,AI绘画需要巨大的计算性能,还要复杂的配置参数,对于只想简单表达想法小白真是复杂呀,所以我主要推荐一些点击即用的model,但也足够了日常使用了。

下面的网址是huggingface上space免费的试用接口,点击即用。

https://dreamstudio.ai/generate

stable diffusion demo

midjourney demo

able diffusion的试用model更为强大,模型效果更好。但并不是说那个模型更好,AI绘画相对AI文本复杂很多,绘画效果不仅跟使用的底层模型,还有调优模型,还有prompt,还有许许多多的参数有关。

Prompt

对于AI绘画简单使用者,prompt可比模型如何配置重要的多。

prompt的关键还是自己多尝试,找到"词语的实际感觉"

AI绘画分享社区,prompt

对于第一次的新手,模仿才是最快的理解方式,去看别人的prompt结构。

这份 Stable diffusion 提示词攻略,记得收好了! - 大模型知识库|大模型训练|开箱即用的企业大模型应用平台|智能体开发|53AI

简单但实用的入门教程。

开源图像模型Stable Diffusion入门手册

https://proximacentaurib.notion.site/e28a4f8d97724f14a784a538b8589e7d?v=ab624266c6a44413b42a6c57a41d828c

全面可以参考的艺术家风格。

全面介绍stablediffusion各方面的参数,包括如何生成原理和prompt书写原则。

https://prompt.qpipi.com/

上面链接是在线的提示词选择网站,基本够用了。

理论原理

stable diffusion工作原理

stablediffusion是如何工作的,也是AI绘画通用的原理。

Docs

stable diffusion技术完整解读

深入浅出,全面完整各方面专业的stable diffusion技术解读。

AI语音

应用已经非常成熟了,模仿人的声音,还是变声。

语音合成(TTS)技术原理简介:如何一步步将文字变成语音-腾讯云开发者社区-腾讯云

做什么
  • 数字人+语音生成AI视频。
  • AI声音对视频配音。
  • 模仿特定人物声音娱乐。
  • ...
应用网站

不同于AI文本和AI绘画,需要自己提供素材进行训练。要么使用别人训练好的模型,也就是对应的角色声音,要么就只能自己训练模型,从步骤上说更加复杂。

https://gsv.acgnai.top/

上面可以输入参考文本合成原神和星穹铁道的角色语音。可以发现很受制于人。如果想要其他声音只能不断寻找别人训练好的网站,更现实的是自己训练。

当然如果只是体验完全足够了。

Text To Speech - 在线文本转语音

上面这个在线网站,有多种人声可以合成10000字文本,可以用于配音等等。

GitHub - LokerL/tts-vue: 🎤 微软语音合成工具,使用 Electron + Vue + ElementPlus + Vite 构建。

上面这个软件本地使用

理论原理

此处为语雀内容卡片,点击链接查看:整合包教程 · 语雀

一个通用的TTS训练过程。

相关推荐
美酒没故事°20 小时前
Open WebUI安装指南。搭建自己的自托管 AI 平台
人工智能·windows·ai
鸿乃江边鸟20 小时前
Nanobot 从onboard启动命令来看个人助理Agent的实现
人工智能·ai
本旺21 小时前
【Openclaw 】完美解决 Codex 认证失败
ai·codex·openclaw·小龙虾·gpt5.4
张張40821 小时前
(域格)环境搭建和编译
c语言·开发语言·python·ai
乐鑫科技 Espressif1 天前
使用 MCP 服务器,把乐鑫文档接入 AI 工作流
人工智能·ai·esp32·乐鑫科技
语戚1 天前
Stable Diffusion 入门:架构、空间与生成流程概览
人工智能·ai·stable diffusion·aigc·模型
俊哥V1 天前
每日 AI 研究简报 · 2026-04-08
人工智能·ai
rrrjqy1 天前
什么是RAG?
ai
Flittly1 天前
【SpringAIAlibaba新手村系列】(15)MCP Client 调用本地服务
java·笔记·spring·ai·springboot