绝美!轮到AI写真爆火了!18种AI视频制作教程;Llama 2微调的极速指南;Nijijourney官方AI绘画课 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!

🤖 摄影写真面临AI技术洗牌,一键生成杂志大片的时代来了

软件:midjourney & Stable Diffusion

模型:moonmix_utopia

人物lora: 老婆真人

后期:PS

Steps: 50, Sampler: DPM++ 2M SDE Karras, CFG scale: 7

随着AI技术不断发展,诸如Midjourney 和 Stable Diffusion 等工具生成的图片质量已经非常高了!在AI创意二维码、文字、证件照之后,AI创意写真也火爆了起来~

以这套「荷叶罗裙一色裁,芙蓉向脸两边开 」的古风人物摄影为例。这些完全由AI生成图片,精美的服饰、优美的姿态、优雅的布局,使得照片非常逼真且极具美感。可见,当前的AI算法已经能捕捉并重现复杂的艺术细节,这对依赖传统服装、妆容来打造古风照片的摄影行业无疑是个巨大的冲击 ⋙ 小红书

🤖 Runway 宣布 Gen-1 和 Gen-2 完全开放,可以免费注册尝试

7月24日,Runway 宣布 Gen-1 和 Gen-2 已经完全开放,任何人都可以注册一个账号免费尝试。需要说明的是,Gen-1 和 Gen-2 是 Runway 研发的两代AI生成系统:

  • Gen-1是第一代系统,可以实现各种图像到图像、文本到图像等生成任务,如文字换脸、视频背景替换等

  • Gen-2是新一代系统,实现了文本到视频的生成,只需要文本描述就可以生成逼真的视频,并且图像生成质量也有了大幅度提高,可以生成更高分辨率和更逼真的图片 ⋙ Runway官网

🤖 Stability AI推出最新图像生成模型 SDXL 1.0,免费在线试玩

在线试玩:clipdrop.co/stable-diff...

7月27日,Stability AI 宣布推出最新的图像生成模型 Stable Diffusion XL 1.0,开源版本可在 GitHub 上获取。

Stable Diffusion 是目前全球使用最广泛的开源文生图模型。本次推出的 Stable Diffusion XL 1.0,是对早期 SDXL 0.9、SDXL Beta 和流行的 V1.5 模型的改进,也是当前图像生成领域最好的开源模型。

如图所示,SDXL 基础模型的性能明显优于之前的变体,并且与细化模块相结合的模型实现了最佳的整体性能 ⋙ 公告 | GitHub

🤖 AI视频创作十八法,超级工具合集让你轻松创作各种形式的视频!

目前,使用AI技术生成视频的工具已经非常多了!这篇文章总结了当前的18种主流方法,并附上了相关教程,非常全面了~

方法一:图片转视频双雄

  1. Runway

  2. Midjourney

方法二:文字生成视频三强

  1. Runway Gen-2

  2. Pikalabs

  3. Zeroscope

方法三:使用Midjourney图片生成视频

  1. 制作3D全景视频

  2. 利用变形功能制作视频

  3. 使用Pan功能生成视频

  4. 使用Zoom Out功能制作一镜到底视频

方法四:使用其他AI软件创作视频

  1. Runway frame interpolation

  2. Genmo

  3. Wonder Studio

  4. Stable Diffusion

  5. Gen-1

  6. ControlNet

  7. Kaiber

  8. Deforum Colab ⋙ 今说新语

🤖 Llama 2微调的极速指南,制作对话摘要生成器

这是一篇极速操作指南,结合代码案例演示了如何使用 Hugging Face 库对 Llama 2 模型进行微调 (fine-tuning),使其成为一个对话摘要生成器,对于 Llama 模型的实际使用具有很好的参考价值。

  1. Download the model :通过 clone Llama 的 inference repo 来下载 Llama 2 的7B模型,并组织好目录结构,准备接下来的转换和训练;这一步获取了基础的Llama 2模型

  2. Convert model to Hugging Face format :使用提供的转换脚本,将原始的 Llama 2 模型转换为 Hugging Face 的格式,方便后续通过 Hugging Face 的 API 进行微调;这一步实现了模型格式的转换,为 fine-tuning 做好了准备

  3. Run the fine-tuning notebook :基于 Hugging Face 的 transformers 库,作者编写了一个 nNotebook,内含了数据集准备、模型加载、设置训练参数等代码,可以直接运行进行对话摘要任务的微调;这一步完成了对话摘要模型的训练

  4. Run inference on your fine-tuned model :由于 Hugging Face 仅保存 adapter 权重,所以需要将经过微调的权重加载到完整 Llama 2 模型中,然后就可以进行推理和生成对话摘要了;这一步实现了利用微调过的模型进行下游任务 ⋙ @Sam L'Huillier

🤖 AI让我变强了!也让我更忙了......

这篇文章的观点很有意思!AI技术和产品的爆发,非但不会取代人类员工,反而会赋能人类,提升工作效率和产出。BUT!个人效率的提升可能会导致企业的进一步压榨。整理下文章核心要点:

  1. 变化,不是替代
  • 历史上,被认为会取代人类的新技术,往往只是改变并增强了人类,AI也将是如此
  1. AI在工作中的应用
  • AI可以增强各个团队的工作效率和产出,例如市场营销、销售、支持、产品和工程等

  • AI释放人力去处理更复杂和关键的问题,也能使游戏的员工更出色

  1. 故事将走向何方
  • AI提高个人效率的结果,可能是公司对员工劳动力的进一步压榨;但这是企业文化的问题,而不是AI技术本身的问题

  • AI浪潮提高了对员工能力和产出的期待,员工需要积极适应变化,并随着时代一起成长 ⋙ 阅读原文

🤖 Nijijourney官方AI绘画课程,艺术修养与绘画理论必修课

Niji 官方最近推出了系列免费的绘画课程 Niji Academy ,将艺术基础与AI技术相结合,补上绘制一张优秀图像所需要的绘画历史、审美熏陶、基础理论等「必修课」,带领读者丝滑进入艺术的领域。

抄写别人已经写好的提示词再缝缝补补,很难真的学会AI绘画。只有见过足够多美的、好看的东西,掌握最基本的原理与基础,才能自己绘制出美图。

目前官网更新了两节课程,但是只有英语和日语版本。幸好!歸藏进行了内容翻译,链接一并附上!一起来刷课呀!

🔔 01测量和抽象的基础知识:绘制一切的理论

sizigi.notion.site/Lesson-1-Fu...

  1. 一切之理论 (为何一切都是美) :这部分讲述了为什么左图不是「真正的艺术」,右图又为什么「无聊」,提出要找到一个包罗万象的艺术理论

  2. 为什么它值得在博物馆里展出? 这部分通过比较乔托的画作和同期的文学作品,说明语言是组织口头信息,艺术是组织视觉信息;当一个想法被良好传达时,不管传达方式,美都会涌现

  3. 意外的文艺复兴:这部分提到了一个reddit社区,探索具有古典感觉的各种艺术作品,说明组织概念对各种媒介都适用

  4. 视觉抽象:这部分通过对句子进行逐步抽象来说明抽象的过程,并给出抽象程度不同的图像例子,说明艺术家需要给予观众足够信息,让他们自己想象

  5. 说服观众相信真相:这部分比较了现实主义和抽象主义这两种辩证方式,以及它们之间的恐怖谷效应

  6. 那么对于超抽象的东西呢 :这部分分析了超抽象艺术难以理解的两个原因,并说明不要过于关注风格,应该学习组织视觉信息的方式 ⋙ 中文学习笔记

🔔 02 终结者(线)

sizigi.notion.site/Lesson-2-Th...

  1. 建立视觉层级:这部分举了拉斐尔的画作为例子,说明使用简单和复杂的区域驱动观看者的视线,形成焦点

  2. 当你有不止一个焦点时会发生什么? 这部分给出了两个焦点竞争视觉优先级的例子,说明焦点的相对层级关系

  3. 当你没有焦点时会发生什么? 这部分给出一个没有焦点的博斯画作为反例,解释这样的画需要仔细观看才能理解

  4. 全能的明暗交界线:这部分介绍了使用明暗交界线来组织图像的方法,在亮和暗两个区域划分细节

  5. 边缘光,终极明暗交界线:这部分展示了边缘光效果作为明暗交界线应用的极致形式

  6. 控制细节的层次 :这部分总结了组织图像的第一步是划分光和影,一切都始于光和影的划分,你可以从明暗交界线看到整个画面 ⋙ 中文学习笔记

🤖 The Document is All You Need!一站式 LLM 底层技术原理入门指南

这是一篇非常「硬核」的飞书文档,面向非科班出身但想要了解AI技术原理的受众,帮助实现零基础入门大语言模型 (Large Language Mode, LLM) 底层技术原理

文档从浅到深,覆盖了非常多内容细节,并在持续更新 LLM 最新技术进展及相关原理!如果你对ChatGPT等大语言模型感兴趣、希望入门了解大语言模型这件事、想知道这个世界上正在发生什么,那这篇文档值得放入你的收藏夹~

  1. Introduction:人工智能概述

  2. 入门 | 多层感知器 Multiple-Layer Perceiver, MLP

  3. 入门 | 卷积神经网络 Convolutional Neural Network, CNN

  4. 入门 | 循环神经网络 Recurrent Neural Networks, RINNS

  5. 入门 | 强化学习 Reinforcement Learning, RL

  6. 入门 | 自然语言处理与语言模型 NLP & LanguageModeI, LM

  7. 开始进入正题!seq2seq模型与注意力机制 Attention! (2014)

  8. RNN 时代的 BERT 和 GPT!Semi-Supervised Sequence Learning:怎么用大量无标注样本去做自监督学习? (2015)

  9. 欢迎来到芝麻街家族!图解ELMo:Embedding的新纪元 (2018.2)

  10. Attention is All You Need!大语言模型的基石 Transfoormer (2017)

  11. ULM-FiT 与多任务学习 Multitask Learning:NLP的 ImageNet 时刻 (2018.5)

  12. 它来了它来了,终于等到你!大篇幅详解 GPT,GPT-2 与 GPT3

  13. 预训练语言模型的新范式:Prompting!

  14. 为什么它诞生之初远比 GPT 出风头?图解芝麻街家族新员BIERT!(2018.10)

  15. 回看波澜壮阔的语言模型乃至 NLP 的发展史! ⋙ 飞书文档

感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!

相关推荐
好奇龙猫1 分钟前
【学习AI-相关路程-mnist手写数字分类-win-硬件:windows-自我学习AI-实验步骤-全连接神经网络(BPnetwork)-操作流程(3) 】
人工智能·算法
沉下心来学鲁班16 分钟前
复现LLM:带你从零认识语言模型
人工智能·语言模型
数据猎手小k16 分钟前
AndroidLab:一个系统化的Android代理框架,包含操作环境和可复现的基准测试,支持大型语言模型和多模态模型。
android·人工智能·机器学习·语言模型
YRr YRr25 分钟前
深度学习:循环神经网络(RNN)详解
人工智能·rnn·深度学习
sp_fyf_202437 分钟前
计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-11-01
人工智能·深度学习·神经网络·算法·机器学习·语言模型·数据挖掘
多吃轻食41 分钟前
大模型微调技术 --> 脉络
人工智能·深度学习·神经网络·自然语言处理·embedding
北京搜维尔科技有限公司1 小时前
搜维尔科技:【应用】Xsens在荷兰车辆管理局人体工程学评估中的应用
人工智能·安全
说私域1 小时前
基于开源 AI 智能名片 S2B2C 商城小程序的视频号交易小程序优化研究
人工智能·小程序·零售
YRr YRr1 小时前
深度学习:Transformer Decoder详解
人工智能·深度学习·transformer
知来者逆2 小时前
研究大语言模型在心理保健智能顾问的有效性和挑战
人工智能·神经网络·机器学习·语言模型·自然语言处理