最完整的全球生成式AI生态地图；900+LLM开源工具清单与我的观察；我开发了Devin平替，6个月的血泪经验；月之暗面新一轮内测

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦！

🉑 国内外大模型近期进展汇总：乱花渐欲迷人眼

🔔 月之暗面

3月18日，月之暗面 (Moonshot AI) 宣布启动 200 万字无损上下文 内测，几十万字的经典德州扑克长篇教程、近百万字中医诊疗手册、上市公司的所有完整财报、代码仓库里的源代码...... Kimi 都能轻松拿捏~

网站首页第一条，点击就会弹出预约框，快来一起排队吧 ⋙ 官方发布 | 申请内测

🔔 Grok

3月18日，Elon Musk (马斯克) 如约开源其 x.ai 公司的大模型 Grok，模型参数 314B (3140 亿，目前最大的)，模型架构也是 MoE，而且是在深度学习框架 JAX 上用 Rust 编程语言从头搭建并训练的。采用 Apache 2.0 license 协议，对商用友好。

如果你想部署这个大模型，那大概需要 5~~8 块 H100 🤪 这个巨无霸对普通用户的硬件设备可不算友好~~ ⋙ 了解更多 | 官方网站

🔔 零一万物

零一万物最近非常活跃。3月17日 ⋙ 开放笛卡尔 (Descartes) 向量数据库搜索内核，免费商用，3月6日 ⋙ 发布并开源 Yi-9B，代码和数学能力出色，综合实力强劲 | 官方网站

尤其需要注意的是，零一万物正式发布了 Yi 大模型 API 开放平台 👆，并且提供 Yi-34B-Chat-0205、Yi-34B-Chat-200K、Yi-VL-Plus 等模型。新用户注册即赠送 60 元，朋友们记得薅一下 🎁 | API开放平台

🔔 讯飞智文

3月14日，讯飞开放了一个新的 AIGC 工具「讯飞智文」，可以基于大模型一键生成Word、PPT 文档。注册即可使用，效果算是OK能用的水平 (大多数 PPT 生成类产品都在这个水平线) ⋙ 官方发布 | 官方网站

🔔 DeepSeekVL

3月11日，幻方旗下 DeepSeek 发布多模态大模型「DeepSeekVL」，即通用视觉语言理解模型，包含 7B、1.3B 两个版本。

据说效果超越了同规模（7B 参数）的 EMU2-Chat / Yi-VL 等模型，甚至超过更大规模（17B 参数）的 CogVLM ⋙ 官方发布 | GitHub

🔔 爱诗视频大模型

3月11日，爱诗科技宣布完成亿级人民币的A1轮融资，并开放国内版「爱诗视频大模型」的内测。👆 点击上方链接申请参与内测。

PixVerse 是其海外版产品，已经于2024年1月上线发布，效果还是挺不错的！所以，国内版的内测，朋友们要积极一点哇~ ⋙ 官方发布 | 申请内测

🉑 a16z 发布最受欢迎的 100 个 GenAI 应用：风起云涌，瞬息万变

a16z (全称Andreessen Horowitz) 是一家知名的美国风投公司，发布的AI行业观察的质量都非常高。上周，a16z 发布了最新的报告，统计了截止2024年1月最受欢迎的 GenAI (生成式人工智能) 应用，包含 Web 端 TOP50 & 移动端 TOP50。

↑ Web端数据来源：SimilarWeb (截至2024年1月)

↑ 移动端数据来源：Sensor Tower (截至2024年1月)
a16z.com/100-gen-ai-...

原文对这100个应用进行了各种维度的分析，并与去年9月份的排名进行了对比。以下是一些核心数据分析结果：

1 . 进步的速度：六个月内有22个新成员

ChatGPT 月度网络访问量接近20亿，是排名第二的 Bard (现更名为Gemini) 的5倍左右。
在过去的六个月中，有 22 家公司新进入网络流量排名 👆如上图，表明AI领域正在快速发展，新企业正在不断涌现。

2 . 新类别的出现：音乐、生产力工具

音乐 & 生产力工具，是AI应用中的2个新兴类别，其中 Suno 是唯一一个上榜的音乐公司。
生产力工具类别包括 Liner、Eightify、Phind、MaxAI、Blackbox AI、Otter.ai 和 ChatPDF。

3 . AI伴侣关系迎来增长高峰

AI伴侣已成为一个主流AI分类，从两个月前的2家公司增长到现在的8家。
用户对标榜「没有审查」的AI陪伴应用更为喜爱，并且在移动应用里异常活跃度，甚至已经成为了日常生活的一部分

4 . 网络端与移动端差异的背后原因

网络产品更倾向于支持复杂的多步骤工作流程产品；移动应用的使用则倾向于通用助手，并且可以在应用商店中通过优化和广告迅速获得优势。

此外，原文有一个观察和总结非常有趣，指出 Discord 社区已经成为了AI产品的试练场 ------开发者在 Discord 里可以快速构建并验证产品 (省了很多开发工作)，获得用户基础和反馈后再发展成为独立的产品。

上图中的AI产品都诞生自 Discord，并且快速攀升到了 Discord 服务器的前 100 名，其中就包括我们熟知的 Midjourney、Suno、Pika 等。

🉑 2024 全球生成式AI生态地图：那些已经取得突破的国家和公司

www.blog.aiport.tech/p/the-first...

高清图&高清PDF文档，前往星球(或社群)获取

这应该是第一份真正意义上的「全球生成式AI生态地图 (Global Generative AI Landscape 2024)」，整理了在 GenAI 领域取得突破性进展的国家和公司，并进行了统计分类。

1 . GenAI 解决方案的类型 (10类)：文本，音频，视频，聊天机器人，图像，游戏，商业智能，代码，3D渲染、多模态

2 . 按照地理位置分类：

北美洲：38家公司
欧洲：17个国家 (排名靠前的包括英国、法国、德国、荷兰、奥地利和俄罗斯等)，27家公司
亚洲：11个国家 (排名靠前的包括以色列、中国、印度、新加坡和日本等)，28家公司
非洲/大洋洲/南美洲：5个国家 (肯尼亚、南非、新西兰、澳大利亚、阿根廷)，8家公司

3 . 按照公司包含的模型类别：

5种：Stability AI (图像，视频，音频，3D，代码)
4种：OpenAI (聊天机器人，音频，视频，多模态)，Google (文本，图像，音频，多模态)
3种：Microsoft、Meta、Tencent (腾讯)、Baidu (百度)、Yandex

4 . 单一类别内开发多个模型的公司:

AssemblyAI: 拥有两个语音转文本模型
MosaicML: 提供了两个版本的MPT，用于代码生成
IPOXCap: 推出了两个为商业智能应用设计的聊天机器人

5 . 实现多模态的公司:

大约10%的公司在其GenAI模型中实现了多模态功能，这意味着这些模型能够同时处理和理解多种类型的数据输入，如文本、图像、音频和视频。
大多数实现多模态的公司位于美国，其中北美有8个多模态模型，而欧洲只有2个。

原文提到的 Global AI index，是英国传媒机构 Tortoise Media 在2023年发布的一项全球AI指数排名，一共包含62个国家，感兴趣可以前往下方网站查看详情 👇

www.tortoisemedia.com/intelligenc...

🉑 QuestMobile 2024 生成式人工智能 (AIGC) App 应用洞察报告

国外喜欢用「生成式人工智能 (GenAI) 」，咱国内更习惯的表达是「AIGC」。QuestMobile 最近发布了一份国内 GenAI / AIGC App 应用的数据分析报告，展示了头部 App 的增长情况、月活数据、用户画像等关键内容。

节选几张关键图表和数据解释，感兴趣可以 ⋙ 阅读原文

用户对 AIGC 报以极大热情，独立App的需求持续增长，TOP10 App去重用户规模同比增长37倍。

头部 AIGC App的聚合用户多为男性，年龄集中在25-45岁，位于三线及以上城市，同时具备较高消费意愿与消费能力。

现阶段头部应用普遍聚焦在文本和图像信息模态生成；豆包、文心一言以千万月活的用户规模"领跑"，其次是天工、扮伴-AI绘画及讯飞星火。

但需要主义的是，用户的活跃率低 (均低于 20%)，忠诚度低 (3日留存均低于 50%)，流失风险高 (部分卸载率超过 50%)。

各大内容平台上开始出现 AIGC 内容，包括通过AI创作的高质量文章、图片、短视频等，形成社区效应和自发性流量增长。在这些平台 AIGC 内容里，用户更喜欢金融财经、企业、二次元、科技科普等主题的内容

🉑 我收集了 900 多个开源 GenAI / GPT / LLM 工具，然后进行了一番研究

huyenchip.com/llama-polic...

这是一份LLM开源项目 清单，目前包含 937 个项目，而且还在以每天4次的频率更新中 (每6个小时更新一次)。表单支持搜索和分类查找，感兴趣可以收藏~

huyenchip.com/2024/03/14/...

这份表单的作者，在 👆 这篇文章里介绍了数据来源，即通过 GitHub 搜索关键词gpt、llm和generative ai，然后筛选出超过 500 Star 的仓库。

作者对这 900 多个开源工具进行了非常多维度的分析，有很多有趣的细节。以下是分析要点，感兴趣可以阅读原文哦！

AI技术栈的四个层次

应用程序 Applications：基于现有模型构建的开源应用程序，如编程、工作流自动化、信息聚合等。
应用开发 Application development：在现有模型基础上开发应用程序，涉及提示工程、RAG、AI接口等。
模型开发 Model development：提供开发和训练模型的工具，涉及框架、推理优化、数据集工程和评估等。
基础设施 Infrastructure：包括服务工具、计算管理、向量搜索、数据库等。

AI技术栈的发展趋势

2023年新工具爆炸性增长，特别是 Stable Diffusion 和 ChatGPT 问世之后。
其中，应用程序(紫色) 和 应用开发层(红色) 增长最为显著，基础设施层 (蓝色) 增长较小。
对应用程序进行分类，可以看到占比从高到底分别为：编程、机器人、信息聚合、图像生成、工作流自动化、写作

开源AI开发者的贡献

多个账户拥有4个以上的 500 Star 仓库，上图左是其中的 TOP20，可以看到基本都是知名企业账户 (其中3个属于 Google)
个人账户在应用程序层中的比例较高，在基础设施层中较少。

中国开源生态系统的崛起

已经有许多AI仓库是专门面向中文用户群体的，这说明 GitHub 在中国用户中已经已经非常普遍。
需要注意的是，GitHub排名前20的账户中，有6个来自于中国。

快速增长后无人问津

许多项目在短时间内获得了巨量的关注，但是很快又归于沉寂，作者和朋友们称其为「炒作曲线 (hype curve)」。
这种现象并不罕见，大致规律是：发布初期由于新颖性或解决了某个热门问题，迅速吸引大量用户和开发者的关注；随后在社交媒体、技术论坛和新闻中传播并形成热潮，吸引更多开发者参与其中；随着时间推移，项目由于未能满足期望或停止维护等原因，热度逐渐消散。

🉑 用6个月开发代码生成工具「GPT Pilot」，这是开发者的精华笔记

github.com/Pythagora-i...

GPT Pilot 是一款代码生成工具，与最近大火的「Devin」相似但弱一些：能够独立规划任务并启动编程，能在遇到困难时向人类寻求帮助。

不同于 Devin 的高度智能化，GPT Pilot 更像是一位需要指导的初级程序员。

blog.pythagora.ai/2024/02/19/...

作者在完成 GPT Pilot 后，真的用它开发了几款应用！而这些开发工作整整花费了6个月的时间。作者将经验和心得整理成了如下的笔记：

GPT Pilot的核心理念

人工智能的人类监督：为了确保开发方向的正确性，并根据实际开发结果进行调整，人工智能需要人类的监督和指导。
错误修正的迭代能力：GPT Pilot能够执行代码，检查输出结果，并根据 LLM 的反馈进行必要的修正。
软件开发的流程编排：借助LLM的智能决策能力，可以对开发过程中的重复任务进行有效编排。
编码的非线性特性：编码过程中常常涉及到代码的重构，GPT Pilot需要能够灵活选择不同的实现路径，以适应这些变化。

实践中的深刻洞察

应用初始描述的关键性：一个精确的初始描述对于GPT Pilot的整个思考和执行过程至关重要。
代码重构的必要性：GPT Pilot也需要具备代码重构的能力，以应对开发过程中的各种挑战。
自我审查的代理机制：通过不同的"审查者"代理对代码实现进行审查，可以有效提升开发效率。
专注单一问题的LLM优势：LLM在集中精力解决单一问题时表现更为出色，因此应避免在单个提示中包含多个问题。
日志记录的重要性：GPT-4创建的代码包含详细的日志记录，这对于调试工作至关重要。
代码库的模块化：将代码库划分为多个小文件，有助于GPT-4更好地实现功能和修复错误。
代码和思路的清晰展示：为了让人类能够有效地修正GPT Pilot编写的代码，必须清晰地展示代码内容及其背后的逻辑。
利用人类的惰性：人们更倾向于回答具体问题，而不是提供开放式的反馈。
激发LLM的创新思维：要让LLM跳出常规思维模式，需要给出明确的指导和具体的解决方案。

GPT Pilot 实际应用案例

Prompt Lab：这是一个功能强大的对话运行和分析工具，可以帮助用户深入理解和优化提示词。耗时2天。
SQLite数据库分析工具：一个内部工具，专门用于分析SQLite数据库，以便更好地理解和优化数据结构。耗时2天。
Code Whisperer：一个展示项目，用户可以通过它向LLM咨询有关代码库的问题，从而获得深入的代码分析和建议。耗时7小时。
Star History：一个工具，用于比较Github仓库的 Star 增长速度，并且提供可缩放的图表展示，帮助开发者了解项目的发展动态。耗时6小时。

感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们！

◉ 点击 👀日报&周刊合集，订阅话题 #ShowMeAI日报，一览AI领域发展前沿，抓住最新发展机会！

◉ 点击 🎡生产力工具与行业应用大全，一起在信息浪潮里扑腾起来吧！

最完整的全球生成式AI生态地图；900+LLM开源工具清单与我的观察；我开发了Devin平替，6个月的血泪经验；月之暗面新一轮内测 | ShowMeAI日报