👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!
🉑 国内外大模型近期进展汇总:乱花渐欲迷人眼
🔔 月之暗面
3月18日,月之暗面 (Moonshot AI) 宣布启动 200 万字无损上下文 内测,几十万字的经典德州扑克长篇教程、近百万字中医诊疗手册、上市公司的所有完整财报、代码仓库里的源代码...... Kimi 都能轻松拿捏~
网站首页第一条,点击就会弹出预约框,快来一起排队吧 ⋙ 官方发布 | 申请内测
🔔 Grok
3月18日,Elon Musk (马斯克) 如约开源其 x.ai 公司的大模型 Grok,模型参数 314B (3140 亿,目前最大的),模型架构也是 MoE,而且是在深度学习框架 JAX 上用 Rust 编程语言从头搭建并训练的。采用 Apache 2.0 license 协议,对商用友好。
如果你想部署这个大模型,那大概需要 58 块 H100 🤪 这个巨无霸对普通用户的硬件设备可不算友好 ⋙ 了解更多 | 官方网站
🔔 零一万物
零一万物最近非常活跃。3月17日 ⋙ 开放笛卡尔 (Descartes) 向量数据库搜索内核,免费商用,3月6日 ⋙ 发布并开源 Yi-9B,代码和数学能力出色,综合实力强劲 | 官方网站
尤其需要注意的是,零一万物正式发布了 Yi 大模型 API 开放平台 👆,并且提供 Yi-34B-Chat-0205、Yi-34B-Chat-200K、Yi-VL-Plus 等模型。新用户注册即赠送 60 元,朋友们记得薅一下 🎁 | API开放平台
🔔 讯飞智文
3月14日,讯飞开放了一个新的 AIGC 工具「讯飞智文」,可以基于大模型一键生成Word、PPT 文档。注册即可使用,效果算是OK能用的水平 (大多数 PPT 生成类产品都在这个水平线) ⋙ 官方发布 | 官方网站
🔔 DeepSeekVL
3月11日,幻方旗下 DeepSeek 发布多模态大模型「DeepSeekVL」,即通用视觉语言理解模型,包含 7B、1.3B 两个版本。
据说效果超越了同规模(7B 参数)的 EMU2-Chat / Yi-VL 等模型,甚至超过更大规模(17B 参数)的 CogVLM ⋙ 官方发布 | GitHub
🔔 爱诗视频大模型
3月11日,爱诗科技宣布完成亿级人民币的A1轮融资,并开放国内版「爱诗视频大模型」的内测。👆 点击上方链接申请参与内测。
PixVerse 是其海外版产品,已经于2024年1月上线发布,效果还是挺不错的!所以,国内版的内测,朋友们要积极一点哇~ ⋙ 官方发布 | 申请内测
🉑 a16z 发布最受欢迎的 100 个 GenAI 应用:风起云涌,瞬息万变
a16z (全称Andreessen Horowitz) 是一家知名的美国风投公司,发布的AI行业观察的质量都非常高。上周,a16z 发布了最新的报告,统计了截止2024年1月最受欢迎的 GenAI (生成式人工智能) 应用,包含 Web 端 TOP50 & 移动端 TOP50。
↑ Web端数据来源:SimilarWeb (截至2024年1月)
↑ 移动端数据来源:Sensor Tower (截至2024年1月)
a16z.com/100-gen-ai-...
原文对这100个应用进行了各种维度的分析,并与去年9月份的排名进行了对比。以下是一些核心数据分析结果:
1 . 进步的速度:六个月内有22个新成员
-
ChatGPT 月度网络访问量接近20亿,是排名第二的 Bard (现更名为Gemini) 的5倍左右。
-
在过去的六个月中,有 22 家公司新进入网络流量排名 👆如上图,表明AI领域正在快速发展,新企业正在不断涌现。
2 . 新类别的出现:音乐、生产力工具
-
音乐 & 生产力工具,是AI应用中的2个新兴类别,其中 Suno 是唯一一个上榜的音乐公司。
-
生产力工具类别包括 Liner、Eightify、Phind、MaxAI、Blackbox AI、Otter.ai 和 ChatPDF。
3 . AI伴侣关系迎来增长高峰
-
AI伴侣已成为一个主流AI分类,从两个月前的2家公司增长到现在的8家。
-
用户对标榜「没有审查」的AI陪伴应用更为喜爱,并且在移动应用里异常活跃度,甚至已经成为了日常生活的一部分
4 . 网络端与移动端差异的背后原因
- 网络产品更倾向于支持复杂的多步骤工作流程产品;移动应用的使用则倾向于通用助手,并且可以在应用商店中通过优化和广告迅速获得优势。
此外,原文有一个观察和总结非常有趣,指出 Discord 社区已经成为了AI产品的试练场 ------开发者在 Discord 里可以快速构建并验证产品 (省了很多开发工作),获得用户基础和反馈后再发展成为独立的产品。
上图中的AI产品都诞生自 Discord,并且快速攀升到了 Discord 服务器的前 100 名,其中就包括我们熟知的 Midjourney、Suno、Pika 等。
🉑 2024 全球生成式AI生态地图:那些已经取得突破的国家和公司
www.blog.aiport.tech/p/the-first...
高清图&高清PDF文档,前往星球(或社群)获取
这应该是第一份真正意义上的「全球生成式AI生态地图 (Global Generative AI Landscape 2024)」,整理了在 GenAI 领域取得突破性进展的国家和公司,并进行了统计分类。
1 . GenAI 解决方案的类型 (10类):文本,音频,视频,聊天机器人,图像,游戏,商业智能,代码,3D渲染、多模态
2 . 按照地理位置分类:
-
北美洲:38家公司
-
欧洲:17个国家 (排名靠前的包括英国、法国、德国、荷兰、奥地利和俄罗斯等),27家公司
-
亚洲:11个国家 (排名靠前的包括以色列、中国、印度、新加坡和日本等),28家公司
-
非洲/大洋洲/南美洲:5个国家 (肯尼亚、南非、新西兰、澳大利亚、阿根廷),8家公司
3 . 按照公司包含的模型类别:
-
5种:Stability AI (图像,视频,音频,3D,代码)
-
4种:OpenAI (聊天机器人,音频,视频,多模态),Google (文本,图像,音频,多模态)
-
3种:Microsoft、Meta、Tencent (腾讯)、Baidu (百度)、Yandex
4 . 单一类别内开发多个模型的公司:
-
AssemblyAI: 拥有两个语音转文本模型
-
MosaicML: 提供了两个版本的MPT,用于代码生成
-
IPOXCap: 推出了两个为商业智能应用设计的聊天机器人
5 . 实现多模态的公司:
-
大约10%的公司在其GenAI模型中实现了多模态功能,这意味着这些模型能够同时处理和理解多种类型的数据输入,如文本、图像、音频和视频。
-
大多数实现多模态的公司位于美国,其中北美有8个多模态模型,而欧洲只有2个。
原文提到的 Global AI index,是英国传媒机构 Tortoise Media 在2023年发布的一项全球AI指数排名,一共包含62个国家,感兴趣可以前往下方网站查看详情 👇
🉑 QuestMobile 2024 生成式人工智能 (AIGC) App 应用洞察报告
国外喜欢用「生成式人工智能 (GenAI) 」,咱国内更习惯的表达是「AIGC」。QuestMobile 最近发布了一份国内 GenAI / AIGC App 应用的数据分析报告,展示了头部 App 的增长情况、月活数据、用户画像等关键内容。
节选几张关键图表和数据解释,感兴趣可以 ⋙ 阅读原文
用户对 AIGC 报以极大热情,独立App的需求持续增长,TOP10 App去重用户规模同比增长37倍。
头部 AIGC App的聚合用户多为男性,年龄集中在25-45岁,位于三线及以上城市,同时具备较高消费意愿与消费能力。
现阶段头部应用普遍聚焦在文本和图像信息模态生成;豆包、文心一言以千万月活的用户规模"领跑",其次是天工、扮伴-AI绘画及讯飞星火。
但需要主义的是,用户的活跃率低 (均低于 20%),忠诚度低 (3日留存均低于 50%),流失风险高 (部分卸载率超过 50%)。
各大内容平台上开始出现 AIGC 内容,包括通过AI创作的高质量文章、图片、短视频等,形成社区效应和自发性流量增长。在这些平台 AIGC 内容里,用户更喜欢金融财经、企业、二次元、科技科普等主题的内容
🉑 我收集了 900 多个开源 GenAI / GPT / LLM 工具,然后进行了一番研究
这是一份LLM开源项目 清单,目前包含 937 个项目,而且还在以每天4次的频率更新中 (每6个小时更新一次)。表单支持搜索和分类查找,感兴趣可以收藏~
这份表单的作者,在 👆 这篇文章里介绍了数据来源,即通过 GitHub 搜索关键词gpt、llm和generative ai,然后筛选出超过 500 Star 的仓库。
作者对这 900 多个开源工具进行了非常多维度的分析,有很多有趣的细节。以下是分析要点,感兴趣可以阅读原文哦!
AI技术栈的四个层次
-
应用程序 Applications:基于现有模型构建的开源应用程序,如编程、工作流自动化、信息聚合等。
-
应用开发 Application development:在现有模型基础上开发应用程序,涉及提示工程、RAG、AI接口等。
-
模型开发 Model development:提供开发和训练模型的工具,涉及框架、推理优化、数据集工程和评估等。
-
基础设施 Infrastructure:包括服务工具、计算管理、向量搜索、数据库等。
AI技术栈的发展趋势
-
2023年新工具爆炸性增长,特别是 Stable Diffusion 和 ChatGPT 问世之后。
-
其中,应用程序(紫色) 和 应用开发层(红色) 增长最为显著,基础设施层 (蓝色) 增长较小。
-
对应用程序进行分类,可以看到占比从高到底分别为:编程、机器人、信息聚合、图像生成、工作流自动化、写作
开源AI开发者的贡献
-
多个账户拥有4个以上的 500 Star 仓库,上图左是其中的 TOP20,可以看到基本都是知名企业账户 (其中3个属于 Google)
-
个人账户在应用程序层中的比例较高,在基础设施层中较少。
中国开源生态系统的崛起
-
已经有许多AI仓库是专门面向中文用户群体的,这说明 GitHub 在中国用户中已经已经非常普遍。
-
需要注意的是,GitHub排名前20的账户中,有6个来自于中国。
快速增长后无人问津
-
许多项目在短时间内获得了巨量的关注,但是很快又归于沉寂,作者和朋友们称其为「炒作曲线 (hype curve)」。
-
这种现象并不罕见,大致规律是:发布初期由于新颖性或解决了某个热门问题,迅速吸引大量用户和开发者的关注;随后在社交媒体、技术论坛和新闻中传播并形成热潮,吸引更多开发者参与其中;随着时间推移,项目由于未能满足期望或停止维护等原因,热度逐渐消散。
🉑 用6个月开发代码生成工具 「GPT Pilot」,这是开发者的精华笔记
GPT Pilot 是一款代码生成工具,与最近大火的「Devin」相似但弱一些:能够独立规划任务并启动编程,能在遇到困难时向人类寻求帮助。
不同于 Devin 的高度智能化,GPT Pilot 更像是一位需要指导的初级程序员。
作者在完成 GPT Pilot 后,真的用它开发了几款应用!而这些开发工作整整花费了6个月的时间。作者将经验和心得整理成了如下的笔记:
GPT Pilot的核心理念
-
人工智能的人类监督:为了确保开发方向的正确性,并根据实际开发结果进行调整,人工智能需要人类的监督和指导。
-
错误修正的迭代能力:GPT Pilot能够执行代码,检查输出结果,并根据 LLM 的反馈进行必要的修正。
-
软件开发的流程编排:借助LLM的智能决策能力,可以对开发过程中的重复任务进行有效编排。
-
编码的非线性特性:编码过程中常常涉及到代码的重构,GPT Pilot需要能够灵活选择不同的实现路径,以适应这些变化。
实践中的深刻洞察
-
应用初始描述的关键性:一个精确的初始描述对于GPT Pilot的整个思考和执行过程至关重要。
-
代码重构的必要性:GPT Pilot也需要具备代码重构的能力,以应对开发过程中的各种挑战。
-
自我审查的代理机制:通过不同的"审查者"代理对代码实现进行审查,可以有效提升开发效率。
-
专注单一问题的LLM优势:LLM在集中精力解决单一问题时表现更为出色,因此应避免在单个提示中包含多个问题。
-
日志记录的重要性:GPT-4创建的代码包含详细的日志记录,这对于调试工作至关重要。
-
代码库的模块化:将代码库划分为多个小文件,有助于GPT-4更好地实现功能和修复错误。
-
代码和思路的清晰展示:为了让人类能够有效地修正GPT Pilot编写的代码,必须清晰地展示代码内容及其背后的逻辑。
-
利用人类的惰性:人们更倾向于回答具体问题,而不是提供开放式的反馈。
-
激发LLM的创新思维:要让LLM跳出常规思维模式,需要给出明确的指导和具体的解决方案。
GPT Pilot 实际应用案例
-
Prompt Lab:这是一个功能强大的对话运行和分析工具,可以帮助用户深入理解和优化提示词。耗时2天。
-
SQLite数据库分析工具:一个内部工具,专门用于分析SQLite数据库,以便更好地理解和优化数据结构。耗时2天。
-
Code Whisperer:一个展示项目,用户可以通过它向LLM咨询有关代码库的问题,从而获得深入的代码分析和建议。耗时7小时。
-
Star History:一个工具,用于比较Github仓库的 Star 增长速度,并且提供可缩放的图表展示,帮助开发者了解项目的发展动态。耗时6小时。
感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!
◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!
◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!