从关键新闻和最新技术看AI行业发展（第三十三期2024.9.23-10.13） |【WeThinkIn老实人报】

写在前面

【WeThinkIn老实人报】旨在挖掘AI行业的关键新闻和最新技术，同时Rocky会对其中的关键信息进行解读，力求让读者们能从容掌握AI科技潮流。
欢迎大家关注Rocky的公众号：WeThinkIn

欢迎大家关注Rocky的知乎：Rocky Ding

AIGC算法工程师面试面经秘籍分享：WeThinkIn/Interview-for-Algorithm-Engineer欢迎大家Star～

获取更多AI行业的前沿资讯与干货资源

WeThinkIn最新福利放送 ：大家只需关注WeThinkIn 公众号，后台回复"简历资源 "，即可获取包含Rocky独家简历模版在内的60套精选的简历模板资源，希望能给大家在AIGC时代带来帮助。

AIGC时代的**《三年面试五年模拟》算法工程师求职面试秘籍**独家资源：https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer/tree/main

Rocky最新发布Stable Diffusion 3和FLUX.1系列模型的深入浅出全维度解析文章，点击链接直达干货知识：https://zhuanlan.zhihu.com/p/684068402

大家好，我是Rocky。

阅读Rocky创办的《WeThinkIn老实人报》，大家能够获得：

掌握AIGC 、传统深度学习 以及智能汽车这三个AI行业核心方向的最新进展，能在评论区抒发观点，共同学习交流。
找到让自己灵光一现的关键新闻和最新技术，这对我们的职业生涯非常重要。
理顺国内AI行业头条新闻 、全球AI行业头条新闻 以及AI技术进展头条新闻 三大板块，降低我们对未来下一个核心价值（OpenAI式公司和AIGC式技术）的错判率。

本文是《WeThinkIn老实人报》的第三十三期，Rocky本次梳理的周期为2024年9月23号-2024年10月13号。在本期中，Rocky会毫无保留地分享自己的核心观点，希望能给大家带来更多思考与感悟。

So，enjoy：

正文开始

目录先行

读前大局观
国内AI行业头条新闻
全球AI行业头条新闻
AI技术进展头条新闻

读前大局观

Rocky将工业&科技分为三个维度：

尖端工业&科技：包括新能源、AI、航空航天、军事工业、半导体、新药研发以及细分高精尖行业等。
中端工业&科技：包括汽车、高铁、大飞机、大轮船以及已经突破的曾被宣称是"尖端工业"的产业。
基础工业&科技：包括房地产、基建以及轻工业等基础制造业和基本生活用品业等。

我们目前的发展阶段，首先要解决的是中端工业&科技的市场占有率问题，需要占据全球市场的80%左右，并留下识大体顾大局的20%的海外公司共同成长，共享发展果实。

在基础工业&科技，目前主要是处在降本增效，持续优化的状态。基础工业&科技包含了人们的衣食住行，是跨周期的、市场巨大的产业，依旧有很多机会。

在尖端工业&科技方面，拿AI行业为例，我们目前主要是跟紧全球最新趋势，问题不大的。在AI行业的政策、资本、生产资料、认知等都飞速迭代的当下，国内AI行业的产品落地与弯道超车能力依旧非常强。此外像新能源、航空航天、军事工业等领域，已经进入与全球伙伴合作的阶段，市场上留下的更多是识大体顾大局的海外合作伙伴。

国内AI行业头条新闻

AIGC产业新闻：

1、华为发布大模型混合云Top N场景，首批面向5大行业共计发布20个领域、80多个行业场景基线。

2、高德云图全面开放AI能力：发布云境和云睿两大AI产品升级，打造AI智能体繁荣生态。

3、新华网发布"AIGC-Safe全域内容安全与模型安全综合服务平台"，护航AI技术向善。

4、钉钉面向个人用户推出"365会员"，提供钉钉AI搜索、个人AI助理、个人认证等AI产品包。

5、科大讯飞与中国绿发携手发布泰山大模型，共筑首个央企AI总部。

6、百度文心大模型与东方明珠广播电视塔达成合作意向，携手打造"AI+文旅"行业标杆。

7、美图奇想大模型视频生成能力完成全面升级，将逐步落地美图秀秀、美颜相机等产品。

8、字节跳动正式宣告进军AI视频生成，豆包视频生成大模型正式发布。

9、科大讯飞计划投资30亿元在成都高新区建设讯飞星火大模型全国软件工程总部暨讯飞生态产业中心项目。

10、百度宣布全面升级百舸AI异构计算平台4.0、千帆大模型平台3.0两大AI基础设施，并升级代码助手、智能客服、数字人三大AI原生应用产品。

11、火山引擎：豆包大模型日均Tokens使用量超过1.3万亿，日均生成图片5000万张，日均处理语音85万小时。

12、国内首个视频大模型Vidu正式开放API，并接入百度智能云千帆平台。

13、快手可灵AI全面开放API服务，推出"对口型"功能、"创意圈"社区。

14、vivo发布全新AI战略"蓝心智能"：大模型与操作系统深度融合，向行业全面开放。

15、金山办公上线基于AI Agent（人工智能体）范式驱动的WPS AI伴写功能。

Rocky观点：2024年下半年，以大模型为核心延伸到落地应用与商业化，大模型的发布数量明显减少了，迭代优化和存量厮杀尤为明显。在ToC、ToB两个方向上同时打响价格战，全面进入大模型你死我活厮杀的关键阶段。

新能源产业新闻：

1、京东物流发布第六代无人车技术，将规模化布局搭载大模型的智能配送车。

2、顺丰旗下丰翼科技：丰翼无人机已完成第100万架次飞行，累计空运货物超520万件。

3、百度地图V20（HIMA）现已上线鸿蒙智行车辆，支持车道级引导、红绿灯倒计时等功能。

Rocky观点：新能源行业的发展所催生的电动车行业与新制造业，是跨周期的。加上互联网思维，相信可以和特斯拉一起形成合力，让最后存活下来的海外车企们更加识大体、顾大局。

传统深度学习&芯片产业新闻：

1、华为：已有超1万个应用和元服务上架HarmonyOS NEXT（原生鸿蒙）应用市场，每年投入超60亿元用于支持和激励鸿蒙开发者创新。

2、阿里云发布首个"Data+AI"驱动的一站式多模数据平台，助力业务决策提效10倍。

3、华为原生鸿蒙系统HarmonyOS NEXT将于10月8日开启公测，首批支持Mate 60/X5系列手机、MatePad Pro 13.2英寸系列平板。

4、九号电动第500万台智能两轮电动车下线，用时四年多。

5、智能驾驶方案提供商地平线通过港交所上市聆讯，高盛、摩根士丹利和中信建投国际担任联席保荐人。

6、华为终端：HarmonyOS NEXT正式开启公测，首批公测机型包括华为Mate60系列、华为Mate X5系列、华为MatePad Pro13.2英寸系列。

7、腾讯宣布微信鸿蒙原生版正式开启邀请内测，超20款腾讯App陆续适配中。

8、支付宝鸿蒙版App上线：已适配小程序等功能，后续支持"碰一下"新体验。

互联网产业新闻：

1、拼多多百亿补贴率先启动11.11大促：首次推出"百亿消费券"活动，上线"超级加倍补"。

2、京东公布2024年双十一活动时间节点，将于10月12日进入抢先购阶段、14日正式开售。

3、科大讯飞全球1024开发者节定档10月24日：升级行业大模型及多元应用产品。

4、苹果公司应用研究实验室在河套深圳园区建成运营，为苹果在美国本土外覆盖范围最广的实验室。

Rocky观点："又有竞争、又有合作，形成斗而不破的局面。"

商业基本面新闻：

1、南航首架C919国产大型客机成功首航，正式迈入商业运营新阶段。

Rocky观点："像大飞机这样的中端科技&工业，要攫取全球80%的市场。"

2、小米公益基金会已规划捐赠7.2亿元，支持基础研究、应用基础研究以及科研人才队伍建设。

3、《财富》公布2024年全球最具影响力商界女性，立讯精密王来春、华为孟晚舟等上榜。

全球AI行业头条新闻

AIGC产业新闻：

1、OpenAI ChatGPT新增自动模式，基于提示词复杂度灵活选择合适AI模型。

2、微软和阿联酋人工智能公司G42将合作开设AI研究所，将在阿布扎比开设两个中心。

3、微软启动第二波Copilot AI更新：全新Pages、Excel支持Python、上线Agents等。

4、OpenAI首款具备"推理"能力模型o1现已向企业/教育用户开放，每周最多使用50次。

5、亚马逊生成式AI版图再扩张，重磅推出电商AI助手Amelia。

6、OpenAI发布"学院"计划：为开发者提供100万美元API信用额度及技术指导。

7、英伟达宣布与阿联酋G42公司合作开发"平方公里级"天气预测AI，基于Earth-2项目打造。

8、谷歌将投入1.2亿美元建"全球人工智能机会基金"，加强世界各地AI教育与培训。

9、微软将于未来三年内在墨西哥向人工智能领域投资13亿美元。

10、Snap与谷歌建立合作伙伴关系，将把谷歌Gemini AI整合到Snapchat AI聊天机器人中。

11、诺基亚宣布与T-Mobile、英伟达携手合作，共同建立业内首个AI-RAN创新中心。

12、OpenAI宣布将向所有付费用户开放其类人高级AI语音助手功能"高级语音模式"，50多种语言、9种声线可选。

13、Meta与眼镜制造商Essilor Luxottica合作关系延至2030年，未来将推更多雷朋AI智能眼镜产品。

14、OpenAI全新多模态内容审核模型上线：基于GPT-4o，可检测文本和图像。

15、AMD推出自家首款小语言AI模型"Llama-135m"：主打"推测解码"能力，可减少RAM占用。

16、OpenAI推出全新写作、编码工具ChatGPT Canvas，将免费开放。

17、微软将在意大利投资43亿欧元，以增强人工智能基础设施和云计算能力。

18、OpenAI同媒体集团赫斯特达成内容合作协议，涵盖数十家报纸杂志。

19、Meta人工智能聊天机器人将在21个新市场推出，与OpenAI的ChatGPT展开竞争。

20、Adobe将推出全新免费应用：创作者可在作品上附上"证书"防止被AI使用。

21、微软Ignite 2024全球技术大会将于11月20日至22日举行，重点关注"AI转型中的最新创新"。

22、OpenAI正在全球扩张，将在纽约、西雅图、巴黎、布鲁塞尔等地开设办事处。

Rocky观点：全球的AIGC行业发展都非常迅速，我们需要紧跟AIGC行业的最新进展，将先进的技术工具化，同时思考关键产品的落地逻辑。

新能源产业新闻：

1、西门子计划分拆旗下电动汽车充电业务Siemens eMobility，以开辟更多增长机会。

2、瑞典电池制造商Northvolt计划在其瑞典基地裁员1600人，约占全球员工总数的五分之一。

3、三星电子宣布开发出其首款基于第八代V-NAND的车载SSD，顺序读取速度4400MB/s。

4、捷豹路虎宣布将投入5亿英镑支持Halewood工厂生产纯电动汽车。

5、高通与霍尼韦尔宣布扩大合作，旨在为能源行业开发基于人工智能的智能解决方案。

传统深度学习&芯片产业新闻：

1、三星计划在年底前启动重组半导体代工部门计划，从而打破部门壁垒。

2、三星投资18亿美元在越南新建OLED厂，拟打造全球最大显示模组生产基地。

3、甲骨文拟斥65亿美元在马来西亚建AI及云端服务中心。

4、英特尔发布酷睿Ultra200S系列处理器家族，将AI PC功能扩展至台式机平台。

互联网产业新闻：

1、苹果Swift 6编程语言正式版上线：支持RISC-V嵌入式环境、扩展C++互通。

2、沃达丰与谷歌 "续航"十年合作，将推广人工智能手机和服务。

商业基本面新闻：

1、Meta创始人扎克伯格今年财富增逾700亿美元，加入2000亿美元富豪俱乐部。

2、2024年诺贝尔生理学或医学奖揭晓，美国科学家维克托·安布罗斯与加里·鲁夫坎获奖。

3、2024年诺贝尔物理学奖揭晓，两位科学家约翰·J·霍普菲尔德和杰弗里·E·辛顿获奖。

AI技术进展头条新闻

Rocky观点：《WeThinkIn老实人报》将从工业界出发，以投资、CEO以及CTO视角挖掘技术发展的落地可能性与明星技术的潜力。

1、Meta开源多模态模型------Llama 3.2！

Meta开源了首个多模态大模型Llama-3.2，这是Llama-3系列的一次重大升级，一共有4个版本。

Llama 3.2 1B、3B是整个系列最轻量级的模型，适合边缘设备和移动应用程序的检索和摘要，可用于个人信息管理和多语言知识检索等，支持 128k标记的上下文长度，可在手机、平板电脑等设备中使用。

值得一提的是，这两款模型在发布时便对高通和联发科的硬件进行了适配，并针对 Arm 处理器进行了优化，广泛的兼容性将加速其在各种移动和物联网设备中的应用。

开源地址：https://www.llama.com/?utm_source=twitter\&utm_medium=organic_social\&utm_content=video\&utm_campaign=llama32

2、超高清视频模型------Pyramid-Flow开源！

Pyramid-Flow仅通过文本就能生成最多10秒、1280x768分辨率和24帧视频，在光影效果、运动动作一致性、视频质量、文本语义还原、色彩搭配等方面非常优秀，生成的视频很棒。

开源地址：https://github.com/jy0205/Pyramid-Flow

huggingface地址：https://huggingface.co/rain1011/pyramid-flow-sd3

在线demo地址：https://huggingface.co/spaces/Pyramid-Flow/pyramid-flow

3、Sora等AI视频大模型的核心原理，核心基础知识，网络结构，经典应用场景，从0到1搭建使用AI视频大模型，AI视频大模型性能测评，AI视频领域未来发展等全维度解析文章正式发布！

码字不易，欢迎大家多多点赞：

Sora等AI视频大模型文章地址：https://zhuanlan.zhihu.com/p/706722494

4、Stable Diffusion3和FLUX.1模型的核心原理，核心基础知识，网络结构，经典应用场景，从0到1搭建使用Stable Diffusion3和FLUX.1模型进行AI绘画，从0到1上手使用Stable Diffusion 3和FLUX.1模型训练自己的AI绘画模型，Stable Diffusion 3和FLUX.1模型性能优化等全维度解析文章正式发布！

码字不易，欢迎大家多多点赞：

Stable Diffusion3和FLUX.1模型文章地址：https://zhuanlan.zhihu.com/p/684068402

5、Stable Diffusion XL核心基础知识，从0到1搭建使用Stable Diffusion XL进行AI绘画，从0到1上手使用Stable Diffusion XL训练自己的AI绘画模型，AI绘画领域的未来发展等全维度解析文章正式发布！

码字不易，欢迎大家多多点赞：

Stable Diffusion XL文章地址：https://zhuanlan.zhihu.com/p/643420260

6、Stable DiffusionV1-V2核心原理，核心基础知识，网络结构，经典应用场景，从0到1搭建使用Stable Diffusion进行AI绘画，从0到1上手使用Stable Diffusion训练自己的AI绘画模型，Stable Diffusion性能优化等全维度解析文章正式发布！

码字不易，欢迎大家多多点赞：

Stable Diffusion文章地址：https://zhuanlan.zhihu.com/p/632809634

7、ControlNet核心基础知识，核心网络结构，从0到1使用ControlNet进行AI绘画，从0到1上手构建ControlNet高级应用等全维度解析文章正式发布！

码字不易，欢迎大家多多点赞：

ControlNet文章地址：https://zhuanlan.zhihu.com/p/660924126

8、LoRA系列模型核心基础知识，从0到1使用LoRA模型进行AI绘画，从0到1上手训练自己的LoRA模型，LoRA变体模型介绍，优质LoRA推荐等全维度解析文章正式发布！

码字不易，欢迎大家多多点赞：

LoRA文章地址：https://zhuanlan.zhihu.com/p/639229126

9、最全面的AIGC面经《手把手教你成为AIGC算法工程师，斩获AIGC算法offer！（2024年版）》文章正式发布！

码字不易，欢迎大家多多点赞：

AIGC面经文章地址：https://zhuanlan.zhihu.com/p/651076114

10、10万字大汇总《"三年面试五年模拟"之算法工程师的求职面试"独孤九剑"秘籍》文章正式发布！

码字不易，欢迎大家多多点赞：

算法工程师三年面试五年模拟文章地址：https://zhuanlan.zhihu.com/p/545374303

《三年面试五年模拟》github项目地址（希望大家能给个star）：https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer

11、Stable Diffusion WebUI、ComfyUI、Fooocus三大主流AI绘画框架核心知识，从0到1搭建AI绘画框架，从0到1使用AI绘画框架的保姆级教程，深入浅出介绍AI绘画框架的各模块功能，深入浅出介绍AI绘画框架的高阶用法等全维度解析文章正式发布！

码字不易，欢迎大家多多点赞：

AI绘画框架文章地址：https://zhuanlan.zhihu.com/p/673439761

12、GAN网络核心基础知识、深入浅出解析GAN在AIGC时代的应用等全维度解析文章正式发布！

码字不易，欢迎大家多多点赞：

GAN网络文章地址：https://zhuanlan.zhihu.com/p/663157306

从关键新闻和最新技术看AI行业发展（第三十三期2024.9.23-10.13） |【WeThinkIn老实人报】

写在前面

正文开始

目录先行

读前大局观

国内AI行业头条新闻

AIGC产业新闻：

新能源产业新闻：

传统深度学习&芯片产业新闻：

互联网产业新闻：

商业基本面新闻：

全球AI行业头条新闻

AIGC产业新闻：

新能源产业新闻：

传统深度学习&芯片产业新闻：

互联网产业新闻：

商业基本面新闻：

AI技术进展头条新闻

1、Meta开源多模态模型------Llama 3.2！

2、超高清视频模型------Pyramid-Flow开源！

3、Sora等AI视频大模型的核心原理，核心基础知识，网络结构，经典应用场景，从0到1搭建使用AI视频大模型，AI视频大模型性能测评，AI视频领域未来发展等全维度解析文章正式发布！

5、Stable Diffusion XL核心基础知识，从0到1搭建使用Stable Diffusion XL进行AI绘画，从0到1上手使用Stable Diffusion XL训练自己的AI绘画模型，AI绘画领域的未来发展等全维度解析文章正式发布！

6、Stable DiffusionV1-V2核心原理，核心基础知识，网络结构，经典应用场景，从0到1搭建使用Stable Diffusion进行AI绘画，从0到1上手使用Stable Diffusion训练自己的AI绘画模型，Stable Diffusion性能优化等全维度解析文章正式发布！

7、ControlNet核心基础知识，核心网络结构，从0到1使用ControlNet进行AI绘画，从0到1上手构建ControlNet高级应用等全维度解析文章正式发布！

8、LoRA系列模型核心基础知识，从0到1使用LoRA模型进行AI绘画，从0到1上手训练自己的LoRA模型，LoRA变体模型介绍，优质LoRA推荐等全维度解析文章正式发布！

9、最全面的AIGC面经《手把手教你成为AIGC算法工程师，斩获AIGC算法offer！（2024年版）》文章正式发布！

10、10万字大汇总《"三年面试五年模拟"之算法工程师的求职面试"独孤九剑"秘籍》文章正式发布！

12、GAN网络核心基础知识、深入浅出解析GAN在AIGC时代的应用等全维度解析文章正式发布！

推荐阅读

2、《三年面试五年模拟》面试秘籍

3、其他