宝马与阿里巴巴合作推出AI汽车
2025年03月27日 | AI日报
欢迎各位人工智能爱好者
又一款SOTA文生图模型刚刚发布------但所有人似乎只关心如何将图片转换成吉卜力风格的动漫。
随着Ideogram 3.0的发布、GPT-4o病毒式传播的图像生成能力以及Reve的首次亮相,本周AI创造力已经达到了全新高度。
今日AI要闻:
- Ideogram先进的3.0图像模型
- 宝马与阿里巴巴合作推出AI汽车
- 为任何学科创建定制学习助手
- 阿里巴巴的多感官移动端AI
阅读时间: 5分钟
最新动态
🖼️ Ideogram先进的3.0图像模型
核心内容 : 图像生成初创公司Ideogram刚刚发布了其AI模型的3.0版本,在照片真实感、文本渲染和风格一致性方面带来重大改进------在人类评估中表现优于竞争对手。
详细内容:
- Ideogram 3.0带来新的文本渲染和平面设计能力,可精确创建复杂布局、标志和排版
- 在测试中,该模型显著领先于主流文生图模型,包括Google的Imagen 3、Flux Pro 1.1和Recraft V3
- 新增"风格参考"功能,允许用户上传最多三张图片来引导生成内容的美学风格,同时提供43亿个预设库
- 该模型现已在Ideogram平台和iOS应用上线,所有功能对免费用户开放
重要意义: Ideogram的新模型令人印象深刻,但考虑到OpenAI 4o图像功能的炒作,发布时间不太理想。从Ideogram、OpenAI和Reve本周的发布可以明显看出,对于这波AI模型浪潮来说,平面设计和精确文本生成几乎已经完全解决。
🚗 宝马与阿里巴巴合作推出AI汽车
核心内容 : 中国科技巨头阿里巴巴与汽车制造商宝马宣布建立战略联盟,为中国市场开发先进的车载AI,最快将于2026年为宝马车型带来尖端座舱技术。
详细内容:
- 合作核心是阿里巴巴Qwen驱动的新型车载AI助手,具有增强的语音识别和上下文理解能力
- 该助手将提供实时餐饮、停车位和交通管理功能,使用自然命令而非触摸屏界面
- 宝马还计划推出两个AI代理:用于车辆诊断的Car Genius和用于个性化推荐及行程规划的Travel Companion
- 系统还将包括手势识别、眼球追踪和身体位置感知等多模态输入,提供更直观的驾驶体验
重要意义 : 宝马一直处于AI和机器人技术前沿,将先进AI系统集成到新车中只是时间问题。虽然特斯拉凭借其内部xAI合作仍是强有力的竞争者,但其他汽车制造商也在采取战略措施引领AI时代。
🎤 阿里巴巴的多感官移动端AI
核心内容 : 阿里巴巴发布了Qwen2.5-Omni-7B,这是一款新型多模态AI,能够同时处理文本、图像、音频和视频,同时效率高到可以直接在智能手机和笔记本电脑等消费级硬件上运行。
详细内容:
- 该模型采用新的"Thinker-Talker"系统,实现跨模态(文本、音频、图像、视频)的实时处理,并输出文本和语音
- 在基准测试中,其在语音理解和生成方面表现出色,优于专业音频模型
- 阿里巴巴表示Omni-7B可以在手机和笔记本电脑上高效运行,实现如为视障用户提供实时音频描述等实际应用
- 该模型已在Hugging Face和GitHub上提供,阿里巴巴将其定位为开发实用AI代理的基础
重要意义: 全能模型的时代即将到来,全向系统将解锁全新的体验和应用类别。能够理解并响应人类环境全部复杂性------同时开源且易于获取------的智能是一个强大的组合。
快速浏览
- 🎆 GPT-4o图像生成 - 在ChatGPT和Sora中创建和编辑照片
- 🧠 Gemini 2.5 Pro - Google的新SOTA推理模型
- 👋 InfiniteYou - 具有高质量面部精度的AI肖像生成器
- 🔎 Perplexity Answer Modes - 增强特定垂直领域的搜索
- Microsoft 365 Copilot推出Researcher和Analyst两个新AI代理,旨在直接在用户工作流程中处理研究数据分析等职场任务
- 联邦法官驳回音乐出版商UMG阻止Anthropic使用歌词训练Claude的请求,称该主张未能证明"不可挽回的损害"
- xAI宣布其Grok聊天机器人现已直接集成到消息应用Telegram中,Premium用户可免费使用
- 亚马逊推出"Interests"新AI购物功能,自动扫描商店根据自然语言提示通知用户新产品
- Midjourney在每周Office Hours会议中透露,备受期待的新V7模型预计将于3月31日周一发布
- 美国政府新增50多家中国科技实体至出口黑名单,针对开发先进AI、超级计算和量子技术的公司