AI大模型,但是在卫星

AI圈又发生了啥新鲜事?

国星宇航实现全球首次卫星在轨AI大模型技术验证

国星宇航成功完成了全球首次卫星在轨运行AI大模型技术验证,验证了AI大模型在太空中的空间适应性和算力载荷的有效性。从9月25日至10月5日,卫星共执行了13次AI大模型在轨运行试验,覆盖了不同温度工况和多种推理问答类型,所有任务均成功完成。这一成就标志着国星宇航在推动"太空AI"发展方面迈出了重要一步,为未来的"星算计划"组网和"地数天算"技术积累奠定了基础

http://www.itbear.com.cn/html/2024-10/531238.html

PyTorch 发布 torchao 优化库,AI 模型效率显著提升

PyTorch 推出 torchao 架构优化库,专注于模型量化和稀疏性优化,旨在降低计算成本和内存用量,同时保持性能。torchao 支持 float8、int4 等低精度数据类型,提升模型运行效率。例如,在 LLaMA 3 70B 模型预训练中,使用 float8 训练流程可提升计算速度 1.5 倍。此外,torchao 还提供多种量化方法和稀疏性优化,如将 LLaMA 3.1 8B 模型在 128K 上下文长度下显存占用降至 18.9GB

https://www.ithome.com/0/799/879.htm

OpenAI 发布 ChatGPT Canvas:写作与编码的新工具

OpenAI 推出 集成了写作与编码功能的全新工具 ChatGPT Canvas。Canvas 利用 GPT-4o 技术,允许用户在写作和编码时获得实时反馈和建议。它支持调整文章长度、阅读级别,以及代码审查和错误修复等功能。目前,Canvas 向 ChatGPT Plus 和 Team 用户开放,并将在未来几周内对 Enterprise 和 Edu 用户开放,测试结束后计划向所有用户免费提供

https://openai.com/index/introducing-canvas/

OpenAI 发布 Whisper 语音转录 AI 模型升级版,速度提升 8 倍

OpenAI 近日推出了 Whisper large-v3-turbo 语音转录模型,该模型在几乎不牺牲质量的前提下,速度比前代 large-v3 快 8 倍。尽管只有 4 层解码器层,但参数数量达到 8.09 亿,比 medium 模型略大,且所需 VRAM 仅为 6GB。此外,该模型大小为 1.6GB,继续遵循 MIT 许可证开放代码和模型权重

https://github.com/openai/whisper/discussions/2363

Liquid AI 发布非 Transformer 架构模型,性能超越 Meta Llama 和微软 Phi

Liquid AI 公司推出了三款非 Transformer 架构的 AI 模型,包括 LFM-1.3B、LFM-3.1B 和 LFM-40.3B,它们在基准测试中表现出色,超越了同规模的 Transformer 模型。这些模型不仅 RAM 用量更少,还能处理更长的序列,适用于多种数据类型,包括视频、音频、文本等。LFM-1.3B 在多个基准测试中击败了包括苹果的 OpenELM、Meta 的 Llama 3.2、微软的 Phi 1.5 等模型,而 LFM-3.1B 甚至在特定场景超越了更大规模的模型

https://www.liquid.ai/

Meta推出AI视频生成器Movie Gen:自动生成含声音的高清视频

Meta公司宣布推出AI视频生成器Movie Gen,该工具能够根据文本输入自动生成带有声音的高清视频。Movie Gen不仅能生成新视频,还能编辑现有视频或静止图像,添加与视频匹配的AI生成音频。尽管技术尚未成熟,Meta表示目前还未准备作为产品发布

https://ai.meta.com/research/movie-gen/

德国初创公司推出Flux 1.1 Pro:AI图像生成速度提升6倍,Elo评分1153分

德国初创公司Black Forest Labs发布最新AI图像生成模型Flux 1.1 Pro,代号"blueberry",在图像生成速度上是Flux 1 Pro的6倍,同时提供更高质量和更合规的图像输出。Flux 1.1 Pro在视觉逼真度和提示准确性方面表现优异,Elo评分达到1153分,超越了Midjourney 6.1等竞争对手。此外,公司还推出了BFL API,支持开发者将Flux模型集成到应用程序中

https://www.ithome.com/0/800/136.htm

Mozilla 发布 Lumigator 框架,助力开发者选择 AI 模型

Mozilla 推出了 Lumigator,一个旨在帮助开发者挑选合适的 AI 大语言模型的新框架。该框架强调透明和高效的模型选择过程,对开发者友好,并采用开源方法以促进社区协作。Lumigator 的目标是简化大型语言模型的选择,支持伦理和透明的人工智能开发

https://www.mozilla.ai/lumigator

谷歌 Lens 开启 AI 新篇章:支持视频搜索和语音输入

Google Lens服务新增视频搜索和语音输入功能,使得年轻用户(18-24岁)使用频率最高的图像识别技术更加便捷。用户现在可以通过录制视频提问,Lens将结合视频内容生成AI概述提供信息。此外,每月全球视觉搜索次数逼近200亿次,显示了其广泛的应用和受欢迎程度

https://lens.google/

快手可灵AI推出"对口型"功能,开放API服务

快手旗下的可灵AI新增了一项"对口型"功能,允许用户上传音频后,视频中的人物口型与音频同步。这项功能目前支持所有人物类角色,包括真实、3D和2D角色,但动物角色暂不支持。此外,可灵AI正式向所有用户开放API服务,用户可以在平台上自助购买API资源包,享受与平台效果一致的服务

https://www.ithome.com/0/800/024.htm

Grindr将推出AI助手,为1400万用户提供智能约会服务

约会平台Grindr计划于2027年推出AI助手,旨在为1400万用户提供寻找合适伴侣和约会地点建议等服务。该AI助手将能进行用户间对话,以深入了解彼此,提前发现潜在问题。目前,该功能正在小规模测试中,预计年底扩大至1000人,明年增至1万人

http://www.itbear.com.cn/html/2024-10/530645.html

相关推荐
Fleshy数模13 小时前
基于 Qwen2.5-1.5B-Instruct 实现多轮对话与文本分类实践
人工智能·分类·大模型
IOT.FIVE.NO.113 小时前
别再只盯 AGENTS.md 了,Codex 和 Claude Code 真正重要的是这几层配置
人工智能
candyTong13 小时前
Claude Code 的任务列表是怎么实现的
人工智能
Mike_66613 小时前
PaddleOCR v4模型转onnx踩坑记
人工智能
小雨青年13 小时前
GitHub Copilot CLI 完全指南:把终端里的 AI 助手真正用起来
人工智能·github·copilot
黎阳之光13 小时前
黎阳之光:深耕视频孪生核心领域 构筑数字孪生全域数智新标杆
大数据·人工智能·算法·安全·数字孪生
郭龙_Jack13 小时前
自有广告系统设计与实践
大数据·人工智能
自小吃多13 小时前
AI本地部署快速步骤
人工智能
漫游的渔夫13 小时前
前端开发者做 AI 工程:别停在脚本阶段,用 2 个 API 把 Agent 交给前端调用
前端·人工智能·typescript
AustinXu13 小时前
构建 AI Agent 系统:从复杂 Agent Skills到企业级 AI Agent
人工智能