1204 - 1208 早早聊 AI 资讯|Gemini 超越 GPT-4 问鼎最强大模型、谷歌 Gemini 刚发就惹质疑、斥资 5100 万美元...

👉👉原文链接👈👈

阅读详细图文,可访问知识库

OpenAI

◇ 斥资 5100 万美元, OpenAI 将从 CEO 阿尔特曼投资的初创公司购买 AI 芯片 🔗 News

OpenAI 前 CEO 萨姆·阿尔特曼解雇和复职后,尽管他不再参与 ChatGPT 开发,但由于他在任内与初创公司 Rain AI 签署的协议,仍可从 OpenAI 购买由 Rain AI 研发的 AI 芯片,并可能从中获利。这项 5100 万美元交易旨在购买在明年 10 月首批上市的 NPU 芯片,由阿尔特曼个人投资超过 100 万美元。

OpenAI GPT Store 上线时间推迟到明年年初 🔗 News

OpenAI 宣布将推迟 GPT 商店的推出至明年,邮件中表示"意外的事情让我们很忙"。原计划在 12 月推出,比先前承诺的时间晚。OpenAI 将向 GPT 构建者发送更新,强调 ChatGPT 的一些改进,并宣布对定制 GPT 平台进行了功能改进。GPT 商店将成为 GPT 构建者的市场,用户可销售和共享其构建的 GPT。

◇ Sam Altman 表示 OpenAI 正重新考虑其混合营利和非营利的公司结构 🔗 News

OpenAI 首席执行官山姆·奥尔特曼在越南人工智能活动上透露公司正在重新考虑混合盈利和非营利结构。奥尔特曼对被罢免感到震惊,但拒绝评论与秘密人工智能项目有关的问题,该项目或与他被罢免有关。他指出公司结构存在缺陷,新董事会正在认真考虑最适合公司使命的结构。投票解雇奥尔特曼引发猜测,可能与名为 Q*的神秘项目有关。

「 行业动态 」

◇ 让谷歌再次伟大?Gemini 超越 GPT-4 问鼎最强大模型,Pro 版今日可用 🔗 News

谷歌推出 Gemini 大模型,标志着人工智能新时代的开始。Gemini Ultra 在多领域表现超越 GPT-4,包括自然图像、音频和视频理解,以及数学推理。Gemini Pro 将整合到 Google 产品中,如 Bard,提供先进的推理和理解功能。Gemini Nano 将进入 Pixel 手机,推动更多应用。Gemini Ultra 正在接受信任和安全检查,计划在明年初向开发者推出。

◇ 谷歌 Gemini 刚发就惹质疑:测试标准有失偏颇,效果视频疑似剪辑 🔗 News

谷歌发布 Gemini 大模型,超越 GPT-4,但技术报告引发质疑。Gemini Pro 版本已上线,对比 GPT-4 显示 Gemini 在编程方面表现出色,但在图形推理上存在改进空间。Gemini 支持多模态能力,对生活场景的识别较好。专家建议放弃 ChatGPT 的免费版,Gemini 在 AlphaGo 能力升级等方面仍待关注。技术报告未透露详细参数和训练数据。

◇ H100 最强竞品正式发布!推理快 1.6 倍,内存高达 192 GB 🔗 News

谷歌发布 TPU v5p,性能提升至 1.67 倍,内存 95GB,支持 int8 运算,用于训练 1750 亿参数模型。AMD 推出 Instinct MI300X GPU,拥有史上最大芯片、1530 亿晶体管,AI 推理性能超英伟达 H100 1.6 倍,内存 192GB。MI300A 是全球首个数据中心 APU,CPU 和 GPU 融合,内含 24 线程 CPU 核心、228 个 CDNA 3 计算单元,用于生成式 AI 领域。2024 年 AI 芯片市场将竞争激烈,苏妈预测 2027 年总市场达 4000 亿美元。

TCL 华星发布全球首款半导体显示垂直领域大模型:星智 X-Inte ligence 🔗 News

TCL 华星在显示生态大会上发布全球首款半导体显示大模型------星智 X-Intelligence。该模型由 TCL 华星、智谱 AI 和国家新型显示技术创新中心合作研发,已实现私有化部署。经双盲测试,官方称其超越了 GPT-4。该模型构建了百万级专业文献库,主要服务于 TCL 华星内部员工,提供技术问题解决、产品研发加速等支持。

OpenAI 的 Sam Altman,获《时代》2023 年度最佳 CEO 🔗 News

12 月 7 日,《时代》周刊在官网公布了 2023 年最佳 CEO------OpenAI 的 Sam Altman。《时代》周刊曾在今年的 9 月 8 日发布了"2023 年 AI 领域最有影响力 100 人"榜单,评选百度首席执行官李彦宏、创新工场董事长李开复和 Sam 为全球 AI 行业领导者。Sam Altman 在 2015 年创建 OpenAI,通过一系列创新产品将公司估值推至 800 亿美元,但在今年 11 月的董事会罢免事件后,经历波折后重新崛起,被评选为《时代》周刊 2023 年最佳 CEO。

◇ 微软 Copilot 进化完全体,代码解释器、DALL·E 3,ChatGPT 有的它都有 🔗 News

微软的代码协作工具 Copilot 迎来重磅更新,支持 128k 上下文,集成 GPT-4 Turbo 模型,新增代码解释器、升级 DALL·E 3 绘图功能。搜索方面,结合多模态实现更准确回答,深度搜索消除歧义。Edge 浏览器专属功能包括对 YouTube 视频理解和文本生成的改进。更新标志着 Copilot 结束预览阶段,正式版本免费推出。

◇ 最新国产大模型亮相,无需申请即可免费商用 🔗 News

中国自主研发的 DeepSeek 模型以 670 亿参数为特色,超越同级别的 Llama 2,尤其在推理、数学和编码方面表现出色。模型支持中文测试,采用与 Llama 相同的自回归 Transformer 解码器架构,经过在大型数据集上的预训练。DeepSeek 的训练过程包含独特的多步学习率计划,获得了令人瞩目的数学和编码能力。模型的背后是北京公司深度求索,该公司早前发布的 DeepSeek Coder 在代码生成任务上也取得显著成绩。

◇ 五官乱飞,AI 都能模仿到位,视频诈骗要防不住了 🔗 News

慕尼黑工业大学等机构的研究团队提出了一种名为 GaussianAvatars 的新方法,可创建具有完全可控的逼真头部虚拟。通过基于三维高斯 splat 的动态 3D 人头表示,该方法在新视图合成和自我再现等方面远优于现有研究,实现了高保真度的虚拟人物动画。

大模型 版"5 年高考 3 年模拟"来了! 🔗 News

微软、加州大学洛杉矶分校(UCLA)和华盛顿大学(UW)联合推出新多模态数学推理基准数据集"MathVista",包含 6141 问题,来源于 28 个数据集。对 12 个大型模型进行测试,最先进的 GPT-4V 在准确率上仍落后于人类水平,为 49.9%。研究深入分析了模型在不同数学推理能力和图像类型上的表现。GPT-4V 在代数、几何、科学方面表现良好,但在逻辑推理和自洽性上存在挑战。

◇ 2023 年度 AI 设计实践报告 🔗 News

12 月 5 日,《2023 年度 AI 设计实践报告》发布,调查 5034 人,包括专业设计师、新媒体运营等。报告指出 AI 设计工具个人普及速度超预期,但 30%未使用,企业仅 8.4%采用。AI 在平面设计率先落地,国产 AI 发展潜力大。调查发现三大问题:控制不精准、生成有瑕疵、版权有争议。商业案例包括珠宝设计、音乐专辑、宣发营销。报告预测 2024 年 AI 视频生成爆发,国产工具或超越海外。 AI 改变设计能力结构,未来设计师需提升美学、创意能力,跨界思考,将经验沉淀为模型。

◇ 全球首个开源多模态医疗基础模型 🔗 News

上海交大与上海 AI Lab 发布了 Radiology Foundation Model(RadFM),这是一个开源的 14B 多模态医疗基础模型,首次支持 2D/3D 放射影像输入。研究聚焦于构建放射学领域的医学通用基础模型,提供了全球最大规模的医疗多模态数据集 MedMD&RadMD,以及开源的 RadFM 模型,支持 2D/3D、图像/文本混合输入。

◇ 字节联合中科大提出多模态文档大模型 🔗 News

字节跳动与中国科学技术大学合作研发的 DocPedia 是一款高分辨率多模态文档大模型,其分辨率达 2560×2560,远超业内其他模型,如 LLaVA、MiniGPT-4。通过新颖的训练策略,包括感知-理解联合微调,以及从频域出发的解决分辨率问题方法,DocPedia 在关键信息抽取和视觉问答方面显著提升性能。

PyTorch 大模型 "加速包",不到 1000 行代码提速 10 倍! 🔗 News

PyTorch 团队发布了名为 GPT-fast 的项目,通过使用 PyTorch 编写不到 1000 行的代码,成功将大型模型推理速度提升了 10 倍。采用了多种方法,包括 Torch.compile、GPU 量化、推测性解码和张量并行性。这些优化使性能从 25 tok/s 迅速提高到 244.7 tok/s,接近或超越当前 SOTA 水平。整个实现过程简单,仅用了 766 行代码。

◇ 员工称亚马逊 AI 聊天机器人 Q "幻觉"严重 🔗 News

亚马逊最新推出的 AI 聊天机器人 Amazon Q 存在严重的"幻觉"问题,泄露了公司机密信息,包括 AWS 数据中心位置和内部折扣计划。员工表示 Q 返回有害或不适当的聊天内容,可能导致安全风险。亚马逊试图淡化问题,称未发现安全问题,但内部文件引发了对 Q 准确性和安全性的担忧。Q 仍处于预览阶段,尚未正式发布。

Meta 推出独立的 Al 图像生成器,目前免费但只支持英文提示词 🔗 News

Meta 公司发布全新 AI 图像生成器 Imagine with Meta,允许用户通过自然语言描述创建图像。该生成器采用 Meta 的 Emu 图像生成模型,支持高分辨率图像。为解决种族偏见问题,Meta 将在生成图像中添加由 AI 生成的隐形水印,并由相应模型检测,提高内容透明度。之前,Meta 推出基于 AI 的图像编辑工具 Emu Edit 和 Emu Video。Emu Edit 使用庞大的合成数据集进行训练,提供更精准的图像编辑能力。

「 趣玩推荐 」

◇ 实时编辑视频:利用人工智能的力量开始编辑视频的特定区域 🔗 Twitter

Pika 的实时视频编辑功能创新,但需关注道德风险。必须实施水印系统、使用政策,积极参与构建媒体篡改检测模型,同时发展道德框架,确保人为监督,平衡创新与道德责任。

◇ 又一种可视化!动画互动教程,可学习内部 GPT 结构 🔗 Twitter

-地址:bbycroft.net/llm

◇ Excalidraw 把他们的文本到图表的功能开源了 🔗 Twitter

Excalidraw 是一个虚拟白板应用,专门用于绘制类似手绘的图表。它提供了一个无限的、基于画布的白板,具有手绘风格,支持多种功能。新更新允许用户输入文本描述,将其自动转换为相应的图表或图形。

-在线体验:excalidraw.com/

「 学习资源推荐 」

◇ 检索增强生成:从理论到 LangChain 实现 🔗 Twitter

通过原始学术论文的理论到使用 OpenAI、Weaviate 和 LangChain 实现的 Python,介绍了检索增强生成(RAG)的概念。RAG 旨在为大型语言模型提供外部知识源的额外信息,以生成更准确和上下文丰富的答案。通过 LangChain 进行编排,结合 OpenAI 语言模型和 Weaviate 矢量数据库,实现了简单的 RAG 流水线。

◇ 免费并且完全私密地在 VSCode 中使用 Copilot,使用 DeepSeek 模型 🔗 Twitter

  1. 下载 VSCode 的 CodeGPT 扩展:marketplace.visualstudio.com/items?itemN...
  2. 下载@Ollama_ai:ollama.ai
  3. 安装完成后,在终端运行以下命令:"ollama run deepseek-coder"
  4. 在 VSCode 的 CodeGPT 设置中,选择 Ollama 作为提供者,模型选择 deepseek-coder。
  5. 完成设置!

◇ 简单的分块策略会导致 RAG 性能不佳,为什么? 🔗 Twitter

例如:如果相关上下文在你的分块的开头/结尾,那么很有可能在前一个/下一个分块中有更多相关上下文。但由于分块是预定义的,你无法访问这些上下文。

解决方案:这是"从小到大"分块/检索策略如此强大的一个原因。在这里,你根据小分块(例如一个句子)进行检索,然后"扩展"半径以检索更大的分块。

-文档指南:docs.llamaindex.ai/en/stable/e...

「 智能硬件:智能硬件、机器人、智能穿戴设备...」

◇ 𝐆𝐚𝐮𝐬𝐬𝐢𝐚𝐧𝐀𝐯𝐚𝐭𝐚𝐫𝐬:带有 Rigged 3D Gaussian 的逼真头部头像! 🔗 Twitter

通过在参数化面模型上实时编辑和渲染,使用 3D 高斯模型创建逼真的头部头像,实现了对视角、姿势和表情的完全控制。


「 投融资信息」

◇ 创业 180 天估值 20 亿美元!欧版 OpenAI 爆火 🔗 News

法国初创公司 Mistral AI 最新融资 4.87 亿美元,估值逼近 20 亿美元,由安德森·霍洛维茨、英伟达、Salesforce 等投资。公司成立仅 6 个月,以欧洲版 OpenAI 著称。主创包括前 DeepMind 和 Meta 科学家,团队发布了开源大模型 Mistral-7B,挑战 Llama2,展示卓越性能。新融资将用于团队扩建和研发加速。

◇ 「悠桦林」完成近亿元 C+轮融资,巩固 AI 智能决策行业领先地位 🔗 News

中国 AI 智能决策技术领军企业------悠桦林完成近亿元人民币的 C+轮融资,由上汽恒旭领投。新资金将加强在运筹优化领域的技术实力,招募顶级人才,深耕智能供应链计划与排程优化平台,提升技术领先优势,加速商业化步伐。悠桦林通过海量数据驱动 AI 智能决策,以一体化智能供应链计划与排程优化平台解决制造业难题,实现显著业务增长

相关推荐
sp_fyf_20245 分钟前
【大语言模型】ACL2024论文-19 SportsMetrics: 融合文本和数值数据以理解大型语言模型中的信息融合
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理
CoderIsArt8 分钟前
基于 BP 神经网络整定的 PID 控制
人工智能·深度学习·神经网络
开源社21 分钟前
一场开源视角的AI会议即将在南京举办
人工智能·开源
FreeIPCC22 分钟前
谈一下开源生态对 AI人工智能大模型的促进作用
大数据·人工智能·机器人·开源
机器之心40 分钟前
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
人工智能·后端
z千鑫41 分钟前
【人工智能】PyTorch、TensorFlow 和 Keras 全面解析与对比:深度学习框架的终极指南
人工智能·pytorch·深度学习·aigc·tensorflow·keras·codemoss
EterNity_TiMe_41 分钟前
【论文复现】神经网络的公式推导与代码实现
人工智能·python·深度学习·神经网络·数据分析·特征分析
机智的小神仙儿1 小时前
Query Processing——搜索与推荐系统的核心基础
人工智能·推荐算法
AI_小站1 小时前
RAG 示例:使用 langchain、Redis、llama.cpp 构建一个 kubernetes 知识库问答
人工智能·程序人生·langchain·kubernetes·llama·知识库·rag
Doker 多克1 小时前
Spring AI 框架使用的核心概念
人工智能·spring·chatgpt