genai

特别关注外国供应商

Cohesity 获得第 12,619,501 号专利，该专利涵盖了其企业数据生成式人工智能平台 Cohesity Gaia™ 的基础技术Cohesity 宣布，美国专利商标局 (USPTO) 已授予该公司第 12,619,501 号专利，该专利涵盖了其企业数据生成式人工智能平台 Cohesity Gaia™ 的基础技术。该专利名为“使用嵌入技术检索备份系统中的数据”，于 2026 年 5 月 5 日颁发，涵盖了 Cohesity 的专有方法，该方法将辅助数据系统与检索增强生成 (RAG) 语义层相结合，从而为 GenAI 应用提供支持。Cohesity 是首家获得此方法专利的数据保护供应商，该方法使企业能够在不创建新的数据孤岛、不削弱治理

老A的AI实验室

Cyber Weekly #665月28日，Anthropic宣布完成650亿美元的H轮融资，投后估值达到9650亿，正式超越OpenAI成为全球估值最高的AI公司，这也是该公司在IPO前的最后一轮大规模融资。同日，Anthropic发布了旗舰模型Claude Opus 4.8，新模型引入了"Dynamic Workflows"功能，能够自主管理多个子智能体协作完成复杂任务，并且在不确定性检测和主动风险识别方面有显著提升。据Reuters报道，Anthropic还将在未来数周内推出下一代模型Claude Mythos。此外，Anthro

带娃的IT创业者

本地AI的觉醒：GitNexus如何让GenAI从云端走向你的口袋当我们在2025年回望AI发展的轨迹，一个清晰的分水岭已经显现：大模型不再是云端巨头的专属玩具。从GPT-5.5到Qwen3.6 Max，从GLM 5.1到DeepSeek 4.0 Pro，主流大模型的能力已经膨胀到令人咋舌的地步。然而，这种能力背后隐藏着一个尴尬的现实——每一次对话都需要将你的数据上传到千里之外的服务器，每一次推理都依赖着昂贵的GPU集群。就在这种“云端依赖症”愈演愈烈之际，一个名为GitNexus的开源项目悄然登上GitHub热门榜单，它试图回答一个根本性的问题：当AI能力足够强大时，

告别玩具级 Demo！深度拆解 agents-towards-production，用硬核工程把 AI Agent 推向工业级生产线发布日期： 2026-05-18标签： #AIAgent #生产级部署 #GenAI #LLMOps #软件工程 #架构优化

第12章（3）——项目十：使用StreamHandler+GenAI+Gemini构建实时音频+视频艺术评论家在使用FastRTC+Gemini创建实时沉浸式音频+视频演示之前，先了解下Gemini模型及简单功能，还有用于实时传输的Live API。本节先介绍Gemini模型。

大鹏的NLP博客

ONNX Runtime GenAI C++ GPU 推理完整指南在使用 ONNX Runtime GenAI v0.12.0 进行 C++ GPU 推理时，遇到了多个挑战：

Generative AI: RAG, AI Agents & Deployment目录Useful linksTypes and Application of Gen AIMarketing

【图像处理基石】如何高质量地生成一张庆祝元旦的图片？元旦作为新年伊始的重要节点，高质量的节日图片在社交分享、品牌宣传、新媒体运营等场景中需求旺盛。从算法工程师的视角来看，“高质量元旦图片生成”并非单纯的美工设计，而是通过可控的技术方案（传统图像处理/生成式AI），结合视觉设计原则，实现“风格统一、主题突出、细节丰富、可复现”的图片输出。本文将拆解核心技术原理，并提供两套可直接上手的代码方案，兼顾可控性与创意性，满足不同场景的元旦图片生成需求。

深度解析 Cursor（逐行解析系统提示词、分享高效制定 Cursor Rules 的技巧...）编者按：我们今天为大家带来的这篇文章，作者的观点是：只有深入理解 AI 编程工具的底层原理和能力边界，才能真正驾驭这些工具，让它们成为提升开发效率的“外挂神器”。

“一代更比一代强”：现代 RAG 架构的演进之路编者按：我们今天为大家带来的文章，作者的观点是：RAG 技术的演进是一个从简单到复杂、从 Naive 到 Agentic 的系统性优化过程，每一次优化都是在试图解决无数企业落地大语言模型应用时出现的痛点问题。

45分钟从零搭建私有MaaS平台和生产级的Qwen3模型服务今天凌晨，阿里通义团队正式发布了 Qwen3，涵盖六款 Dense 模型（0.6B、1.7B、4B、8B、14B、32B）和两款 MoE 模型（30B-A3B 和 235B-A22B）。其中的旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中，与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比，表现出了强大的竞争力。小型 MoE 模型 Qwen3-30B-A3B 的激活参数是 QwQ-32B 的 10%，但表现更胜一筹

GPUStack v0.5：模型Catalog、图生图功能上线，多维优化全面提升产品能力与使用体验GPUStack 是一个专为运行 AI 模型设计的开源 GPU 集群管理器，致力于支持基于任何品牌的异构 GPU 构建统一管理的算力集群。无论这些 GPU 运行在 Apple Mac、Windows PC 还是 Linux 服务器上，GPUStack 都能将它们纳入统一的算力集群中。管理员可以轻松地从 Hugging Face 等流行的模型仓库中部署 AI 模型，开发人员则能够通过 OpenAI 兼容的 API 访问这些私有模型服务，就像使用 OpenAI 或 Microsoft Azure 提供的公共模

老A的AI实验室

赛博周刊·2024年度工具精选（图片资源类）emoji表情包查找工具。微软开源的Fluent Emoji表情包。一个开源的emoji库，目前拥有4000+个emoji表情。

机械鹦鹉与真正的智能：大语言模型推理能力的迷思编者按：大语言模型真的具备推理能力吗？我们是否误解了"智能"的本质，将模式匹配误认为是真正的推理？本文深入探讨了大语言模型（LLMs）是否真正具备推理能力这一前沿科学问题，作者的核心观点是：LLMs 本质上是高级的模式识别机器，而非真正具备逻辑推理能力。

制作并量化GGUF模型上传到HuggingFace和ModelScopellama.cpp 是 Ollama、LMStudio 和其他很多热门项目的底层实现，也是 GPUStack 所支持的推理引擎之一，它提供了 GGUF 模型文件格式。GGUF (General Gaussian U-Net Format) 是一种用于存储模型以进行推理的文件格式，旨在针对推理进行优化，可以快速加载和运行模型。

在昇腾Ascend 910B上运行Qwen2.5推理目前在国产 AI 芯片，例如昇腾 NPU 上运行大模型是一项广泛且迫切的需求，然而当前的生态还远未成熟。从底层芯片的算力性能、计算架构的算子优化，到上层推理框架对各种模型的支持及推理加速，仍有很多需要完善的地方。

在昇腾Ascend 910B上运行Qwen2.5推理目前在国产 AI 芯片，例如昇腾 NPU 上运行大模型是一项广泛且迫切的需求，然而当前的生态还远未成熟。从底层芯片的算力性能、计算架构的算子优化，到上层推理框架对各种模型的支持及推理加速，仍有很多需要完善的地方。

网络研究院

到 2029 年，人工智能驱动的电子商务欺诈将超过 1070 亿美元随着人工智能生成的深度伪造产品的使用日益增多，电子商务欺诈行为急剧增加，给在线商家带来了前所未有的安全挑战。

老A的AI实验室

AI Agent的20个趋势洞察结论整理自【QuestMobile2024 AI智能体应用洞察半年报】：以下是原报告：

GPUStack 0.2：开箱即用的分布式推理、CPU推理和调度策略GPUStack 是一个专为运行大语言模型（LLM）设计的开源 GPU 集群管理器，旨在支持基于任何品牌的异构 GPU 构建统一管理的算力集群，无论这些 GPU 运行在 Apple Mac、Windows PC 还是 Linux 服务器上，GPUStack 都能将它们纳入统一的算力集群中。管理员可以从如 Hugging Face 等流行的大语言模型仓库中轻松部署任意 LLM，开发人员则可以像访问 OpenAI 或 Microsoft Azure 等供应商提供的公有 LLM 服务的 API 一样，简便地通过