大模型

汤姆yu3 小时前
ai·大模型·cedar
Cedar鉴权体系全面技术解析在云原生、微服务、零信任架构全面普及的当下,传统授权模型存在的权限粒度粗放、策略与业务代码耦合、规则难以统一管控、安全风险不可量化等问题愈发凸显。基于硬编码的权限判断、传统RBAC角色权限模型无法适配复杂动态的业务场景,难以满足企业精细化权限管控、合规审计、动态授权的核心需求。为解决这一行业痛点,亚马逊云科技推出开源授权策略语言Cedar,依托可验证的安全语义、高可读性语法、多模型兼容特性,构建起一套轻量化、高性能、高安全的现代化鉴权体系。目前Cedar已被CNCF收录,广泛应用于AWS、阿里云等主流云厂
可信AI Coding4 小时前
ai·大模型·编程
AI产业周报|AI编程工具的代际跃迁:可信智能开发进入自主时代2026年5月第三期|精华汇总01国家网信办发布智能体规范应用与创新发展实施意见核心内容国家网信办正式印发智能体规范应用与创新发展实施意见,明确将安全、可靠、可信作为智能体发展的底线,贯穿研发、部署、推广全过程。文件提出建立智能体标准体系,推广智能体互联协议(AIP),探索构建智能体注册平台。
qq_525513754 小时前
大模型
第七章 指令微调学习(五)Extracting and saving responses在对指令数据集的训练部分完成LLM的微调后,现在评估其在保留测试集上的性能。首先,我们提取测试集中每个输入对应的模型生成响应并进行人工分析;随后通过图7.18所示方法对LLM进行评估,以量化响应的质量。
这是谁的博客?6 小时前
人工智能·gpt·ai·google·大模型·gemini·新闻
AI 领域精选新闻(2026-05-21)本周 AI 领域重点关注:Google I/O 2026 发布多项重磅更新、OpenAI 推出 GPT-5.5 Instant 新默认模型、AI 编程工具生态持续演进。共精选 8 条技术新闻,涵盖大模型、多模态生成、智能体平台、AI 工具、智能硬件等方向。
Bruce_Liuxiaowei8 小时前
人工智能·ai·大模型·智能体·workbuddy
WorkBuddy案例——自动化内容创作平台本案例展示如何用 WorkBuddy 构建一个"多平台内容生成原型",帮助媒体和营销人员根据主题、平台和基础参数快速生成内容草稿。当前版本以模板和规则组织为主,重点展示内容生产智能体的结构设计与输出流程。
刘大猫.10 小时前
人工智能·ai·chatgpt·机器人·大模型·openai·anthropic
GPT-5.5才发三周,5.6已在内测!OpenAI与Anthropic补贴大战同日开打,开发者坐收渔利三周前GPT-5.5刚落地,GPT-5.6的消息已经提前炸出来了。知名爆料人Leo透露,GPT-5.6目前开发进度已全速推进,首批内部检查点在过去几天已启动测试,下个月很可能就会正式露面。更有意思的是,有人从OpenAI内部Codex日志里扒出了rollout mapping的痕迹——大部分调用还是指向GPT-5.5,但有一条记录赫然落在了GPT-5.6身上。换句话说,Codex环境里可能已经在偷偷用它跑测试了。内部代码名也被顺带曝光:ember-alpha 和 beacon-alpha。
weixin_5536544811 小时前
人工智能·chatgpt·大模型
ChatGPT好用还是Gemini好用?作为一名成天跟大模型打交道、写代码和调教智能体(Agent)的底层架构师,我每天被问到最高频的问题就是:“老哥,现在到底是 ChatGPT 好用,还是 Gemini 好用?”
DogDaoDao11 小时前
人工智能·开源·大模型·github·aigc·ai编程·aiagent
【GitHub】AgentMemory 深度解析:让 AI 编程代理拥有持久化记忆的 16K+ Star 开源方案项目地址: https://github.com/rohitg00/agentmemory | Stars: 16.2K+ | 许可证: Apache-2.0 版本: v0.9.21(2026-05-19) | 语言: TypeScript (81.4%) | NPM: @agentmemory/agentmemory
佳杰云星1 天前
人工智能·kubernetes·大模型·云计算·gpu·算力调度·智算中心
如何给大模型集群选“大脑”?智算调度与管理平台 10 维选型指南(附选型评分表)随着大模型引发的 AI 浪潮席卷各行各业,智算中心、企业 AI 平台和科研算力集群的建设迎来爆发式增长。然而,如何高效管理动辄成百上千卡、甚至异构多元的算力资源,成为摆在技术架构师和运营者面前的难题。
牧子川1 天前
大模型·tools·functioncalling
016-Function-Calling💡 摘要:通过工具注册、模型决策、工具执行和结果整合四步流程,让大语言模型能够调用外部工具,突破知识限制,实现实时数据查询和业务系统集成。
这是谁的博客?1 天前
ai·大模型·kimi·长上下文·月之暗面·国产ai
[模型解析] Kimi: 模型架构与长上下文能力分析Kimi 是月之暗面开发的大语言模型,以其超长上下文处理能力著称。本文将分析 Kimi 的技术架构与核心能力。
这是谁的博客?1 天前
gpt·ai·chatgpt·大模型·gpt-3·openai
[模型解析] GPT: 模型演进分析从GPT-3到GPT-5.5OpenAI 的 GPT 系列模型在过去几年经历了快速演进,从 2020 年的 GPT-3 到 2026 年的 GPT-5.5,每一次迭代都带来了显著的能力提升和架构创新。本文将系统分析 GPT 模型的演进路径与技术特点。
养肥胖虎1 天前
大模型·llm·学习路线
完整学习LLM(一):为什么我要系统学习大模型好家伙,最近这几天一直在写 RAG.从"让大模型先查资料再回答",写到"微调和 RAG 的区别",又写到"为什么攻击力大于 50 这种问题不能只靠 RAG".
这是谁的博客?1 天前
ai·架构·大模型·moe·开源模型·deepseek·国产ai
[模型解析] DeepSeek: 技术创新与架构解析DeepSeek 作为国产大模型的代表,在开源领域取得了显著突破。本文将深入分析 DeepSeek 的技术创新与架构设计。
这是谁的博客?1 天前
ai·google·架构·大模型·多模态·视频生成·gemini
[模型解析] Gemini: 多模态技术架构深度解析Google 在 2026 年 I/O 大会上发布了 Gemini 3.5 和 Gemini Omni,标志着多模态 AI 进入全新的发展阶段。本文将从技术架构角度深入解析 Gemini 的多模态能力设计。
程序猿编码1 天前
linux·python·ai·大模型
大模型的“文字障眼法“:FlipAttack 文本反转越狱技术全解析想象一下,有个调皮的小孩想带进游乐园一个违禁品。安检人员耳朵很尖,一听到"炸弹""刀具"这些词就会拦人。于是小孩想了个办法——把话说反。
DogDaoDao2 天前
人工智能·深度学习·开源·大模型·ai agent·智能体·openhuman
【AI Agent 深度解析】OpenHuman 开源项目全面分析 — 打造你的个人 AI 超级智能助手在 AI Agent(智能代理)快速发展的今天,我们面临着一个核心问题:大多数 AI 助手需要从零开始学习用户,需要花费数天甚至数周才能真正了解你的技术栈和工作流。
龙骑士baby2 天前
深度学习·ai·大模型·llm·ai生态
重建 AI 认知第 1 篇:基础认知——一张地图看懂 AI Landscape先解决一个最基础、但也最容易混淆的问题:AI、ML、DL、GenAI、AGI,它们到底是什么关系?很多人以为它们是并列的,或者是一个路线上的几个阶段。其实不是,它们是套娃结构:
牧子川2 天前
大模型·格式化输出
016-Structured-Output-Practical💡 摘要:结合 Pydantic 数据验证、JSON 格式控制和函数调用,掌握 with_structured_output() 高级 API 和手动 Chain 构建两种方案,构建可靠的 AI 结构化输出系统。
龙侠九重天2 天前
人工智能·深度学习·数据挖掘·大模型·llm·embedding·聚类
Embedding 模型深度使用——语义搜索与聚类Embedding(嵌入)是一种将离散、高维的符号数据映射到连续、低维向量空间的技术。在自然语言处理领域,Embedding 将文字、句子或文档转换为数值向量,使得语义相近的内容在向量空间中拥有相似的位置关系。