架构

Tadas-Gao30 分钟前
人工智能·深度学习·机器学习·架构·大模型·llm
大模型幻觉治理新范式:SCA与[PAUSE]注入技术的深度解析与创新设计自以GPT系列为代表的大语言模型(LLMs)崛起以来,其展现的非凡语言生成与理解能力已深刻重塑了人机交互的范式。然而,一个幽灵始终徘徊在AI世界的上空——幻觉(Hallucination)。它特指模型生成的内容在语法上流畅连贯,逻辑上看似严谨,实则与输入源信息(忠实性)或客观事实(事实性)严重不符的现象。正如Gartner在2024年报告中所警示,幻觉与模型滥用已成为生成式AI的两大核心风险。在医疗诊断、法律咨询、金融分析等高风险场景中,一个微小的幻觉便可能引发决策误导、信任崩塌乃至严重的社会伦理危机。例
PKUMOD31 分钟前
人工智能·语言模型·架构
论文导读 | 在长上下文及复杂任务中的递归式语言模型架构大型语言模型虽然取得了显著进展,但其固定的上下文窗口限制了其在长文本和复杂任务中的应用。即使是在其窗口范围内,仍存在“上下文衰退”现象,即模型对早期输入信息的理解和记忆逐渐减弱。这一问题在需要长期规划、多步骤推理或复杂交互的智能体任务中尤为突出。在智能体系统中,模型需要在长时间跨度内保持目标一致性、避免任务漂移和循环失败。下文压缩技术通过摘要生成、选择性遗忘、滑动窗口等手段减少输入长度,但往往丢失细节信息或导致语义断裂。任务分解则将复杂任务拆分为多个子任务,分别处理后再进行整合,但在缺乏全局协调机制时容易
梦想的旅途21 小时前
架构·企业微信·rpa
Python 开发企微第三方 API:RPA 模式下外部群主动调用实现API驱动企微自动化,让开发更高效核心能力:为开发者提供标准化接口、快速集成工具,助力产品高效拓展功能场景
梦想的旅途21 小时前
架构·企业微信·rpa
RPA 架构下的企微非官方 API:外部群主动调用的技术实现与优化API驱动企微自动化,让开发更高效核心能力:为开发者提供标准化接口、快速集成工具,助力产品高效拓展功能场景
查无此人byebye1 小时前
人工智能·pytorch·python·深度学习·架构·开源·音视频
阿里开源Wan2.2模型全面解析:MoE架构加持,电影级视频生成触手可及在AI视频生成领域,“高清、高效、可控”始终是开发者与创作者追求的核心目标。2025年7月28日,阿里通义万相正式开源新一代视频生成模型Wan2.2,一举打破了开源模型在计算效率与生成质量之间的平衡困境——不仅首创电影美学控制系统,更将MoE架构引入视频扩散模型,推出多版本模型适配不同场景,让消费级GPU也能运行720P高清视频生成任务。本文将从模型核心特性、技术架构、部署实操、应用场景四大维度,带开发者全面吃透Wan2.2,快速上手这款里程碑式的开源视频生成工具。
汪碧康2 小时前
云原生·容器·架构·kubernetes·gateway·kubelet·xkube
一文讲解kubernetes的gateway Api的功能、架构、部署、管理及使用Gateway API 是一个官方的 Kubernetes 项目,专注于 Kubernetes 中的 L4 和 L7 路由。该项目代表了 Kubernetes Ingress、负载均衡和 Service Mesh API 的下一代。从一开始,它就被设计为通用的、表达力强的且面向角色的。API的大部分配置都包含在路由层中。这些特定于协议的资源(如HTTPRoute、GRPCRoute等)为Ingress和Service Mesh都提供了高级路由功能。官网地址:https://gateway-api.sigs
Blossom.1182 小时前
人工智能·笔记·python·深度学习·神经网络·架构·whisper
从单点工具到智能流水线:企业级多智能体AI开发工作流架构实战最近研学过程中发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击链接跳转到网站人工智能及编程语言学习教程。读者们可以通过里面的文章详细了解一下人工智能及其编程等教程和学习方法。下面开始对正文内容的介绍。
梵得儿SHI2 小时前
spring cloud·微服务·云原生·架构·微服务拆分·ddd方法论·分布式数据一致性
实战项目落地:微服务拆分原则(DDD 思想落地,用户 / 订单 / 商品 / 支付服务拆分实战)在互联网项目从单体架构向微服务架构演进的过程中,微服务拆分是第一道门槛,也是决定项目成败的核心环节。拆得好,服务各司其职、扩展性强、运维便捷;拆得差,会陷入 “分布式单体” 的泥潭 —— 服务间耦合严重、分布式事务满天飞、性能瓶颈凸显,反而比单体架构更难维护。
Blossom.1182 小时前
人工智能·python·算法·架构·自动化·whisper·哈希算法
从“金鱼记忆“到“超级大脑“:2025年AI智能体记忆机制与MoE架构的融合革命2025年,AI智能体(AI Agent)正经历从"即时反应者"到"经验学习者"的关键进化。字节跳动Seed团队最新发布的M3-Agent-Memorization研究揭示,通过模拟人类大脑的海马体记忆机制,智能体的长期记忆能力实现了300%的保存周期提升和2.3倍的决策响应速度。与此同时,以DeepSeek V3为代表的细粒度混合专家模型(MoE)架构走向成熟,通过稀疏激活机制实现了计算效率的质的飞跃。
铁蛋AI编程实战2 小时前
人工智能·架构
AI Agent工程化落地深度解析:从架构拆解到多智能体协同实战(附源码/避坑)2026年AI Agent已从概念验证走向规模化落地,但多数开发者仍陷入“插件拼接即Agent”的认知误区,面临“架构混乱、记忆失控、工具调用鲁棒性不足、多智能体协同失效”四大核心痛点。本文跳出基础工具使用层面,从AI Agent底层架构拆解(五大核心模块)切入,深度解析LangChain工具系统源码逻辑、提示词工程(Prompt Engineering)进阶技巧,结合多智能体协同实战场景(代码开发全流程自动化),拆解工程化落地的关键难点与可复用解决方案,附核心源码片段与优化策略,同时预判2026年AI
vx-bot55566615 小时前
大数据·架构·企业微信
企业微信接口在多租户SaaS平台中的集成架构与数据隔离实践企业微信接口在多租户SaaS平台中的集成架构与数据隔离实践随着SaaS(软件即服务)模式的普及,如何在一个多租户平台中安全、高效、可定制地集成企业微信接口,成为SaaS提供商面临的关键技术挑战。这不仅涉及技术实现,更关系到核心的数据隔离、配置管理和商业化逻辑。本文旨在深入探讨在企业级SaaS平台中,设计一套支持多租户的企业微信集成架构方案。
桌面运维家17 小时前
架构
vDisk流量怎么精细化分配?VOI/IDV架构配置指南本方案旨在通过VOI/IDV架构,利用vDisk云桌面的精细化流量控制能力,帮助企业实现云桌面环境的降本增效。通过统一平台管理,解决传统桌面运维复杂、更新缓慢、安全风险高的问题,同时兼顾性能、兼容性和离线可用性。
zuozewei17 小时前
人工智能·架构
7D-AI系列:DeepSeek Engram 架构代码分析Engram的github仓库地址Engram 是一个条件记忆模块,通过 N-gram 嵌入实现 O(1) 查找,作为 MoE 的补充。
徐礼昭|商派软件市场负责人17 小时前
架构
Moltbot,也就是OpenClaw的底层架构解析本文围绕OpenClaw(曾用名:Clawdbot、Moltbot))的底层架构展开,其核心基于AI主权(AI Sovereignty)与操作系统即界面(OS as Interface)两大设计原则。区别于依赖云端API的传统SaaS模式AI,Clawdbot强调数据主权,主张将用户隐私数据存储于本地服务器,这也是其采用本地优先架构的主要原因。
国科安芯17 小时前
单片机·嵌入式硬件·架构·制造·risc-v·pcb工艺·安全性测试
面向星载芯片原子钟的RISC-V架构MCU抗辐照特性研究及可靠性分析摘要: 随着卫星互联网星座建设的加速推进,星载芯片原子钟作为高精度时频基准源,其控制微控制器(MCU)的抗辐照性能成为影响系统长期可靠性的关键因素。本文针对国科安芯AS32S601ZIT2型32位RISC-V架构MCU,基于脉冲激光单粒子效应辐照、100MeV质子单粒子效应辐照及钴-60γ射线总剂量辐照试验,系统评估了该器件在商业航天环境下的抗辐射性能,深入探讨了该型MCU在星载原子钟温控、频率锁定及驯服控制等关键功能模块中的适用性,分析其在低轨卫星互联网星座长期运行中的可靠性表现,为星载时频基准系统的器
小北的AI科技分享18 小时前
架构·模型·搭建
人工智能大模型搭建:数据、算法与算力的三大基石搭建人工智能的大模型,属于一项系统工程,它涉及种种环节,像是数据准备,模型架构设计,训练优化以及部署应用等。从技术实施的角度去看,这一过程得综合考量算法创新,计算资源以及工程实践的平衡。
OceanBase数据库官方博客18 小时前
数据库·架构·oceanbase·分布式数据库
爱奇艺基于OceanBase实现百亿级卡券业务的“单库双擎”架构升级摘要:爱奇艺卡券业务原采用 “MySQL 分库分表 + ES 异步同步” 架构,面临 TP/AP 分离导致的架构复杂、AP 查询分钟级延迟、数据一致性隐患等问题。如今借助 OceanBase 的 HTAP 能力,将 AP、TP 业务融合到一个数据库,在架构简化、成本控制与效率提升方面均取得了突破。
一品威客网18 小时前
架构
App 软件制作的核心技术与方法:从架构到落地App 制作需围绕 “稳定、高效、适配” 三大目标,核心技术聚焦底层架构与功能实现,开发方法则需平衡效率与定制化,具体可分为两大维度:
xixixi7777719 小时前
大数据·人工智能·架构·零信任·通信·个人隐私
基于零信任架构的通信要理解零信任通信,首先要对比其与传统安全模型的根本区别。零信任的核心原则,美国国家标准与技术研究院总结为:
heartbeat..21 小时前
java·redis·性能优化·架构
Redis 性能优化全指南:从基础配置到架构升级单实例是 Redis 部署的基础,基础配置的不合理会直接导致 CPU、内存、IO 瓶颈,这一层优化投入低、收益高。