aigc

大写-凌祁3 小时前
人工智能·计算机视觉·语言模型·自然语言处理·aigc
RescueADI:基于自主智能体的遥感图像自适应灾害解译摘要——目前用于遥感图像(RSI)灾害场景解译的方法大多聚焦于孤立任务,如语义分割、目标检测或视觉问答(VQA)。然而,现有解译方法在需要综合多种感知方法和专用工具的任务上往往表现不佳。为填补这一空白,本文提出了自适应灾害解译(ADI)这一新型任务,旨在通过规划和执行多个顺序相关的解译子任务来响应用户请求,从而对灾害场景进行综合分析。为促进该领域的研究与应用,我们构建了名为 RescueADI 的新数据集,该数据集包含高分辨率遥感图像,并从规划、感知和识别三个相互关联的维度提供标注。数据集包含 4,044
泰白聊AI4 小时前
服务器·人工智能·驱动开发·ai·aigc·ai编程
AI 编程时代的规范驱动开发:OpenSpec 实践指南每天免费领 1亿 Token,白嫖DeepSeek、GLM、MiniMax、Kimi等大模型!当 AI 都能提笔写代码了,咱们真正缺的是啥?其实不是生成代码的速度,而是人机之间那份靠谱的共识。
KC2705 小时前
人工智能·安全·aigc
大模型提示词注入攻击与防御:当你的 AI 开始“不听话“2026 年初,某金融公司的客服 AI 突然开始向用户透露其他客户的账户信息。安全团队排查了整整三天,最后发现没人入侵数据库,也没人篡改代码——问题出在一段看似无害的用户输入上。
Hommy886 小时前
python·开源·aigc·剪映小助手
【开源剪映小助手-客户端】目录扫描功能目录扫描功能是 CapCut Mate 项目中的核心特性之一,主要用于实现剪映草稿文件的自动发现和管理。该功能通过模拟文件系统变更事件,使剪映应用程序能够自动检测到新下载的草稿文件,而无需重启应用程序。
光影少年16 小时前
人工智能·aigc·ai编程
AI Agent智能体开发🧠 一句话理解 AI Agent👉 AI Agent ≠ 只是调用接口 👉 本质是:“能思考 + 会用工具 + 能完成任务的程序”
小程故事多_801 天前
人工智能·架构·aigc·harness
Anthropic 内部架构曝光,Claude Code 如何用 Harness 驾驭强智能在AI技术飞速迭代的当下,大语言模型的突破让智能体(Agent)成为行业焦点。无数开发者和企业试图通过复杂的规则引擎、堆砌API胶水代码来赋予Agent智能,却往往陷入系统脆弱、难以维护、换个场景就崩溃的困境。而2026年3月底Claude Code源码意外泄露事件,为行业提供了一份珍贵的工业级研究标本。这个在生产环境中打磨过的Agent系统,其架构设计的核心逻辑直指AI Agent构建的本质,那就是Harness Engineering的核心价值,不试图编程智能,而是为智能构建稳固的基础设施。
小程故事多_801 天前
人工智能·aigc
从Harness工程视角深度解读Claude Code源码,AI编码Agent的工业级实现逻辑2026年3月底,Anthropic旗下命令行编码Agent工具Claude Code,因npm发布包中的source map文件意外暴露存储在官方R2存储桶内的未混淆源码,让外界首次得以窥见工业级AI Agent系统的真实架构。这份超过51万行TypeScript代码的工程样本,不仅揭示了软件供应链安全中的构建产物泄露风险,更为AI Agent领域的核心工程概念Harness提供了教科书级别的实践案例。
小程故事多_801 天前
人工智能·安全·架构·aigc·ai编程·harness
无 GitAI 依赖|企业 AI 编码合规管控 + 全生命周期追溯,实现效率与安全双向破局在数字化研发飞速发展的今天,AI编码工具已经成为企业研发团队提升效率的核心助力。从Claude Code到Cursor,各类AI编码工具能够快速生成代码片段、优化逻辑、修复bug,让研发人员从繁琐的基础编码工作中解放出来,将更多精力投入到核心业务逻辑的设计与创新中。但与此同时,AI编码工具的广泛使用也给企业带来了一系列不容忽视的风险与挑战,这些问题如果得不到有效解决,不仅可能导致敏感数据泄露、合规审计失败,还可能在代码出现问题时无法定位源头,给企业带来不必要的损失。
网络安全学习库1 天前
vue.js·人工智能·react.js·小程序·aigc·产品经理·ai编程
很喜欢Vue,但还是选择了React: AI时代的新考量作为一个深度使用Vue多年的开发者,最近我在新项目技术选型时,却最终选择了React。这个决定不是一时冲动,而是基于当前技术发展趋势、AI时代的需求以及生态系统的深度思考。
一山秋叶1 天前
python·aigc·sglang
wan2.2-i2v-a14b 模型架构万象是开源的一系列视频生成模型,提出新的时空变分自编码器(VAE)、可扩展的预训练策略、大数据监管、自动化评测指标,提升模型性能和通用性。14B模型在数十亿图片和视频上训练,在数据量和模型大小上都展现出scaling law。覆盖多样下游任务,包括图生视频、指令引导的视频编辑等等,能接受中文。1.3B模型只需要8.19GB VRAM。这里只关注DiT 的模型架构和前向过程。
GISer_Jing2 天前
开发语言·人工智能·架构·aigc
Agent多代理架构:子代理核心机制解密在AI Agent的规模化应用场景中,单代理的能力边界与执行效率难以满足复杂任务需求,多代理协作架构成为核心解决方案。本文聚焦于主代理(Main Agent)体系下子代理的核心设计、生成模式、通信机制及集群协作逻辑,结合技术实践拆解多代理系统的底层运行规则。
一山秋叶2 天前
人工智能·aigc·stablediffusion
EDM 框架下的扩散模型们论文链接:Elucidating the Design Space of Diffusion-Based Generative Models(22‘6)
imbackneverdie2 天前
图像处理·人工智能·aigc·科研绘图·ai工具·gemini·ai生图
怎么将AI生成的图片转成可编辑的矢量图?做科研的宝子们谁懂啊!绘制科研插图真的太费时间了😭 要么得花几天啃专业绘图软件,要么找素材拼凑导致视觉割裂、标注出错,好不容易用AI生成一张满意的图,却发现无法编辑、分辨率不足,连期刊投稿的基本要求都达不到,白白浪费前期精力。
AI精钢2 天前
人工智能·云原生·开源·aigc
谷歌时隔一年发布“更加开源“的 Gemma 4,意图何为?2026 年 4 月 3 日 — 就在昨天(4 月 2 日),Google DeepMind 正式发布了 Gemma 4 模型家族。距离 2025 年 3 月 12 日 Gemma 3 发布,整整 13 个月。
小程故事多_802 天前
人工智能·架构·aigc·ai编程·harness
自然语言智能体控制框架,重塑AI Agent的协作与执行范式在人工智能技术飞速发展的今天,AI智能体(Agent)已经从单一的文本生成,走向了多步骤推理、工具调用、跨任务协作的复杂阶段。不管是代码编写、桌面操作,还是复杂问题的分析解决,智能体的表现好坏,早已不只是底层大模型能力的比拼,而是围绕模型的整套控制逻辑,也就是控制框架(Harness)在起决定性作用。
小驴程序源2 天前
gpt·langchain·aigc·embedding·ai编程·llama·gpu算力
【OpenClaw 完整安装实施教程(Windows + Ollama 本地模型)】OpenClaw(俗称 “小龙虾”)是一款开源、本地优先、以任务执行为核心的 AI 智能体(Agent)框架,核心价值是将 AI 从 “只给建议” 的对话模式,升级为 “动手执行” 的自动化模式
花千树-0102 天前
java·spring boot·ai·chatgpt·langchain·aigc·ai编程
Java 实现 ReAct Agent:工具调用与推理循环适合人群:希望让 AI 主动调用外部工具、自动完成任务的 Java 开发者 核心概念:ReAct、工具调用(Tool Use)、推理循环 前置阅读:文章1:5分钟构建第一个AI应用
GISer_Jing2 天前
人工智能·ai·架构·aigc
Claude Code网桥架构深度解析在 Claude Code 的生态中,网桥(Bridge) 是连接「图形化交互端(Claude Desktop/Web)」与「代码执行端(Claude Code CLI/远程容器)」的核心枢纽。它不仅打通了界面与执行的通信链路,更支撑了 Claude Code Remote、分布式多 Agent 协作、容器化部署等高级能力。本文将结合架构图、源码逻辑与工程实践,彻底拆解网桥的实现原理、核心模块与通信机制。
摄影图2 天前
网络·安全·aigc·贴图·插画
隐私保护数字盾牌设计图片素材 满足各类网络安全创作需求网络安全与隐私:隐私标识设计及防护资源汇总 本文收集网络安全与隐私领域的视觉资源,包含隐私标识、数字盾牌等设计素材,提供Figma/Sketch多格式文件,为社交媒体内容创作提供防护设计灵感。
杀生丸学AI2 天前
人工智能·大模型·aigc·safari·三维重建·3dgs·世界模型
【世界模型】Captain Safari:位姿对齐3D记忆的世界引擎(CVPR 2026)标题:Captain Safari: A World Engine with Pose-Aligned 3D Memory 来源:约翰霍普金斯大学;清华大学 ;加州大学圣克鲁兹分校 链接:https://johnson111788.github.io/open-safari/