ai

悟空码字2 小时前
ai·大模型·本地部署
延迟、吞吐、显存,开源模型部署的终极调优笔记大家好,我是小悟。在当前的AI工程化浪潮中,开源模型的私有化部署已成为企业保护数据隐私、控制推理成本的关键路径。
格桑阿sir6 小时前
ai·大模型·llm·agent·token·智能体·tokenization
04-大模型智能体开发工程师:Tokenization与模型推理流程系列文章导航:AI系列文章导航目录-持续更新中📝 本文摘要:本文详解Tokenization(BPE/WordPiece/Unigram三种主流方法)及其对模型"字数限制"、"数错字"和成本的实际影响,并逐步拆解从用户输入到模型输出的完整推理流程(Tokenization→特殊Token→Embedding→位置编码→Transformer层→采样→自回归→Detokenization),涵盖采样参数(Temperature/Top-p/Top-k)和KV Cache加速原理,附OpenAI API实战
视觉&物联智能6 小时前
人工智能·游戏·ai·chatgpt·openai·agi·deepseek
【杂谈】-游戏生成数据:人工智能训练中极易被低估的核心资源但人工智能行业,却对一个近在眼前的潜在数据富矿视而不见。游戏平台每日产出数TB的行为数据,其中涵盖结构化的实时决策、经济活动以及社交互动,且所有行为均在遵循统一物理规则构建的环境中有序开展。
JaydenAI7 小时前
ai·c#·agent·maf·agent pipeline
[MAF的Agent管道详解-04]如何让LLM按照要求的结构输出数据?针对IChatClient的结构化输出可以通过调用如下这些重载的GetResponseAsync<T>扩展方法来完成。具体的实现很简单,这些方法最终会利用指定或者默认的JsonSerializerOptions针对泛型参数T生成一个ChatResponseFormatJson对象,并作为ChatOptions的ResponseFormat属性。这个ResponseFormat承载的JSON Schema将提供给LLM指导它按照定义的格式生成输出内容。当IChatClient接收到LLM的响应结果时,利用匹
Swift社区8 小时前
人工智能·ai
推动AI领导力:构建全栈开放的智能生态大家好,我是 展菲,目前在上市企业从事人工智能项目研发管理工作,平时热衷于分享各种编程领域的软硬技能知识以及前沿技术,包括iOS、前端、Harmony OS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。
@蔓蔓喜欢你10 小时前
人工智能·ai
团队协作工具:提升开发效率的利器在现代软件开发中,团队协作工具至关重要:选择合适的团队协作工具能够:找到适合团队的工具组合,让协作更加高效顺畅。
阿部多瑞 ABU10 小时前
安全·ai
ADRO实战:用渐进式诱导“聊出”TATP完整合成路线——某国产大模型红队测试实录ADRO(Anchor-Deconstruct-Recur-Output)是我提出的一种长周期渐进式诱导框架。核心思想很简单:模型能挡住单次“教我造炸弹”,但挡不住7次“炸弹是什么”“结构怎么写”“条件要怎样”“怎么提纯”“总结一下”。
ToBeTuring11 小时前
ai·claude code·openclaw
openclaw和claude code的配置文件参考官方下载安装:https://nodejs.org/zh-cn/download/OpenClaw 和 Claude Code 的安装都需要依赖 Node.js 环境。
Hexian258012 小时前
java·spring·ai
SpringAI+RAG上一篇链接 依旧参照该课程目的:弥补训练过程中模型知识的不足,提升模型在特定领域的表现,尤其涉及到了私有数据。
Agent手记12 小时前
人工智能·安全·ai
制造业生产安全隐患智能识别系统落地指南 —— 结合企业级Agent构建国产安全闭环防御体系在2026年的工业5.0时代,制造业的安全生产已不再局限于传统的“物理围栏”。 随着国家智能制造系统解决方案“揭榜挂帅”项目的深入推进,安全隐患识别正经历从“事后追溯”向“事前预测、自主闭环”的跨越。 企业不仅要面对设备故障、违规操作等传统隐患,还需应对人员心理波动、工业网络数据安全等新型风险。 本文将立足2026年技术视角,深度拆解如何从0到1构建一套覆盖全要素的智能安全隐患识别系统, 并重点分析如何利用实在Agent这类原生端到端智能体,解决传统方案中最为棘手的“长链路易迷失”与“数据孤岛”难题。
搬砖的小码农_Sky12 小时前
人工智能·ai·gpu算力·agi
NVIDIA Geforce RTX 5060 Ti显卡能本地部署的哪些AI应用?我为你整理了NVIDIA GeForce RTX 5060 Ti显卡的核心规格,以及它能在本地运行的常见AI模型和应用。
geinvse_seg12 小时前
人工智能·ai·蓝耘元生代·蓝耘maas
QuantDinger 全网最全保姆级教程:5分钟搭建AI量化系统在这个连菜市场大妈都在讨论股票的时代,你有没有想过一个问题:为什么明明看了那么多研报,学了那么多战法,一到实操还是变成“韭菜”?
@蔓蔓喜欢你13 小时前
人工智能·ai
Git最佳实践:团队协作的基石大家好,我是蔓蔓。在大厂工作时,我们团队制定了一套严格的Git工作流规范。今天我来和大家分享Git的最佳实践。
一切皆是因缘际会14 小时前
人工智能·深度学习·ai·重构
人工智能从对话工具向自主生产力跃迁近两年,大众对人工智能的认知正在发生根本性转变。曾经的AI,无论模型参数多大、对话多流畅,本质上都属于“被动响应式工具”,人类下达指令,模型执行输出,无法突破人机单向交互的局限。而2025至2026年,人工智能正式告别聊天辅助阶段,进入AI智能体(Agent)规模化落地的全新周期。AI不再只做回答者,而是成为具备自主规划、任务拆解、工具调用、闭环纠错能力的独立智能单元,完成了从“对话AI”到“行动AI”的关键进化。
搬砖的小码农_Sky14 小时前
人工智能·ai·whisper·gpu算力
如何用Nvidia Geforce RTX 5060 Ti显卡进行本地Whisper语音转文字任务?在Windows平台上,用你的RTX 5060 Ti 16GB显卡搭建本地Whisper语音转文字服务,主要有几种方式:从开箱即用的图形界面,到追求极致速度的命令行,再到能集成其他AI应用的API服务。我整理了详细的步骤,你可以根据自己的技术背景和需求来选择。
老王谈企服14 小时前
人工智能·ai
2026企业数字化转型:从规则脚本到实在Agent智能体进化全解析站在2026年的时间节点回看,企业数字化转型已从“工具补丁时代”全面进入“原生智能时代”。 曾被视为提效利器的传统RPA(机器人流程自动化),在面对日益复杂的业务长链路与海量非结构化数据时,正逐渐显露出其作为“静态规则驱动”产物的局限性。 当下的企业自动化,需要的不再是机械的“动作复刻”,而是具备深度思考、自主决策与端到端闭环能力的数字员工。
小陶来咯15 小时前
python·ai
大模型Function Calling的底层原理面试官:“大模型的Function Calling是怎么实现的?底层原理是什么?”你可能会答:“在System Prompt里把工具的名称、参数、描述写进去。模型读懂描述后,判断用户意图,决定是否调用工具,然后返回JSON。外部系统拿到JSON去执行。”
li-xun15 小时前
人工智能·ai·ai编程
2026年5月22日博客精选本期精选涵盖了 AI 代理工具 Datasette Agent 的发布与迭代,深入探讨了 Anthropic 盈利能力的财务质疑及 AI 行业缺乏技术护城河的观点。安全领域聚焦于 Kimwolf 僵尸网络主谋被捕、NPM 供应链攻击以及 FreeBSD 内核漏洞。此外,还对 OpenAI o3 模型的地理定位能力进行了批判性评估,并提供了 Google I/O 演讲的极简回顾。
格桑阿sir15 小时前
ai·大模型·llm·部署·agent·qwen·本地部署
05-大模型智能体开发工程师:本地部署开源小模型实战系列文章导航:AI系列文章导航目录-持续更新中📝 本文摘要:本文指导在本地部署开源模型,包括硬件需求评估(显存估算)、Ollama一键部署方案(安装、运行、API调用)、量化技术(FP16/INT8/INT4及GGUF格式质量对比)、HuggingFace+transformers灵活方案、vLLM生产级加速(PagedAttention/连续批处理),以及从HuggingFace下载原始权重自行加载的完整实操(理解config.json/model.safetensors/tokenizer三大核心文
彦为君16 小时前
java·前端·网络·ai·ai编程
JavaSE-11-网络编程(详细版)现今社会,网络无处不在,我们上网刷视频、购物、打游戏,都离不开网络通信的支持。没有网络,你就是在玩单机游戏,只能在自己的电脑上折腾,没办法访问其他计算机的资源,无法和其他计算机服务器通信。