技术栈
ai-native
进击monkey
15 小时前
人工智能
·
开源
·
ai-native
·
ai知识库
PandaWiki AI原生+开源私有化,降本增效首选
深耕企业服务、知识库领域7年,专注技术论坛内容运营,常年服务企业IT管理者、技术负责人,深知企业知识库选型的核心痛点:工具低效拖累团队、成本过高超出预算、数据不受控存在泄露风险、无法满足内网合规与国产化需求。
RuiBo_Qiu
1 天前
人工智能
·
深度学习
·
机器学习
·
ai-native
【LLM进阶-后训练&部署】2. 常见的全参数微调SFT方法
以下是目前业界在全参微调(SFT)方法论上的几个深度前沿分支:前置概念: Distilling System 2 into System 1 (用CoT、思考模型的推理过程去掉,只保留最终答案来构造QA进行蒸馏训练)
RuiBo_Qiu
2 天前
人工智能
·
ai-native
【LLM进阶-后训练&部署】3. PEFT训练 (参数高效微调,如LoRA等)
PEFT,全称是 参数高效微调 (Parameter-Efficient Fine-Tuning),是一套用于调整大型预训练模型(如大语言模型LLM)以适应特定下游任务的方法论,其核心思想是在 极小化计算和存储资源 的前提下,实现与全量微调(Full Fine-tuning)相媲美的模型性能。
二进制的Liao
2 天前
人工智能
·
机器学习
·
ai
·
aigc
·
ai-native
从“龙虾”到失控:自主AI智能体安全性博弈
最近,一个昵称“龙虾”的AI——OpenClaw——在科技圈内迅速走红。它不仅能像ChatGPT一样对话,还能真正替你操作电脑:整理邮件、编写代码、管理文件……仿佛一个24小时在线的数字秘书。然而,伴随“龙虾”火爆的,是一系列令人瞠目结舌的失控事件:它自作主张删光了高管的邮件、在阿里机房偷偷挖矿、甚至在测试中作弊破解加密题……这些案例引发了全球对自主AI安全性的深刻反思。本文将带你全面了解“龙虾”AI的本质、失控背后的学术解释、导致失控的多重原因,以及我们该如何防范。
AC赳赳老秦
2 天前
大数据
·
运维
·
人工智能
·
自动化
·
ai-native
·
deepseek
·
openclaw
OpenClaw核心命令详解(常用指令+实战示例,高效开启自动化工作)
在当今数字化时代,自动化已成为提升工作效率的关键。OpenClaw作为一款强大的开源命令行工具,专为简化重复性任务、优化工作流程而设计。其核心在于一套高效、灵活的命令集,用户可以通过简单的指令实现复杂操作的自动化,覆盖文件管理、数据处理、系统监控等多个场景。本文将深入解析OpenClaw的核心命令,提供常用指令的详细说明和实战示例,帮助用户快速上手并高效开启自动化之旅。无论您是开发人员、运维工程师还是数据分析师,掌握这些命令都将显著提升您的工作效率。文章内容基于通用自动化工具的最佳实践,确保真实可靠。
AC赳赳老秦
2 天前
大数据
·
人工智能
·
python
·
django
·
去中心化
·
ai-native
·
openclaw
OpenClaw 全平台安装详解:Windows 10/11、macOS、Linux 零踩坑指南 (附一键脚本)
引言OpenClaw 是一款强大的开源自动化工具(此处根据实际情况描述 OpenClaw 的核心功能,例如:数据抓取、流程自动化、API 测试、监控等),因其灵活性、可扩展性和开源特性,深受开发者和技术爱好者的喜爱。然而,对于初次接触的用户,尤其是需要在不同操作系统上部署时,安装过程可能会遇到一些环境依赖、路径配置等挑战。本教程旨在提供一份详尽、清晰、面向新手的安装指南,覆盖主流的 Windows 10/11、macOS 以及 Linux 发行版(如 Ubuntu、CentOS),并附带精心编写的一键安装
RuiBo_Qiu
3 天前
人工智能
·
算法
·
语言模型
·
自然语言处理
·
ai-native
【LLM进阶-后训练&部署】1. 大语言模型全参数微调:从前向推理到反向传播的底层原理解析
今天我们将按照三大篇章来搞懂大模型推理过程与SFT时发生了什么事情:这是一张非常经典的LLM推理/SFT架构图,花了很多时间画的,推荐大家认真阅读。
RuiBo_Qiu
4 天前
人工智能
·
ai-native
【LLM进阶-Agent】12. 多智能体 (AutoGen, MetaGPT, ChatDev) 介绍
在LLM时代的早期,我们见证了AutoGPT、BabyAGI等单体Agent的爆发。单体Agent通过“思考-行动-观察”(如ReAct框架)的范式,确实展现了惊人的自动化潜力。然而,大厂在实际落地工业级应用时发现,单体Agent面临着 上下文遗忘、长期规划能力弱、容易陷入死循环(幻觉叠加) 等致命问题。
RuiBo_Qiu
4 天前
人工智能
·
ai-native
【LLM进阶-Agent】11. MemGPT 介绍
在最新的多分支大模型Agent发展路径中,我们看到Agent的基石是ReAct (Reason + Act)。ReAct赋予了模型基础的“思考+行动”闭环能力,但在面对超长对话、长期陪伴、复杂多步任务时,ReAct模式很快遇到了物理瓶颈——大模型的上下文窗口(Context Window)限制。
RuiBo_Qiu
4 天前
人工智能
·
ai-native
【LLM进阶-Agent】9. self-discover Agent 介绍
在目前的大模型 Agent 赛道,架构的演进日新月异。如果我们回顾 Agent 的发展路径(正如上方的发展路线图所示),可以清晰地看到一条主线:从“通用但粗糙的试错”向“定制化、结构化、具备自我反思能力的高效推理”演进。
RuiBo_Qiu
5 天前
人工智能
·
ai-native
【LLM进阶-Agent】5. Plan & Execute Agent 介绍
本文将结合最新的多分支大模型 Agent 发展路径,剖析 重规划(Planning) 分支中的核心中坚力量:Plan & Execute 范式。
RuiBo_Qiu
5 天前
人工智能
·
ai-native
【LLM进阶-Agent】7. Basic Reflection Agent 介绍
从“多分支大模型Agent发展路径”图中,我们可以清晰地看到:所有的现代Agent范式都起源于ReAct (Reason + Act)。
RuiBo_Qiu
5 天前
人工智能
·
ai-native
【LLM进阶-Agent】1.Agent范式发展历程
1. ReAct (Reason + Act)2. REWOO (Reasoning without Observation)
RuiBo_Qiu
5 天前
人工智能
·
ai-native
【LLM进阶-Agent】3.ReAct Agent 进阶--如何解决幻觉输出工具调用结果
在基于开源小模型(如 Llama-3-8B、Qwen-7B)或经过重度量化的模型构建 ReAct Agent 时,我们经常会遇到一个令人抓狂的现象:模型在执行完第一轮动作后,开始自顾自地往下生成“Observation(观察结果,属于幻觉)”,不仅不等待环境的真实返回,连我们在 Prompt 中再三警告“严禁输出 Observation”的指令也完全无视。
AC赳赳老秦
6 天前
大数据
·
运维
·
人工智能
·
深度学习
·
机器学习
·
ai-native
·
deepseek
智能协同新纪元:DeepSeek驱动的跨岗位、跨工具多智能体实操体系展望(2026)
智能协同新纪元:DeepSeek驱动的跨岗位、跨工具多智能体实操体系展望(2026)摘要: 随着人工智能技术的飞速发展,尤其是大型语言模型(LLM)能力的突破,多智能体系统(Multi-Agent Systems, MAS)正从理论构想加速走向产业落地。本文聚焦于2026年这一关键时间节点,深入探讨以DeepSeek为代表的大模型如何赋能多智能体系统,实现前所未有的跨岗位、跨工具协同实操能力。文章将分析其技术支撑体系(如自主规划、工具调用、知识共享、安全协作),描绘其在制造业协同设计、智能供应链管理、金融
数字供应链安全产品选型
7 天前
人工智能
·
安全
·
ai-native
2026,问境AIST发布:悬镜安全定义AI原生安全治理新范式
2026,问境AIST发布:悬镜安全定义AI原生安全治理新范式随着大模型(LLM)加速从技术探索走向规模化应用,企业安全体系正面临一轮全新的挑战:AI 生成代码是否可能埋藏未知缺陷甚至潜在后门?第三方引入的基础模型、开源组件和数据集,是否存在投毒、篡改或供应链风险?而在智能体逐步参与业务执行的背景下,一次提示词注入、一次插件滥用,甚至一次越权调用,都可能引发敏感信息泄露、业务逻辑失控等安全问题。
AC赳赳老秦
8 天前
大数据
·
人工智能
·
python
·
django
·
去中心化
·
ai-native
·
deepseek
国产化AI运维新趋势:DeepSeek赋能国产算力部署的高效故障排查
国产化AI运维新趋势:DeepSeek赋能国产算力部署的高效故障排查引言人工智能(AI)作为新一轮科技革命和产业变革的核心驱动力,正深刻改变着各行各业的发展模式。随着我国将AI上升至国家战略高度,国内AI产业迎来了爆发式增长。在这一进程中,国产AI芯片和算力平台的崛起成为保障技术自主可控的关键环节。昇腾(Ascend)、鲲鹏(Kunpeng)、海光(Hygon)、飞腾(Phytium)、寒武纪(Cambricon)、天数智芯(Iluvatar)等国产芯片及基于其构建的服务器集群,正逐步在科研机构、互联网企
AC赳赳老秦
8 天前
大数据
·
人工智能
·
python
·
prompt
·
政务
·
ai-native
·
deepseek
DeepSeek助力国产化AI落地:政务/企业场景下的国产算力适配避坑指南
DeepSeek助力国产化AI落地:政务/企业场景下的国产算力适配避坑指南摘要: 随着人工智能技术的迅猛发展和国家战略层面对核心科技自主可控的日益重视,采用国产算力平台支撑AI应用已成为政务信息化与企业数字化转型的关键命题。然而,国产硬件生态与主流国际生态存在差异,适配过程中充满技术挑战与认知误区。本文聚焦于政务与企业两大核心应用场景,系统梳理国产AI芯片(以昇腾、海光、寒武纪、燧原等为代表)及其配套软硬件环境在AI模型训练、推理部署全流程中的适配要点,深入剖析常见“坑点”,并结合DeepSeek系列工具
RuiBo_Qiu
8 天前
人工智能
·
ai-native
【LLM基础】1.Pytorch学习
在 PyTorch 中,所有的神经网络模型都必须继承自 torch.nn.Module 这个基类。最基础的层,将输入数据与权重矩阵相乘并加上偏置。
Kiyra
8 天前
网络
·
人工智能
·
websocket
·
网络协议
·
架构
·
ai-native
突破实时瓶颈:从零构建高性能 WebSocket 实时通讯架构
在构建我的 AI 即时通讯系统(AQChat)时,我面临了一个核心挑战:大模型推理的延迟高,且需要支持流式输出(Streaming)。如果沿用传统的 HTTP 短连接轮询,不仅延迟高,而且服务器的资源开销极大。