深度复盘:Qwen3-4B-Instruct-2507微调实战——打造“快思考、强执行”的 ReAct IoT Agent本文内容来自「百业千模・共创营」—— 百大垂类模型生态支持计划获奖作品,作者闫露为Foresee AI核心技术负责人,深耕AIoT与大模型融合领域多年,专注智能空间管理场景的技术落地与创新。本次带来基于ReAct架构的主动式IoT Agent项目,依托公司在智能空间管理的AIoT技术积累,构建了约24,000条交互链路的高质量数据集,通过LLaMA-Factory Online微调,不仅让Agent具备主动感知、逻辑推理能力,更新增可动态扩充的skill能力,同时解决了上一代模型的指令执行精度问题,彻底突