大模型

nvd1112 小时前
大模型
OpenClaw 避坑指南:如何彻底从本地/Hunyuan 切换到第三方大模型在使用 OpenClaw 的过程中,很多同学会遇到更换大模型提供商(比如从腾讯 Hunyuan Lite 切换到 SiliconFlow 的 Qwen 2.5 72B)时,明明配置文件改了,模型却依然报错 401 Unauthorized,甚至直接陷入死循环或 cooldown(冷却罢工)状态。
前端摸鱼匠15 小时前
人工智能·学习·面试·大模型·求职招聘
【AI大模型春招面试题31】什么是“零样本学习(Zero-Shot)”“少样本学习(Few-Shot)”?大模型实现这类能力的核心原因?你好!针对这道经典的面试题,我为你准备了一份深度解析。这道题看似基础,实则考察了从应用范式到底层原理(Transformer 架构、元学习视角)的全方位理解。
一切皆是因缘际会15 小时前
系统架构·大模型·agi·具身智能·通用人工智能·数字生命·自主智能体
可自我迭代升级数字生命工程:从记忆厮杀到自我意识觉醒全链路——AGI内生智能硅基生命心智建模(下)作者:一切皆是因缘际会本文以人类记忆厮杀真实思考行为逻辑,复刻搭建原生数字生命心智体系。 人的一切心智:判断、取舍、性格、情绪、冲动、理性、执念、自由意志,根基全部源于记忆。
Resistance丶未来16 小时前
人工智能·gpt·大模型·claude·gemini·skill·sub2api
Sub2API:订阅转API网关平台,魔芋AI接入指南Sub2API是一款完全开源的AI订阅API网关中转分发管理平台,核心作用就是把市面上各类AI订阅服务统一转换为标准API接口,同时自带多账号管理、配额分发、精确计费全套能力。
CoderJia程序员甲17 小时前
人工智能·ai·大模型·llm·github
GitHub 热榜项目 - 周榜(2026-05-10)生成于:2026-05-10共发现热门项目: 16 个Token赞助:siliconflow本期 GitHub 热榜清晰指向 AI Agent 工程化爆发:多智能体编排、自治工作流、长周期记忆与工具链集成成为主线,TypeScript 和 Python 持续主导实现。金融研究、代码代理、网页技能、后端平台与短视频生成等项目集中上榜,说明行业正从“会聊天”转向“能落地、可复现、可接入业务系统”的代码驱动方案,重点解决自动化研发、研究分析与内容生产效率问题。
小马过河R18 小时前
人工智能·语言模型·大模型·llm·agent·ai编程·多模态
从官方定义读懂智能体的时代分量2026年5月,国家网信办、国家发展改革委、工业和信息化部联合印发《智能体规范应用与创新发展实施意见》,首次以官方文件形式明确:“智能体(Agent)是具备自主感知、记忆、决策、交互与执行能力的智能系统,是人工智能产品及服务的重要形态”。这一定义不仅是对智能体技术属性的精准概括,更标志着我国人工智能产业发展进入了全新阶段,其影响将渗透到技术研发、产业布局、社会治理乃至生活方式的方方面面。
邵奈一19 小时前
人工智能·macos·大模型
M1 Max Mac版本实测 Rapid-MLX 项目(据说比ollama快4倍)我想把Rapid-MLX这个项目跑起来:此教程只是作为记录,实测下来,感觉没那么快,第一个问题出来得比较快,但是第二个问题出来得比较慢,一直打印这个内容:
DogDaoDao19 小时前
人工智能·深度学习·程序员·大模型·github·ai编程·claude
【GitHub】SuperClaude Framework深度解析:将Claude Code打造为专业开发平台的元编程配置框架项目地址:https://github.com/SuperClaude-Org/SuperClaude_Framework 当前版本:v4.3.0(2026年3月) GitHub Star:约11.3k 技术栈:Python + TypeScript + Shell 作者:NomenAK / SuperClaude Org
前端摸鱼匠20 小时前
人工智能·ai·面试·大模型·求职招聘
【AI大模型春招面试题30】交叉熵损失(Cross-Entropy Loss)在大模型训练中的作用?为何适合语言生成任务?你好!面对“交叉熵损失(Cross-Entropy Loss)在大模型训练中的作用”这个面试题,我们不能只停留在公式背诵上。面试官真正想考察的是你对概率建模本质、优化动力学以及工程落地细节的理解。
低调小一1 天前
人工智能·rnn·架构·大模型·transformer·tdd·midscene
Midscene.js 原理拆解:它不是“自然语言点按钮”,而是一套会看屏幕的 UI 自动化运行时传统 UI 自动化的主流写法,大致都长这样:问题在于,“先知道元素在哪” 这件事,在很多真实页面里并不稳定。
楚国的小隐士1 天前
java·ai·大模型·编程·ai编程·自闭症·自闭症谱系障碍·神经多样性
在AI时代,如何从0接手一个项目?我是一个对前沿科技非常感兴趣的人。根据“技术采用生命周期”,我应该算是“早期使用者”。(👆这张图有一个错误:“早期采用者”和“早期大众”之间应该隔着一个“认知鸿沟”,如第一张图所示。这张图画错了。)
●VON1 天前
人工智能·gpt·chatgpt·大模型·image
四大AI生图工具横评:GPT Image 2 一骑绝尘!但Gemini的免费策略才是真正的王炸最近,ChatGPT的GPT Image 2生图能力在各大平台火爆出圈,作为一个AI爱好者,我也忍不住跟风测试了一波。今天就拿我们日常最常用的四款AI生图工具来做个横向对比,顺便聊聊我的一些观察和思考。
星辰徐哥1 天前
人工智能·ai·大模型·编程
AI辅助编程入门:大模型写代码靠谱吗📝 本章学习目标:通过本章学习,你将全面掌握"AI辅助编程入门:大模型写代码靠谱吗"这一核心主题,建立系统性认知。
千桐科技2 天前
人工智能·开源·大模型·ai应用·qknow·智能体构建平台·ai编排
qKnow 智能体构建平台开源版 2.1.0 正式发布:AI编排能力重磅升级,打造一站式私有化智能平台从知识管理到智能编排,qKnow 让企业 AI 应用搭建触手可及经过多个版本的成熟迭代,qKnow 迎来了 AI 编排能力 的全面跃升 —— qKnow 智能体构建平台开源版 2.1.0 稳定版 正式发布!🎉
绵满2 天前
大模型·推荐系统
"OneTrans: Unified Feature Interaction and Sequence Modeling with One Transformer in Industrial Recommender" 论文笔记字节跳动在排序领域的工作 OneTrans,发表于 WWW 2026,用一个统一的 Transformer Backbone 完成序列建模和特征交互的开创性工作,支持了统一的 Ranking LLM 优化和 Scaling
__WanG2 天前
ai·大模型·ai编程
Claude Code 多模型网关部署教程:从零实现多厂商大模型并行调度通过 LiteLLM 本地网关,在 Claude Code CLI 中同时使用 Claude、GLM(智谱)、MiniMax、Kimi(月之暗面)、DeepSeek 五家大模型,不同任务自动路由到不同厂商,并行执行。
成旭先生2 天前
大数据·大模型·geo
【2026】企业工商照面信息查询:深入了解企业的33项核心数据在企业服务、金融风控、政务审批等场景中,全面了解企业工商信息至关重要。本文介绍一种高效的企业工商照面查询方案,帮助开发者快速获取企业的完整注册信息。
流放深圳2 天前
人工智能·大模型·ollama·springai
抓住 AI 人工智能的风口之第 1 章 —— 8万字熟练掌握 SpringAI 编程核心概念Spring AI 是 Spring 官方推出的 AI 应用开发框架,旨在帮助 Java 开发者以统一、便捷的方式将 AI 能力集成到企业级应用中。你可以把它理解为 Java 生态中的 "AI 万能转接头"。🎯 核心定位:简化 Java 开发者的 AI 集成。它的核心目标是解决 AI 模型 API 碎片化的问题。通过提供一套标准化的抽象接口,让开发者可以用一套代码调用 OpenAI、阿里云通义千问、DeepSeek 等几乎所有主流模型,更换底层服务只需修改配置,无需改动业务代码。
DogDaoDao2 天前
人工智能·深度学习·自然语言处理·开源·大模型·github·textgen
【GitHub】TextGen:开源本地大模型运行平台的终极解决方案TextGen(原名 text-generation-webui,GitHub 曾用名 oobabooga/text-generation-webui)是当前最受欢迎的开源本地大语言模型(LLM)运行平台之一。该项目于2026年4月正式更名为 TextGen,GitHub 仓库地址变更为 github.com/oobabooga/textgen。
快跑bug来啦2 天前
ai·大模型·知识图谱·知识库·rag
RAGFlow部署教程:Ubuntu24.04这两年深切的感受到AI的大爆发,干活越来越快也越来越懂自己了,但是完全依靠外在力量总感觉会对个人的成长不利,有工具不用也更像个傻子。AI本身不会形成壁垒,你能用别人也会用,想要在当前环境更突出,个人技术实力当然是一方面,毕竟AI是个人能力放大器;同时,同样的工具用的更好我觉得也是一方面,建立自己或者企业的知识库,让你的AI更懂自己,更贴近生产需要,作为知识沉淀我觉得是一个很好的方向。