大模型

DogDaoDao13 分钟前
人工智能·深度学习·程序员·大模型·github·ai编程·claude
【GitHub】SuperClaude Framework深度解析:将Claude Code打造为专业开发平台的元编程配置框架项目地址:https://github.com/SuperClaude-Org/SuperClaude_Framework 当前版本:v4.3.0(2026年3月) GitHub Star:约11.3k 技术栈:Python + TypeScript + Shell 作者:NomenAK / SuperClaude Org
前端摸鱼匠43 分钟前
人工智能·ai·面试·大模型·求职招聘
【AI大模型春招面试题30】交叉熵损失(Cross-Entropy Loss)在大模型训练中的作用?为何适合语言生成任务?你好!面对“交叉熵损失(Cross-Entropy Loss)在大模型训练中的作用”这个面试题,我们不能只停留在公式背诵上。面试官真正想考察的是你对概率建模本质、优化动力学以及工程落地细节的理解。
低调小一11 小时前
人工智能·rnn·架构·大模型·transformer·tdd·midscene
Midscene.js 原理拆解:它不是“自然语言点按钮”,而是一套会看屏幕的 UI 自动化运行时传统 UI 自动化的主流写法,大致都长这样:问题在于,“先知道元素在哪” 这件事,在很多真实页面里并不稳定。
楚国的小隐士11 小时前
java·ai·大模型·编程·ai编程·自闭症·自闭症谱系障碍·神经多样性
在AI时代,如何从0接手一个项目?我是一个对前沿科技非常感兴趣的人。根据“技术采用生命周期”,我应该算是“早期使用者”。(👆这张图有一个错误:“早期采用者”和“早期大众”之间应该隔着一个“认知鸿沟”,如第一张图所示。这张图画错了。)
●VON14 小时前
人工智能·gpt·chatgpt·大模型·image
四大AI生图工具横评:GPT Image 2 一骑绝尘!但Gemini的免费策略才是真正的王炸最近,ChatGPT的GPT Image 2生图能力在各大平台火爆出圈,作为一个AI爱好者,我也忍不住跟风测试了一波。今天就拿我们日常最常用的四款AI生图工具来做个横向对比,顺便聊聊我的一些观察和思考。
星辰徐哥14 小时前
人工智能·ai·大模型·编程
AI辅助编程入门:大模型写代码靠谱吗📝 本章学习目标:通过本章学习,你将全面掌握"AI辅助编程入门:大模型写代码靠谱吗"这一核心主题,建立系统性认知。
千桐科技21 小时前
人工智能·开源·大模型·ai应用·qknow·智能体构建平台·ai编排
qKnow 智能体构建平台开源版 2.1.0 正式发布:AI编排能力重磅升级,打造一站式私有化智能平台从知识管理到智能编排,qKnow 让企业 AI 应用搭建触手可及经过多个版本的成熟迭代,qKnow 迎来了 AI 编排能力 的全面跃升 —— qKnow 智能体构建平台开源版 2.1.0 稳定版 正式发布!🎉
绵满21 小时前
大模型·推荐系统
"OneTrans: Unified Feature Interaction and Sequence Modeling with One Transformer in Industrial Recommender" 论文笔记字节跳动在排序领域的工作 OneTrans,发表于 WWW 2026,用一个统一的 Transformer Backbone 完成序列建模和特征交互的开创性工作,支持了统一的 Ranking LLM 优化和 Scaling
__WanG1 天前
ai·大模型·ai编程
Claude Code 多模型网关部署教程:从零实现多厂商大模型并行调度通过 LiteLLM 本地网关,在 Claude Code CLI 中同时使用 Claude、GLM(智谱)、MiniMax、Kimi(月之暗面)、DeepSeek 五家大模型,不同任务自动路由到不同厂商,并行执行。
成旭先生1 天前
大数据·大模型·geo
【2026】企业工商照面信息查询:深入了解企业的33项核心数据在企业服务、金融风控、政务审批等场景中,全面了解企业工商信息至关重要。本文介绍一种高效的企业工商照面查询方案,帮助开发者快速获取企业的完整注册信息。
流放深圳1 天前
人工智能·大模型·ollama·springai
抓住 AI 人工智能的风口之第 1 章 —— 8万字熟练掌握 SpringAI 编程核心概念Spring AI 是 Spring 官方推出的 AI 应用开发框架,旨在帮助 Java 开发者以统一、便捷的方式将 AI 能力集成到企业级应用中。你可以把它理解为 Java 生态中的 "AI 万能转接头"。🎯 核心定位:简化 Java 开发者的 AI 集成。它的核心目标是解决 AI 模型 API 碎片化的问题。通过提供一套标准化的抽象接口,让开发者可以用一套代码调用 OpenAI、阿里云通义千问、DeepSeek 等几乎所有主流模型,更换底层服务只需修改配置,无需改动业务代码。
DogDaoDao1 天前
人工智能·深度学习·自然语言处理·开源·大模型·github·textgen
【GitHub】TextGen:开源本地大模型运行平台的终极解决方案TextGen(原名 text-generation-webui,GitHub 曾用名 oobabooga/text-generation-webui)是当前最受欢迎的开源本地大语言模型(LLM)运行平台之一。该项目于2026年4月正式更名为 TextGen,GitHub 仓库地址变更为 github.com/oobabooga/textgen。
快跑bug来啦1 天前
ai·大模型·知识图谱·知识库·rag
RAGFlow部署教程:Ubuntu24.04这两年深切的感受到AI的大爆发,干活越来越快也越来越懂自己了,但是完全依靠外在力量总感觉会对个人的成长不利,有工具不用也更像个傻子。AI本身不会形成壁垒,你能用别人也会用,想要在当前环境更突出,个人技术实力当然是一方面,毕竟AI是个人能力放大器;同时,同样的工具用的更好我觉得也是一方面,建立自己或者企业的知识库,让你的AI更懂自己,更贴近生产需要,作为知识沉淀我觉得是一个很好的方向。
AI原来如此1 天前
ai·大模型·ai编程
2026最新Cursor零基础上手教程这是一篇面向零基础学生、职场新人、轻度技术爱好者的Cursor实战教程,所有操作均为2026年4月最新可复现版本,无需懂复杂AI原理,跟着步骤3分钟完成配置,用3个核心指令就能把编码相关效率提升3倍以上,不管是写课程作业、改老项目bug还是做小型开发项目都能用。
哥本哈士奇(aspnetx)1 天前
大模型
Neo4j笔记(五):查询的处理流程上一篇讲述了一篇文章如何通过LLM转换成Cypher,然后在Neo4J里运行,形成知识图谱。此篇接着上篇,继续梳理一个用户查询,如何通过图数据库以及大模型去汇总查询结果。
handsomestWei2 天前
大模型·llm·openai·模型接口
OpenAI 与 Anthropic 接口协议差异简述全文链接:OpenAI与Anthropic接口协议差异简述多数模型聚合网关会同时提供 OpenAI 兼容(如 …/v1)与 Anthropic 兼容(如 …/anthropic)两类入口。两套协议在路径、请求体、鉴权与流式响应上并不相同;分开展示是为了对齐各自官方 SDK 与既有工具链,降低迁移成本,而非单纯的技术能力不足。
伊玛目的门徒2 天前
人工智能·npm·大模型·ai编程·deepseek·claude code
用 npm 安装 Claude Code CLI 并对接 DeepSeek API 经验分享本文只写可直接复制的最简步骤,不废话,快速上手。Claude Code CLI 依赖 Node.js 运行时,直接从官网下载安装即可:
ghking12 天前
ubuntu·大模型·gnome·nvidia-smi·xorg·remote-desktop
ubuntu下部署大模型显存被其它程序占用问题解决用nvidia-smi查看显卡占用,发现xorg和gnome-remote-desktop总是占用几百兆的显存
贫民窟的勇敢爷们2 天前
语言模型·大模型
大模型发展现状解析——竞争格局与技术演进近年来,大模型技术进入爆发式发展阶段,全球范围内涌现出大量不同规模、不同类型的大模型,市场竞争日趋激烈,技术演进速度不断加快。从全球格局来看,中美两国成为大模型竞争的核心阵地,同时行业整合趋势明显,大模型正从“数量竞争”转向“质量竞争”与“生态竞争”,其发展现状呈现出多元化、差异化的特点。
贫民窟的勇敢爷们2 天前
大模型
大模型行业应用落地——从辅助工具到产业革新随着大模型技术的不断成熟,其应用场景已从最初的文本生成、智能问答,延伸到金融、医疗、制造、教育等多个行业,从“辅助工具”逐步升级为“产业革新的核心驱动力”。大模型凭借其泛化能力、高效迁移学习能力和涌现能力,能够快速适配不同行业的需求,解决行业痛点,提升生产效率,推动产业数字化转型。