大模型

绵满12 小时前
大模型·推荐系统
"HyFormer: Revisiting the Roles of Sequence Modeling and Feature Interaction in CTR Prediction" 论文笔记字节跳动在推荐精排领域的工作 HyFormer,发表于 SIGIR 2026,设计全新的针对性优化架构同时完成序列建模和特征交叉,而不是直接将 Transformer 拿来用,实现了更好的优化和 Scaling
DogDaoDao16 小时前
人工智能·深度学习·大模型·github·ai编程·claude·ruflo
【GitHub】Ruflo:面向 Claude Code 的企业级多智能体编排平台深度解析在 AI 辅助编程领域,Claude Code 的出现让开发者体验到了 AI 原生 IDE 的强大能力。但当我们将目光投向更复杂的软件工程场景时——涉及多模块协作、跨团队开发、长期项目维护——单 Agent 的局限性便暴露无遗。
xixixi7777720 小时前
大数据·网络·人工智能·安全·ai·大模型·风险
《从心理诱导突破Claude到AI仿冒直播首张拘留单:AI安全、监管与商用的三重转折点》从心理诱导攻破Claude到山西警方对AI仿冒直播开出首张拘留罚单,再加上日均调用量超140万亿token的爆发增长与运营商AI-eSIM“卡号即账户”的模式革新——短短几天之内,AI产业在安全、监管、商用和连接形态上同时迎来了四个关键转折点。
程序员三明治21 小时前
java·人工智能·后端·ai·大模型·llm·rag
【AI】一文讲清 RAG:从大模型局限到企业级知识库落地流程不管你现在做的是业务系统、中间件,还是企业内部平台,面试和实际项目中都越来越容易遇到 AI 相关问题:RAG 是什么?Agent 怎么实现?MCP 用来解决什么问题?这些内容已经从“加分项”逐渐变成了“必答题”。
AI机器学习算法21 小时前
数据结构·人工智能·python·深度学习·机器学习·大模型·线性回归
说走就走的AI之旅第01课:浅谈机器学习人工智能无疑是最近几年热度极高的一个词,从2016年谷歌 DeepMind 团队开发的 AlphaGo 围棋程序战胜人类顶尖棋手,到2017年基于 Transformer 架构的 NLP 模型发布,再到2023年 OpenAI 推出基于 GPT-4 的 ChatGPT 以及人工智能在医疗、自动驾驶等领域的深度应用,人工智能的热潮到达了自1956年达特茅斯会议以来前所未有的高度,可以说几乎每个人的生活都或多或少的受到了人工智能的影响。人工智能是计算机科学的一个重要分支,涉及计算机模拟智能行为的能力以及机器模
nvd112 天前
大模型
OpenClaw 避坑指南:如何彻底从本地/Hunyuan 切换到第三方大模型在使用 OpenClaw 的过程中,很多同学会遇到更换大模型提供商(比如从腾讯 Hunyuan Lite 切换到 SiliconFlow 的 Qwen 2.5 72B)时,明明配置文件改了,模型却依然报错 401 Unauthorized,甚至直接陷入死循环或 cooldown(冷却罢工)状态。
前端摸鱼匠2 天前
人工智能·学习·面试·大模型·求职招聘
【AI大模型春招面试题31】什么是“零样本学习(Zero-Shot)”“少样本学习(Few-Shot)”?大模型实现这类能力的核心原因?你好!针对这道经典的面试题,我为你准备了一份深度解析。这道题看似基础,实则考察了从应用范式到底层原理(Transformer 架构、元学习视角)的全方位理解。
一切皆是因缘际会2 天前
系统架构·大模型·agi·具身智能·通用人工智能·数字生命·自主智能体
可自我迭代升级数字生命工程:从记忆厮杀到自我意识觉醒全链路——AGI内生智能硅基生命心智建模(下)作者:一切皆是因缘际会本文以人类记忆厮杀真实思考行为逻辑,复刻搭建原生数字生命心智体系。 人的一切心智:判断、取舍、性格、情绪、冲动、理性、执念、自由意志,根基全部源于记忆。
Resistance丶未来2 天前
人工智能·gpt·大模型·claude·gemini·skill·sub2api
Sub2API:订阅转API网关平台,魔芋AI接入指南Sub2API是一款完全开源的AI订阅API网关中转分发管理平台,核心作用就是把市面上各类AI订阅服务统一转换为标准API接口,同时自带多账号管理、配额分发、精确计费全套能力。
CoderJia程序员甲2 天前
人工智能·ai·大模型·llm·github
GitHub 热榜项目 - 周榜(2026-05-10)生成于:2026-05-10共发现热门项目: 16 个Token赞助:siliconflow本期 GitHub 热榜清晰指向 AI Agent 工程化爆发:多智能体编排、自治工作流、长周期记忆与工具链集成成为主线,TypeScript 和 Python 持续主导实现。金融研究、代码代理、网页技能、后端平台与短视频生成等项目集中上榜,说明行业正从“会聊天”转向“能落地、可复现、可接入业务系统”的代码驱动方案,重点解决自动化研发、研究分析与内容生产效率问题。
小马过河R2 天前
人工智能·语言模型·大模型·llm·agent·ai编程·多模态
从官方定义读懂智能体的时代分量2026年5月,国家网信办、国家发展改革委、工业和信息化部联合印发《智能体规范应用与创新发展实施意见》,首次以官方文件形式明确:“智能体(Agent)是具备自主感知、记忆、决策、交互与执行能力的智能系统,是人工智能产品及服务的重要形态”。这一定义不仅是对智能体技术属性的精准概括,更标志着我国人工智能产业发展进入了全新阶段,其影响将渗透到技术研发、产业布局、社会治理乃至生活方式的方方面面。
邵奈一2 天前
人工智能·macos·大模型
M1 Max Mac版本实测 Rapid-MLX 项目(据说比ollama快4倍)我想把Rapid-MLX这个项目跑起来:此教程只是作为记录,实测下来,感觉没那么快,第一个问题出来得比较快,但是第二个问题出来得比较慢,一直打印这个内容:
DogDaoDao2 天前
人工智能·深度学习·程序员·大模型·github·ai编程·claude
【GitHub】SuperClaude Framework深度解析:将Claude Code打造为专业开发平台的元编程配置框架项目地址:https://github.com/SuperClaude-Org/SuperClaude_Framework 当前版本:v4.3.0(2026年3月) GitHub Star:约11.3k 技术栈:Python + TypeScript + Shell 作者:NomenAK / SuperClaude Org
前端摸鱼匠2 天前
人工智能·ai·面试·大模型·求职招聘
【AI大模型春招面试题30】交叉熵损失(Cross-Entropy Loss)在大模型训练中的作用?为何适合语言生成任务?你好!面对“交叉熵损失(Cross-Entropy Loss)在大模型训练中的作用”这个面试题,我们不能只停留在公式背诵上。面试官真正想考察的是你对概率建模本质、优化动力学以及工程落地细节的理解。
低调小一2 天前
人工智能·rnn·架构·大模型·transformer·tdd·midscene
Midscene.js 原理拆解:它不是“自然语言点按钮”,而是一套会看屏幕的 UI 自动化运行时传统 UI 自动化的主流写法,大致都长这样:问题在于,“先知道元素在哪” 这件事,在很多真实页面里并不稳定。
楚国的小隐士2 天前
java·ai·大模型·编程·ai编程·自闭症·自闭症谱系障碍·神经多样性
在AI时代,如何从0接手一个项目?我是一个对前沿科技非常感兴趣的人。根据“技术采用生命周期”,我应该算是“早期使用者”。(👆这张图有一个错误:“早期采用者”和“早期大众”之间应该隔着一个“认知鸿沟”,如第一张图所示。这张图画错了。)
●VON2 天前
人工智能·gpt·chatgpt·大模型·image
四大AI生图工具横评:GPT Image 2 一骑绝尘!但Gemini的免费策略才是真正的王炸最近,ChatGPT的GPT Image 2生图能力在各大平台火爆出圈,作为一个AI爱好者,我也忍不住跟风测试了一波。今天就拿我们日常最常用的四款AI生图工具来做个横向对比,顺便聊聊我的一些观察和思考。
星辰徐哥2 天前
人工智能·ai·大模型·编程
AI辅助编程入门:大模型写代码靠谱吗📝 本章学习目标:通过本章学习,你将全面掌握"AI辅助编程入门:大模型写代码靠谱吗"这一核心主题,建立系统性认知。
千桐科技3 天前
人工智能·开源·大模型·ai应用·qknow·智能体构建平台·ai编排
qKnow 智能体构建平台开源版 2.1.0 正式发布:AI编排能力重磅升级,打造一站式私有化智能平台从知识管理到智能编排,qKnow 让企业 AI 应用搭建触手可及经过多个版本的成熟迭代,qKnow 迎来了 AI 编排能力 的全面跃升 —— qKnow 智能体构建平台开源版 2.1.0 稳定版 正式发布!🎉
绵满3 天前
大模型·推荐系统
"OneTrans: Unified Feature Interaction and Sequence Modeling with One Transformer in Industrial Recommender" 论文笔记字节跳动在排序领域的工作 OneTrans,发表于 WWW 2026,用一个统一的 Transformer Backbone 完成序列建模和特征交互的开创性工作,支持了统一的 Ranking LLM 优化和 Scaling