大模型

Captain_Data2 分钟前
人工智能·python·ai·大模型·芯片设计·risc-v
AI 12小时设计CPU完整解析:从219字到RISC-V内核的技术突破2026年4月,AI芯片设计初创公司Verkor.io发布了一项震动行业的研究成果:其AI智能体系统Design Conductor,仅凭一份219字的需求文档,在12小时内自主完成了一款RISC-V CPU核心的全流程设计。
前端摸鱼匠22 分钟前
人工智能·ai·面试·大模型·求职招聘
【AI大模型春招面试题27】字节对编码(BPE)的分词过程?如何处理未登录词(OOV)?你好!咱们直接切入正题。这道题在 LLM 相关的面试中属于**“必考基础,但能分出深浅”**的题目。很多候选人只会背“BPE 是合并高频字符对”,但一旦问到**“具体怎么算的?”或者“遇到训练集里完全没有的生僻字怎么办?”**就容易卡壳。
山顶夕景2 小时前
python·大模型·llm·agent·多模态·vlm
【VLM】结合Python沙箱的以图思辨S1-VL模型【多模态推理大模型进展】基于Qwen3-VL-32B-Thinking做的面向数学、物理、化学、天文、地理、生物六大学科的科学多模态推理模型,主要特点是Python 沙箱执行图像裁剪、缩放、标注等代码,多轮迭代推理。S1-VL: Scientific Multimodal Reasoning Model with Thinking-with-Images,https://arxiv.org/pdf/2604.21409,https://huggingface.co/ScienceOne-AI,https:
龙侠九重天4 小时前
ai·大模型·rag·检索增强生成
RAG 检索增强生成:原理与应用场景2022 年底,ChatGPT 的横空出世让全世界见识到了 AI 的强大能力。它能够写诗、作画、编写代码,甚至能与人类进行流畅的对话。一时间,「人工智能将改变世界」成为共识,无数开发者争相将大模型接入自己的产品。
前端摸鱼匠5 小时前
人工智能·学习·算法·面试·大模型·求职招聘
【AI大模型春招面试题29】对比学习(Contrastive Learning)在大模型预训练中的应用?你好!面对“对比学习在大模型预训练中的应用”这道面试题,你不能只停留在背诵定义的层面。面试官想考察的是你对表征学习本质、大模型训练范式以及多模态对齐机制的深度理解。
CoderJia程序员甲5 小时前
ai·大模型·llm·产品运营·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-25)生成于:2026-04-25共发现热门项目: 12 个榜单类型:日榜Token赞助:siliconflow
Irissgwe5 小时前
人工智能·langchain·大模型·llm
LangChain之聊天模型核心能力大语言模型 (LLM) 在各种与语言相关的任务(例如文本生成、翻译、摘要、问答等)中表现出色。 现代 LLM 通常通过聊天模型接口访问,该接口将消息列表作为输入,并返回消息作为输出,而不是使 用纯文本。
故乡de云5 小时前
大模型·ai编程·策略模式·claude·cursor·claude code
Cursor + Claude Code 接入 API 实战:国内稳定使用 Claude 4.7 配置全攻略官方 API 国内直连必败,本文给出 Cursor 和 Claude Code 两套完整配置方案, 图文步骤可直接照做,配置完成后无需代理,延迟稳定在 200ms 以内。
刘大猫.5 小时前
人工智能·ai·大模型·谷歌·算力·无屏健身手环·fitbit air
谷歌或将推出无屏健身手环 Fitbit Air,主打 AI 数字化健康教练在智能穿戴市场竞争日益激烈的当下,谷歌似乎准备另辟蹊径。据科技媒体披露,谷歌有望在 2026 年 5 月 16 日正式发布一款名为 Fitbit Air 的无屏健身手环。这款产品定位清晰,意在挑战高端无屏追踪器品牌 Whoop,预估起售价定在 99 美元(约合人民币 676 元)。
前端摸鱼匠6 小时前
人工智能·ai·面试·大模型·求职招聘
【AI大模型春招面试题26】大模型的“上下文窗口”(Context Window)是什么?长度对模型性能的影响?你好!咱们直接切入正题。这道题在现在的面试里属于“必考题”,但很多候选人只能背定义,讲不出底层原理和工程权衡。
ACCELERATOR_LLC6 小时前
人工智能·深度学习·大模型·transformer·gpu
【DataWhale组队学习】DIY-LLM Task4 GPU和GPU相关的优化原文链接这一章讲GPU发展、A100、SM、Warp、Tensor Core、FlashAttention、PageAttention等等,重点是理解为什么LLM训练和推理会天然走向GPU,以及为什么那么多优化都会回到访存、并行调度和IO上。 本章的展开也很科学,先讲GPU架构与执行模型,再讲内存模型和性能优化,最后讲FlashAttention与PageAttention具体工程案例。
前端摸鱼匠7 小时前
人工智能·ai·面试·大模型·求职招聘
【AI大模型春招面试题28】什么是“词表扩展”?大模型词表扩展的常见方法及注意事项?你好!咱们直接切入正题。这道题在现在的面试中(尤其是涉及垂直领域微调、多语言适配的岗位)出现频率极高,因为它不仅考察你对 Tokenizer 原理的理解,更考察你是否有 工程落地经验和 避坑意识。
翔云12345616 小时前
大模型·openclaw
OpenClaw新会话记忆加载过程在 OpenClaw 里,新会话刚启动时,记忆不是一次性全塞给模型,而是走一套非常固定、轻量的初始化加载 + 按需召回流程。
今天你TLE了吗20 小时前
java·人工智能·学习·语言模型·大模型
LLM到Agent&RAG——AI知识点概述 第六章:Function Call函数调用以我们的RAG系统为例,整个RAG流程大概是这样的:用户提出问题→(问题拆分)→检索分块→生成答案→(比标注来源)
CoderJia程序员甲1 天前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-24)生成于:2026-04-24共发现热门项目: 16 个榜单类型:日榜Token赞助:siliconflow
kuokay1 天前
大模型·agent
一文说清RLHF(人类反馈强化学习)Reinforcement Learning from Human Feedback,即"基于人类反馈的强化学习",是当代大语言模型对齐(Alignment)技术的基石。ChatGPT、Claude、Gemini 等主流模型之所以能够以自然、有帮助、无害的方式与人类对话,背后的关键技术正是 RLHF。
litble1 天前
人工智能·大模型·llm·moe·kv-cache·pre-ln
如何速成LLM以伪装成一个AI研究者(2)——Pre-LN,KV-Cache优化,MoE如何速成LLM以伪装成一个AI研究者(1)——循环,卷积,编解码器,注意力,Transformer免责声明:作者也是伪装的,有错漏属于正常现象,欢迎评论指正。
山顶夕景1 天前
大模型·llm·agent·检索·记忆体
【Agent】Long-horizon task的memory系统Deep Research 是 2025 年的一个重点,2026年重点是long-horizon task。 Agent 就是一个 Loop,在三个状态之间循环:Search、Read、Reason
翔云1234561 天前
大模型·openclaw
OpenClaw记忆系统OpenClaw记忆系统通过文件+索引+智能检索的组合,解决了传统LLM“聊完就忘”的痛点,为AI Agent提供了持久、可控、高效的记忆能力,是构建真正智能个人助手的关键基础。
不会吉他的肌肉男不是好的挨踢男1 天前
sql·ai·大模型·bi
Windows 下安装 sqlBot部署服务器要求:CPU/内存: 4 核 8 G 磁盘空间: 100G 服务器架构: amd64 或 arm64