大模型

Flying pigs~~2 小时前
人工智能·开源·大模型·agent·dify·rag
Dify平台入门指南:开源LLM应用开发平台深度解析Dify是一款开源的LLM应用开发平台,融合了后端即服务(BaaS)的理念,让开发者可以快速搭建生产级的生成式AI应用。即使是非技术人员,也能参与到AI应用的定义和数据运营中。
CoderJia程序员甲2 小时前
ai·大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-20)生成于:2026-04-20共发现热门项目: 10 个榜单类型:日榜Token赞助:siliconflow
zhangfeng11333 小时前
大模型
llamfactory 微调中用到的cpu的两处参数preprocessing_num_workers dataloader_num_workers我给你用最直白、最清晰、不绕弯的方式讲清楚,这几个参数到底干什么的、区别在哪、为什么你必须都开。你之前 CPU 只有 8%,就是因为 只开了预处理,没开训练时的数据加载多线程。
带娃的IT创业者3 小时前
人工智能·python·ai·开源·大模型·qwen·编程代理
深度解析 Qwen3.6-35B-A3B:重塑 AI 编程代理的开源新标杆在开源大模型领域,通义千问团队再次投下了一枚重磅炸弹。近日,Qwen3.6-35B-A3B 模型正式发布,并迅速登顶 Hacker News 热榜,获得 634 票的高度关注。这不仅仅是一个参数量的更新,更是一次针对“Agentic Coding(代理编程)”能力的深度优化。
liu****3 小时前
python·langchain·大模型·langgraph
LangGraph-AI应用开发框架(五)目录一.LangGraph 的其他特性1.使用 Overwrite 绕过 reducer2.定义输入输出模式
ACCELERATOR_LLC1 天前
人工智能·大模型·datawhale
【DataWhale组队学习】DIY-LLM Task1分词器原文链接分词器常被视为LLM的一部分,但它其实有独立的训练生命周期。Tokenizer本质上是将原始文本转换为模型可处理的离散符号序列的组件,它可以决定模型看到世界的基本粒度:是字符、单词、子词,还是字节片段,而这个粒度的选择会进一步影响序列长度、OOV、词表的规模还有训练效率等。
程序员三明治1 天前
人工智能·ai·大模型·llm·量化·java后端·api调用
【AI探索】程序员到底该怎么理解 LLM?你第一反应大概率不是去翻论文,而是直接打开几个现成的产品试试。你可能会去问 DeepSeek、通义千问,或者别的聊天工具,把自己业务里的问题丢进去测一测。结果往往会让人眼前一亮:模型不仅能把话说通顺,还能理解你给它的上下文,甚至能帮你总结、归纳、改写。有些原来必须靠人工做的事情,突然看起来像是真的可以交给机器了。
极客小云1 天前
人工智能·网络安全·语言模型·大模型·github·安全性测试·代码复审
【AiCodeAudit 2.0 发布:基于调用图与局部子图的 AI 代码安全审计平台】本文是 AiCodeAudit 的2.0 大版本更新介绍。如果你之前了解过 1.0 版本,本文将重点介绍静态解析引擎、Web 可视化界面及结构化报告等新特性;如果你是新用户,本文将作为完整的使用指南。
DFCED2 天前
人工智能·大模型·agent·sora
突发!Sora 之父 Bill Peebles 离职:OpenAI 理想主义的又一次落幕Sora 之父 Bill Peebles 离职:OpenAI 理想主义的又一次落幕 2026 年 4 月 18 日凌晨,OpenAI 再次震动科技圈。Sora 项目核心负责人 Bill Peebles 在社交平台上官宣离职,与他同一天离开的还有前首席产品官 Kevin Weil 和企业应用 CTO Srinivas Narayanan。这场高管集体出走,与 OpenAI 正在进行的战略收缩和 IPO 冲刺紧密相连。
今天你TLE了吗2 天前
java·人工智能·语言模型·大模型
LLM到Agent&RAG——AI概念概述 第一章:大模型传统业务当中,我们通过if-else将所有规则硬性写好,所有情况、出发的回答都是固定的。很容易就能写出一个简单的客服回复:
被制作时长两年半的个人练习生2 天前
大模型·算子
kerminal工具试用这两天kerminal在做推广,我试用了一下他们的工具。有一些值得分享的感受。首先这个工具的前身是kernelcat,当时在几十分钟内写好了最新的DeepSeek mHc算子,还引起了一点轰动。据说写的加法能到官方baseline的九倍。这次不限量试用,我直接吃螃蟹。
AI精钢2 天前
网络·人工智能·ai·大模型·llm·claude·技术评论
Claude Opus 4.7 是一次失败的升级吗?一次基于用户反馈的技术复盘最近,一则关于“Claude Opus 4.7 不如 4.6”的 Reddit 帖子引发了不少讨论。发帖者的核心观点很直接:升级后的模型在若干真实使用场景里,似乎没有带来预期中的质量提升,反而出现了更强的“自信幻觉”、更像默认低 effort 的 adaptive reasoning、代码修改时更容易越界,以及 token 消耗更快等问题,因此他选择暂时留在 4.6。
Wenweno0o3 天前
golang·大模型·智能体·eino
Eino-Document 组件使用指南Eino-Document 是 cloudwego/eino 生态中的文档处理库,提供了从多种来源加载文档、解析不同格式、对文档进行分割 transform 等全链路能力。本文介绍Document 各组件的用法及典型应用场景,代码链接。
陈振wx:zchen20083 天前
大模型·springai·deepseek
SpringAI+DeepSeek大模型开发AI,人工智能(Artificial Intelligence),使机器能够像人类一样思考、学习和解决问题的技术。 AI发展至今大概可以分为三个阶段: 其中,深度学习领域的自然语言处理(Natural Language Processing, NLP)有一个关键技术叫做Transformer,这是一种由多层感知机组成的神经网络模型,是现如今AI高速发展的最主要原因。
liu****3 天前
windows·langchain·大模型·工作流·langgraph
LangGraph-AI应用开发框架(二)目录编码前的版本说明LangGraph案例一(智能快递配送系统)1.Graph API编码思路2.代码实现
xixixi777773 天前
网络·gpt·安全·机器学习·架构·大模型·claude
从Mythos到GPT-5.4-Cyber:AI安全竞赛的“双轨”分化与防御新范式当Claude Mythos在OpenBSD中挖出27年的“老坑”,OpenAI选择了另一条路:把AI还给防守者,把控制权握在自己手里。
loong_XL3 天前
大模型·agent·智能体·claw·龙虾
2026智能体爆发现象级产品:OpenClaw、Hermes Agent、Claude Cowork三个产品放一起对比很有意思,正好代表了 2026 年 AI agent 三条不同的路线。OpenClaw(前身是 Clawdbot)是开源 AI agent 框架,由开发者 Peter Steinberger 创建,可以执行 shell 命令、读写本地文件、浏览网页、发送邮件、管理日历,通过 WhatsApp、Slack、Telegram、Discord、iMessage 等平台与用户交互,代替用户在数字生活中自主行动。
CoderJia程序员甲3 天前
ai·大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-17)生成于:2026-04-17共发现热门项目: 14 个榜单类型:日榜Token赞助:siliconflow
CoderJia程序员甲4 天前
ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-16)生成于:2026-04-16共发现热门项目: 13 个榜单类型:日榜Token赞助:siliconflow
庄小焱4 天前
大模型·rag·ai模型·ai系统·ai算法
【AI模型】——RAG技术简介与实战示例本文系统介绍了RAG(检索增强生成)技术,阐述其通过结合LLM参数化知识与外部非参数化知识解决大模型幻觉、知识滞后等问题的核心机制,对比了Naive/Advanced/Modular三阶段架构演进,并详细讲解了从数据准备、索引构建到检索优化的完整工程实践,包括文本分块策略、向量数据库选型及FAISS/rerank等关键优化方向。