技术栈
大模型
Flying pigs~~
2 小时前
人工智能
·
开源
·
大模型
·
agent
·
dify
·
rag
Dify平台入门指南:开源LLM应用开发平台深度解析
Dify是一款开源的LLM应用开发平台,融合了后端即服务(BaaS)的理念,让开发者可以快速搭建生产级的生成式AI应用。即使是非技术人员,也能参与到AI应用的定义和数据运营中。
CoderJia程序员甲
2 小时前
ai
·
大模型
·
llm
·
github
·
ai教程
GitHub 热榜项目 - 日榜(2026-04-20)
生成于:2026-04-20共发现热门项目: 10 个榜单类型:日榜Token赞助:siliconflow
zhangfeng1133
3 小时前
大模型
llamfactory 微调中用到的cpu的两处参数preprocessing_num_workers dataloader_num_workers
我给你用最直白、最清晰、不绕弯的方式讲清楚,这几个参数到底干什么的、区别在哪、为什么你必须都开。你之前 CPU 只有 8%,就是因为 只开了预处理,没开训练时的数据加载多线程。
带娃的IT创业者
3 小时前
人工智能
·
python
·
ai
·
开源
·
大模型
·
qwen
·
编程代理
深度解析 Qwen3.6-35B-A3B:重塑 AI 编程代理的开源新标杆
在开源大模型领域,通义千问团队再次投下了一枚重磅炸弹。近日,Qwen3.6-35B-A3B 模型正式发布,并迅速登顶 Hacker News 热榜,获得 634 票的高度关注。这不仅仅是一个参数量的更新,更是一次针对“Agentic Coding(代理编程)”能力的深度优化。
liu****
3 小时前
python
·
langchain
·
大模型
·
langgraph
LangGraph-AI应用开发框架(五)
目录一.LangGraph 的其他特性1.使用 Overwrite 绕过 reducer2.定义输入输出模式
ACCELERATOR_LLC
1 天前
人工智能
·
大模型
·
datawhale
【DataWhale组队学习】DIY-LLM Task1分词器
原文链接分词器常被视为LLM的一部分,但它其实有独立的训练生命周期。Tokenizer本质上是将原始文本转换为模型可处理的离散符号序列的组件,它可以决定模型看到世界的基本粒度:是字符、单词、子词,还是字节片段,而这个粒度的选择会进一步影响序列长度、OOV、词表的规模还有训练效率等。
程序员三明治
1 天前
人工智能
·
ai
·
大模型
·
llm
·
量化
·
java后端
·
api调用
【AI探索】程序员到底该怎么理解 LLM?
你第一反应大概率不是去翻论文,而是直接打开几个现成的产品试试。你可能会去问 DeepSeek、通义千问,或者别的聊天工具,把自己业务里的问题丢进去测一测。结果往往会让人眼前一亮:模型不仅能把话说通顺,还能理解你给它的上下文,甚至能帮你总结、归纳、改写。有些原来必须靠人工做的事情,突然看起来像是真的可以交给机器了。
极客小云
1 天前
人工智能
·
网络安全
·
语言模型
·
大模型
·
github
·
安全性测试
·
代码复审
【AiCodeAudit 2.0 发布:基于调用图与局部子图的 AI 代码安全审计平台】
本文是 AiCodeAudit 的2.0 大版本更新介绍。如果你之前了解过 1.0 版本,本文将重点介绍静态解析引擎、Web 可视化界面及结构化报告等新特性;如果你是新用户,本文将作为完整的使用指南。
DFCED
2 天前
人工智能
·
大模型
·
agent
·
sora
突发!Sora 之父 Bill Peebles 离职:OpenAI 理想主义的又一次落幕
Sora 之父 Bill Peebles 离职:OpenAI 理想主义的又一次落幕 2026 年 4 月 18 日凌晨,OpenAI 再次震动科技圈。Sora 项目核心负责人 Bill Peebles 在社交平台上官宣离职,与他同一天离开的还有前首席产品官 Kevin Weil 和企业应用 CTO Srinivas Narayanan。这场高管集体出走,与 OpenAI 正在进行的战略收缩和 IPO 冲刺紧密相连。
今天你TLE了吗
2 天前
java
·
人工智能
·
语言模型
·
大模型
LLM到Agent&RAG——AI概念概述 第一章:大模型
传统业务当中,我们通过if-else将所有规则硬性写好,所有情况、出发的回答都是固定的。很容易就能写出一个简单的客服回复:
被制作时长两年半的个人练习生
2 天前
大模型
·
算子
kerminal工具试用
这两天kerminal在做推广,我试用了一下他们的工具。有一些值得分享的感受。首先这个工具的前身是kernelcat,当时在几十分钟内写好了最新的DeepSeek mHc算子,还引起了一点轰动。据说写的加法能到官方baseline的九倍。这次不限量试用,我直接吃螃蟹。
AI精钢
2 天前
网络
·
人工智能
·
ai
·
大模型
·
llm
·
claude
·
技术评论
Claude Opus 4.7 是一次失败的升级吗?一次基于用户反馈的技术复盘
最近,一则关于“Claude Opus 4.7 不如 4.6”的 Reddit 帖子引发了不少讨论。发帖者的核心观点很直接:升级后的模型在若干真实使用场景里,似乎没有带来预期中的质量提升,反而出现了更强的“自信幻觉”、更像默认低 effort 的 adaptive reasoning、代码修改时更容易越界,以及 token 消耗更快等问题,因此他选择暂时留在 4.6。
Wenweno0o
3 天前
golang
·
大模型
·
智能体
·
eino
Eino-Document 组件使用指南
Eino-Document 是 cloudwego/eino 生态中的文档处理库,提供了从多种来源加载文档、解析不同格式、对文档进行分割 transform 等全链路能力。本文介绍Document 各组件的用法及典型应用场景,代码链接。
陈振wx:zchen2008
3 天前
大模型
·
springai
·
deepseek
SpringAI+DeepSeek大模型开发
AI,人工智能(Artificial Intelligence),使机器能够像人类一样思考、学习和解决问题的技术。 AI发展至今大概可以分为三个阶段: 其中,深度学习领域的自然语言处理(Natural Language Processing, NLP)有一个关键技术叫做Transformer,这是一种由多层感知机组成的神经网络模型,是现如今AI高速发展的最主要原因。
liu****
3 天前
windows
·
langchain
·
大模型
·
工作流
·
langgraph
LangGraph-AI应用开发框架(二)
目录编码前的版本说明LangGraph案例一(智能快递配送系统)1.Graph API编码思路2.代码实现
xixixi77777
3 天前
网络
·
gpt
·
安全
·
机器学习
·
架构
·
大模型
·
claude
从Mythos到GPT-5.4-Cyber:AI安全竞赛的“双轨”分化与防御新范式
当Claude Mythos在OpenBSD中挖出27年的“老坑”,OpenAI选择了另一条路:把AI还给防守者,把控制权握在自己手里。
loong_XL
3 天前
大模型
·
agent
·
智能体
·
claw
·
龙虾
2026智能体爆发现象级产品:OpenClaw、Hermes Agent、Claude Cowork
三个产品放一起对比很有意思,正好代表了 2026 年 AI agent 三条不同的路线。OpenClaw(前身是 Clawdbot)是开源 AI agent 框架,由开发者 Peter Steinberger 创建,可以执行 shell 命令、读写本地文件、浏览网页、发送邮件、管理日历,通过 WhatsApp、Slack、Telegram、Discord、iMessage 等平台与用户交互,代替用户在数字生活中自主行动。
CoderJia程序员甲
3 天前
ai
·
大模型
·
llm
·
github
·
ai教程
GitHub 热榜项目 - 日榜(2026-04-17)
生成于:2026-04-17共发现热门项目: 14 个榜单类型:日榜Token赞助:siliconflow
CoderJia程序员甲
4 天前
ai
·
大模型
·
github
·
ai教程
GitHub 热榜项目 - 日榜(2026-04-16)
生成于:2026-04-16共发现热门项目: 13 个榜单类型:日榜Token赞助:siliconflow
庄小焱
4 天前
大模型
·
rag
·
ai模型
·
ai系统
·
ai算法
【AI模型】——RAG技术简介与实战示例
本文系统介绍了RAG(检索增强生成)技术,阐述其通过结合LLM参数化知识与外部非参数化知识解决大模型幻觉、知识滞后等问题的核心机制,对比了Naive/Advanced/Modular三阶段架构演进,并详细讲解了从数据准备、索引构建到检索优化的完整工程实践,包括文本分块策略、向量数据库选型及FAISS/rerank等关键优化方向。