大模型

前端摸鱼匠1 小时前
人工智能·ai·面试·大模型·求职招聘
【AI大模型春招面试题25】掩码自注意力(Masked Self-Attention)与普通自注意力的区别?适用场景?你好!咱们就不整那些虚头巴脑的教科书定义了。既然你问到了**掩码自注意力(Masked Self-Attention)与普通自注意力(Standard Self-Attention)**的区别,这不仅是Transformer架构的基石,更是大模型面试中考察“你对生成式原理理解深度”的必考题。
CoderJia程序员甲2 小时前
ai·大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-21)生成于:2026-04-21共发现热门项目: 10 个榜单类型:日榜Token赞助:siliconflow
其实防守也摸鱼3 小时前
人工智能·安全·ai·大模型·软件工程·本地大模型
部署本地AI大模型--ollma下载链接:1.官网:在Windows上下载《Ollama2.github:Release v0.21.0 · ollama/ollama
前端摸鱼匠5 小时前
人工智能·算法·ai·面试·大模型·求职招聘
【AI大模型春招面试题24】什么是“注意力分数”?如何计算?其大小反映了什么?你好!咱们直接切入正题。这道题是 Transformer 架构的“地基”,看似基础,实则暗藏玄机。很多候选人能背出公式,但一旦问到“为什么要除以 d k \sqrt{d_k} dk ”或者“分数大小到底意味着什么物理含义”,就容易卡壳。
熊猫钓鱼>_>5 小时前
百度·ai·大模型·llm·ernie·image·图像生成
ERNIE-Image 深度测评:百度 8B 小模型如何撼动文生图格局2026 年 4 月 15 日,百度文心大模型团队扔下了一颗重磅炸弹——开源文生图模型 ERNIE-Image-2。在开源文生图领域被 SD3、Flux、Qwen-Image 等大模型盘踞的当下,百度带来了一个只有 8B 参数的“小模型”,却宣称能在消费级显卡上跑出媲美顶级商业模型的效果。
重生之我要成为代码大佬6 小时前
人工智能·pytorch·深度学习·大模型·视觉检测
pytorch与视觉检测一些零基础的课堂笔记,往期在同专栏里PyTorch = NumPy + GPU痛点:NumPy 很好用,但只能用 CPU,在大数据面前太慢。
拓朗工控14 小时前
大模型·算力·电网·电力
当大模型遇上大电网:算力与电力的“双向奔赴”在人工智能技术狂飙突进的今天,一个有趣的悖论正摆在我们面前:AI的尽头是算力,而算力的尽头,却是电力。
DavidSoCool17 小时前
ai·大模型·知识库·dify
win11系统使用DockerDesktop搭建Dify实现知识库问答一、安装Docker安装Dify1、安装docker,最好win11系统,不然会有很多错误,然后改下镜像源拉取速度会快点,还有镜像的存储位置防止C盘爆满。
刘大猫.19 小时前
华为·ai·大模型·算力·deepseek·deepseek-v4·昇腾芯片
华为昇腾芯片将为DeepSeek-V4推理,通往国产算力自由V4的推理将运行在950 PR上,其异构计算架构CANN Next将兼容CUDA。不过,V4的训练仍然使用英伟达先进的GPU。
Flying pigs~~1 天前
人工智能·开源·大模型·agent·dify·rag
Dify平台入门指南:开源LLM应用开发平台深度解析Dify是一款开源的LLM应用开发平台,融合了后端即服务(BaaS)的理念,让开发者可以快速搭建生产级的生成式AI应用。即使是非技术人员,也能参与到AI应用的定义和数据运营中。
CoderJia程序员甲1 天前
ai·大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-20)生成于:2026-04-20共发现热门项目: 10 个榜单类型:日榜Token赞助:siliconflow
zhangfeng11331 天前
大模型
llamfactory 微调中用到的cpu的两处参数preprocessing_num_workers dataloader_num_workers我给你用最直白、最清晰、不绕弯的方式讲清楚,这几个参数到底干什么的、区别在哪、为什么你必须都开。你之前 CPU 只有 8%,就是因为 只开了预处理,没开训练时的数据加载多线程。
带娃的IT创业者1 天前
人工智能·python·ai·开源·大模型·qwen·编程代理
深度解析 Qwen3.6-35B-A3B:重塑 AI 编程代理的开源新标杆在开源大模型领域,通义千问团队再次投下了一枚重磅炸弹。近日,Qwen3.6-35B-A3B 模型正式发布,并迅速登顶 Hacker News 热榜,获得 634 票的高度关注。这不仅仅是一个参数量的更新,更是一次针对“Agentic Coding(代理编程)”能力的深度优化。
liu****1 天前
python·langchain·大模型·langgraph
LangGraph-AI应用开发框架(五)目录一.LangGraph 的其他特性1.使用 Overwrite 绕过 reducer2.定义输入输出模式
ACCELERATOR_LLC2 天前
人工智能·大模型·datawhale
【DataWhale组队学习】DIY-LLM Task1分词器原文链接分词器常被视为LLM的一部分,但它其实有独立的训练生命周期。Tokenizer本质上是将原始文本转换为模型可处理的离散符号序列的组件,它可以决定模型看到世界的基本粒度:是字符、单词、子词,还是字节片段,而这个粒度的选择会进一步影响序列长度、OOV、词表的规模还有训练效率等。
程序员三明治2 天前
人工智能·ai·大模型·llm·量化·java后端·api调用
【AI探索】程序员到底该怎么理解 LLM?你第一反应大概率不是去翻论文,而是直接打开几个现成的产品试试。你可能会去问 DeepSeek、通义千问,或者别的聊天工具,把自己业务里的问题丢进去测一测。结果往往会让人眼前一亮:模型不仅能把话说通顺,还能理解你给它的上下文,甚至能帮你总结、归纳、改写。有些原来必须靠人工做的事情,突然看起来像是真的可以交给机器了。
极客小云2 天前
人工智能·网络安全·语言模型·大模型·github·安全性测试·代码复审
【AiCodeAudit 2.0 发布:基于调用图与局部子图的 AI 代码安全审计平台】本文是 AiCodeAudit 的2.0 大版本更新介绍。如果你之前了解过 1.0 版本,本文将重点介绍静态解析引擎、Web 可视化界面及结构化报告等新特性;如果你是新用户,本文将作为完整的使用指南。
DFCED3 天前
人工智能·大模型·agent·sora
突发!Sora 之父 Bill Peebles 离职:OpenAI 理想主义的又一次落幕Sora 之父 Bill Peebles 离职:OpenAI 理想主义的又一次落幕 2026 年 4 月 18 日凌晨,OpenAI 再次震动科技圈。Sora 项目核心负责人 Bill Peebles 在社交平台上官宣离职,与他同一天离开的还有前首席产品官 Kevin Weil 和企业应用 CTO Srinivas Narayanan。这场高管集体出走,与 OpenAI 正在进行的战略收缩和 IPO 冲刺紧密相连。
今天你TLE了吗3 天前
java·人工智能·语言模型·大模型
LLM到Agent&RAG——AI概念概述 第一章:大模型传统业务当中,我们通过if-else将所有规则硬性写好,所有情况、出发的回答都是固定的。很容易就能写出一个简单的客服回复:
被制作时长两年半的个人练习生3 天前
大模型·算子
kerminal工具试用这两天kerminal在做推广,我试用了一下他们的工具。有一些值得分享的感受。首先这个工具的前身是kernelcat,当时在几十分钟内写好了最新的DeepSeek mHc算子,还引起了一点轰动。据说写的加法能到官方baseline的九倍。这次不限量试用,我直接吃螃蟹。