大模型

谷哥的小弟1 小时前
人工智能·深度学习·机器学习·大模型·智能体
大模型核心基础知识(02)—大模型的主要特征与能力边界大模型之所以在人工智能领域形成广泛影响,并不只是因为参数数量更大,而是因为它在表示学习、任务迁移、内容生成和跨模态处理等方面表现出比传统模型更强的综合能力。随着模型规模、训练数据和计算资源不断扩展,大模型的性能通常会随之提升,这也是近年来大模型快速发展的重要原因之一。与此同时,大模型的能力并不等于没有边界。模型规模的增长能够带来更强的理解与生成能力,但并不能自动消除事实错误、推理偏差、可解释性不足和高资源消耗等问题。
谷哥的小弟3 小时前
人工智能·深度学习·机器学习·大模型·智能体
大模型核心基础知识(01)—大模型的发展历程与技术演进大模型并不是孤立出现的技术产物,而是在人工智能、神经网络、深度学习和预训练方法持续演进的基础上逐步形成的。回顾大模型的发展历程,可以看到一条较为清晰的技术演进路径:早期人工智能研究奠定问题意识,神经网络研究提供结构基础,深度学习推动表示学习能力提升,预训练方法和Transformer架构则进一步促成了现代大模型的形成。
xiaotao1314 小时前
人工智能·深度学习·大模型·指令微调
03-深度学习基础:指令微调与RLHF指令微调 vs RLHF:发展历程:记住:
DavidSoCool4 小时前
java·spring·ai·大模型·springboot·mcp
Springboot AI 创建MCP Server使用springboot AI实现一个伪查询天气的MCP Server,协议是Stdio。系统:win11
程序员柒叔5 小时前
人工智能·大模型·openclaw·clawbot·motlbot
OpenClaw 一周动态-2026-W17日期范围: 2026-04-15 - 2026-04-21 摘要: 本周以 2026.4.15 稳定版为核心——默认升级至 Claude Opus 4.7、新增 Gemini TTS、Control UI 模型鉴权状态卡等重磅功能;4.19 beta 系列密集修复嵌套 Agent 阻塞与 Codex token 虚报;HN 社区"Ask: 谁在用 OpenClaw?"(337pts)和反讽长文(274pts)同步引爆讨论,生态工具(ArmorClaw、Palmier、Viche)扎堆涌现。
xiaotao1316 小时前
人工智能·深度学习·大模型
03-深度学习基础:模型部署与量化部署流程总结:最佳实践:
xiaotao1316 小时前
人工智能·深度学习·大模型·agent
03-深度学习基础:Agent与工具调用Agent开发流程:记住:
代码随想录1 天前
人工智能·大模型·rag·ai应用开发
RAG大厂面试题汇总:向量检索、混合检索、Rerank、幻觉处理高频问题大模型系列教程尽在卡码笔记今年知识星球里,录友反馈最多的面试变化就是:RAG 成了必考项。不管你投的是大模型应用开发、LLM 工程、还是 AI 后端,面试官都会问:“你做过 RAG 吗?检索策略怎么设计的?”
前端摸鱼匠1 天前
人工智能·ai·面试·大模型·求职招聘
【AI大模型春招面试题25】掩码自注意力(Masked Self-Attention)与普通自注意力的区别?适用场景?你好!咱们就不整那些虚头巴脑的教科书定义了。既然你问到了**掩码自注意力(Masked Self-Attention)与普通自注意力(Standard Self-Attention)**的区别,这不仅是Transformer架构的基石,更是大模型面试中考察“你对生成式原理理解深度”的必考题。
CoderJia程序员甲1 天前
ai·大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-21)生成于:2026-04-21共发现热门项目: 10 个榜单类型:日榜Token赞助:siliconflow
其实防守也摸鱼1 天前
人工智能·安全·ai·大模型·软件工程·本地大模型
部署本地AI大模型--ollma下载链接:1.官网:在Windows上下载《Ollama2.github:Release v0.21.0 · ollama/ollama
前端摸鱼匠1 天前
人工智能·算法·ai·面试·大模型·求职招聘
【AI大模型春招面试题24】什么是“注意力分数”?如何计算?其大小反映了什么?你好!咱们直接切入正题。这道题是 Transformer 架构的“地基”,看似基础,实则暗藏玄机。很多候选人能背出公式,但一旦问到“为什么要除以 d k \sqrt{d_k} dk ”或者“分数大小到底意味着什么物理含义”,就容易卡壳。
熊猫钓鱼>_>1 天前
百度·ai·大模型·llm·ernie·image·图像生成
ERNIE-Image 深度测评:百度 8B 小模型如何撼动文生图格局2026 年 4 月 15 日,百度文心大模型团队扔下了一颗重磅炸弹——开源文生图模型 ERNIE-Image-2。在开源文生图领域被 SD3、Flux、Qwen-Image 等大模型盘踞的当下,百度带来了一个只有 8B 参数的“小模型”,却宣称能在消费级显卡上跑出媲美顶级商业模型的效果。
重生之我要成为代码大佬1 天前
人工智能·pytorch·深度学习·大模型·视觉检测
pytorch与视觉检测一些零基础的课堂笔记,往期在同专栏里PyTorch = NumPy + GPU痛点:NumPy 很好用,但只能用 CPU,在大数据面前太慢。
拓朗工控2 天前
大模型·算力·电网·电力
当大模型遇上大电网:算力与电力的“双向奔赴”在人工智能技术狂飙突进的今天,一个有趣的悖论正摆在我们面前:AI的尽头是算力,而算力的尽头,却是电力。
DavidSoCool2 天前
ai·大模型·知识库·dify
win11系统使用DockerDesktop搭建Dify实现知识库问答一、安装Docker安装Dify1、安装docker,最好win11系统,不然会有很多错误,然后改下镜像源拉取速度会快点,还有镜像的存储位置防止C盘爆满。
刘大猫.2 天前
华为·ai·大模型·算力·deepseek·deepseek-v4·昇腾芯片
华为昇腾芯片将为DeepSeek-V4推理,通往国产算力自由V4的推理将运行在950 PR上,其异构计算架构CANN Next将兼容CUDA。不过,V4的训练仍然使用英伟达先进的GPU。
Flying pigs~~2 天前
人工智能·开源·大模型·agent·dify·rag
Dify平台入门指南:开源LLM应用开发平台深度解析Dify是一款开源的LLM应用开发平台,融合了后端即服务(BaaS)的理念,让开发者可以快速搭建生产级的生成式AI应用。即使是非技术人员,也能参与到AI应用的定义和数据运营中。
CoderJia程序员甲2 天前
ai·大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-20)生成于:2026-04-20共发现热门项目: 10 个榜单类型:日榜Token赞助:siliconflow