大模型

DevilSeagull4 小时前
人工智能·程序人生·langchain·大模型·llm·vibe coding
LangChain & LangGraph 介绍近十年来,低代码/无代码平台与 AI 辅助编程工具持续渗透软件开发领域。如今,一种名为 Vibe Coding(氛围编程) 的新型实践迅速崛起,深刻挑战了人们对"程序员职责边界"的既有认知。
CoderJia程序员甲6 小时前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-02-19)生成于:2026-02-19共发现热门项目: 11 个榜单类型:日榜本期GitHub热榜显示AI应用开发正从模型层面向工具链和工程化深度演进,技术热点集中在智能体(Agent)与增强检索生成(RAG)的实践。开源项目如超级技能框架Superpowers和多功能AI助手工具Composio提供了可复用的Agent构建范式,而RAG优化技术仓库则详细拆解了提升回答准确性的核心方法。同时,轻量级向量数据库zvec和终端AI助手qwen-code凸显了高效、低门槛的本地化部署趋势。这些项目以代码为核心,提供了从理
Tadas-Gao8 小时前
人工智能·深度学习·架构·大模型·llm·软件工程
校准之弧与演进之轮:大模型时代的软件工程范式革命2026年的今天,软件系统的核心矛盾正在发生深刻转移。传统软件工程建立在一个基本假设之上:系统的行为是确定的,给定相同的输入,必然产生相同的输出。然而,大语言模型的引入彻底颠覆了这一假设——我们不再构建纯粹的逻辑系统,而是在与一个概率性的、涌现性的、黑箱化的智能体共舞。(扩展阅读:从CI/CD到CC/CD:AI应用不是“盖”出来的,是“种”出来的——解码大模型时代的软件工程范式革命)
m0_488913019 小时前
人工智能·搜索引擎·云原生·eureka·开源·大模型·产品经理
新手小白也能学会的Dify本地部署教程(超详细)首先打开Docker官网,点击按钮,选择Windows版本的Docker安装包,点击下载。下载完成后,打开安装包,一路点击下一步即可,该过程中Docker会自动拉取所需的内容。完成后打开cmd(cmd打开方法请看图),输入docker,如果下方出现Docker的命令提示就代表安装成功了。
山顶夕景9 小时前
大模型·llm·多模态·vlm
【VLM】Qwen3-VL模型架构和训练流程链接:https://arxiv.org/pdf/2511.21631模型家族包含密集型(2B/4B/8B/32B)与混合专家(Mixture-of-Experts, MoE)两种架构(30B-A3B/235B-A22B),以适应不同延迟-质量权衡需求。
索木木1 天前
人工智能·深度学习·机器学习·大模型·训练·cp·切分
大模型训练CP切分(与TP、SP结合)一. CP并行原理megatron中的context并行(简称CP)与sequence并行(简称SP)不同点在于,SP只针对Layernorm和Dropout输出的activation在sequence维度上进行切分,CP则是对所有的input输入和所有的输出activation在sequence维度上进行切分,可以看成是增强版的SP。之前我有篇文章重点讲了TP、SP、EP技术。本文我讲下长文本的CP技术,以及怎么和TP和SP结合的。
lczdyx1 天前
人工智能·深度学习·机器学习·ai·大模型·反向传播
【胶囊网络】01-2 胶囊网络发展历史与研究现状胶囊网络的思想并非一蹴而就,而是源于 Hinton 教授对传统 CNN 缺陷的长期思考。Hinton 开始公开质疑 CNN 中池化操作的有效性:
枕石 入梦1 天前
服务器·人工智能·大模型·华为云
华为云服务器本地部署大模型实战(Ollama + Tesla T4 踩坑记)在企业级应用场景中,出于数据安全考量,服务器往往无法连接外网。如何在“纯离线”的华为云 ECS 环境下部署大模型?本文记录了我在华为云 ECS(Tesla T4)上部署 Ollama 的全过程,希望能帮大家少走弯路。
lczdyx1 天前
人工智能·深度学习·机器学习·ai·大模型·反向传播·胶囊网络
【胶囊网络 - 简明教程】02-1 胶囊网络 - 整体架构设计基于本项目(Capsule_Network.ipynb)实现的架构,完整的胶囊网络由以下核心组件构成:
来两个炸鸡腿1 天前
人工智能·学习·大模型·vibe coding
【Datawhale组队学习202602】Easy-Vibe task03 动手做出原型
魔乐社区2 天前
人工智能·开源·大模型
GLM-5上线魔乐社区,基于昇腾的模型推理+训练部署教程请查收!2026年2月12日,智谱AI开源GLM-5模型。在 Coding 与 Agent 能力上,取得开源 SOTA 表现,在真实编程场景的使用体感逼近 Claude Opus 4.5,擅长复杂系统工程与长程 Agent 任务。在全球权威的 Artificial Analysis 榜单中,GLM-5 位居全球第四、开源第一。
AI周红伟2 天前
大数据·人工智能·机器人·大模型·智能体·seedance
周红伟:具身机器人大爆炸了,机器人时代来临宇树机器人春晚武术表演再炸场,王兴兴:高动态高协同集群控制技术全球首秀宇树第三度登上春晚,依然让网友直呼惊喜。
AI周红伟2 天前
大数据·人工智能·机器学习·大模型·agi·智能体·seedance
周红伟:2026年10个AI预言:迈向AGI通用人工智能体时代2026年被多家权威机构和科技领袖视为AI发展历程中的关键转折点——技术突破正从"概念验证"走向"产业深度融合",通用人工智能(AGI)的曙光已隐约可见。这一年,我们或许将见证AI从单纯的"生成内容"向"理解世界、自主规划、协同行动"的深刻跨越。基于最新的行业报告与专家研判,以下是关于2026年迈向AGI时代的10个核心预言:
CoderJia程序员甲2 天前
ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-02-17)生成于:2026-02-17共发现热门项目: 10 个榜单类型:日榜本期GitHub热榜展现了AI与应用深度融合的强劲趋势,核心技术热点聚焦于智能体开发与高性能基础设施。AI编程助手项目如OpenClaw和Letta-Code强调记忆能力和全栈支持,助力开发者提效;以Rust构建的NautilusTrader和轻量级向量数据库ZVec则凸显了对极致性能和实时数据处理的需求。同时,Wifi-DensePose创新性地利用WiFi实现穿墙姿态估计,拓宽了感知技术边界。榜单整体反映出行业正从模型探索转向具体场景
呆萌的代Ma2 天前
大模型·飞书·n8n
N8N(二):示例项目:将表单内容写入到飞书表格中这里我们做一个简单的项目我们在网页上填一个表单,然后让N8N保存到我们的飞书表格中我们先拆解这个功能:
山顶夕景3 天前
大模型·llm·多模态·infra
【MLLM】Qwen3.5模型✦ 基于混合结构,397B总参/17B激活,能力匹配 >1T 参数的 Qwen3-Max; ✦ 原生多模态设计,同量级下多模态任务表现优于 Qwen3-VL; ✦ 覆盖 201 种语言; ✦ 在代码生成、智能体推理与多模态理解方面表现卓越;
PPIO派欧云3 天前
ai·大模型
Qwen3.5重磅发布 PPIO 模型服务平台同步上线今天,阿里巴巴全新一代大模型千问 Qwen3.5 重磅开源发布,凭借突破性性能登顶全球最强开源模型榜单。
AI周红伟3 天前
人工智能·大模型·智能体·seedance
周红伟:Agent Skills+OpenClaw+RAG+Agent+SeeDance2.0企业智能体智能体应用实战摘要:在2026年企业数字化转型深水区,掌握OpenClaw、RAG与Agent等前沿技术的智能体构建能力已成为企业培训的关键需求。本文基于北京、深圳、广州、杭州四大科技重镇的市场反馈与行业数据,深入分析企业智能体培训的核心场景与评估维度。
小草cys3 天前
人工智能·自动化·大模型
opencode/claude code自动写书啦使用vscode+opencode+claude-opus-4-5-20251101写了一份90多页的一章节书稿,
Tadas-Gao3 天前
人工智能·云原生·重构·架构·系统架构·大模型
架构逆转向量:AI时代规范驱动开发的范式重构与实践图谱过去18个月,软件工程领域经历了一场奇特的狂欢。“Vibe Coding”(氛围编程)成为最时髦的术语——开发者用自然语言与AI即兴对话,享受着代码如泉水般涌出的快感。然而,这场狂欢很快显露出其脆弱本质:相同的提示词在不同时间产出完全不同的代码,冗长的聊天历史让需求追溯变成考古学,上下文丢失导致AI频繁“失忆”,生成的代码“听起来正确但实际上无法运行”。