大模型

huazi-J4 小时前
语言模型·大模型·transformer·datawhale
Datawhale Happy-LLM 课程 task 4:Encoder-Decoder此博客为Datawhale 组队学习打卡笔记[1] https://github.com/datawhalechina/happy-llm
过期的秋刀鱼!5 小时前
人工智能·深度学习·机器学习·大模型·线性回归·过拟合和欠拟合·大模型调参
机器学习-正则化线性回归如上图我们不需要对b进行正则化,w控制着特征的影响强度,W太大会容易让模型对训练数据过于敏感,造成过拟合,而B是偏置项,相当于对所有样本添加了一个固定值,,他的大小对模型的影响很小,不会导致过拟合额,他只影响模型的整体平移
CoderJia程序员甲5 小时前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-01-18)生成于:2026-01-18共发现热门项目: 12 个榜单类型:日榜本期GitHub热榜显示AI与大模型应用正深入解决实际问题,技术热点集中在文本信息结构化提取和智能语音生成。Google的langextract利用LLMs精准抽取文本信息,OpenBMB的VoxCPM实现无需分词的高质量语音克隆,凸显了多模态AI技术的成熟落地。同时,TrendRadar和anthropics的技能库展示了AI在信息聚合与智能体工作流构建方面的强大能力,而ultralytics的YOLO和NVIDIA的物理AI框架则推动
山顶夕景15 小时前
大模型·llm·ocr·多模态·文档智能·vlm
【VLM】Format Decoupled Reinforcement Learning for Document OCR【文档智能进展】讲的故事是格式化文本(公式、表格等)比纯文本熵值高一个数量级,导致模型输出不确定性大、解析准确率低,所以搞了个应对思路。工作在:Reading or Reasoning? Format Decoupled Reinforcement Learning for Document OCR,https://arxiv.org/pdf/2601.08834,
用什么都重名21 小时前
python·大模型·llm·api调用
「实战指南」使用 Python 调用大模型(LLM)目录前言1. 原生HTTP请求方式1.1 核心特点1.2 关键代码分析1.3 优势和适用场景1.4 完整代码
无双@1 天前
ai·大模型·agent·claude·配置·claude code·skills
保姆级 安装+使用上 Claude CodeClaude Code 是 Anthropic 推出的一个 面向开发者的 AI 编程助手(CLI 工具)。你可以把它理解成: 👉 “能直接在你本地项目里干活的 Claude”,而不是只在网页里聊天。
CoderJia程序员甲1 天前
ai·开源·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-01-17)生成于:2026-01-17共发现热门项目: 9 个榜单类型:日榜本期GitHub热榜显示AI应用开发正全面渗透工程实践,智能体框架superpowers和agents.md通过标准化方法显著提升开发效率,而langextract则解决了LLM信息抽取的精度难题。同时,本地化离线工具如Handy和AionUi凸显隐私与可控需求,YOLO持续领跑目标检测,可视化编辑器Puck及多款桌面协同工具则推动开发体验革新,整体趋势指向AI驱动的实际解决方案正趋于成熟、可复现且高度集成。
乙真仙人1 天前
人工智能·大模型·skills
Claude Skills 的本质你可能在各种地方看到过关于 Claude Skills 的介绍,但说实话,大部分文章看完之后你还是不知道它到底是怎么运作的。
tiger1191 天前
大数据·大模型·提示词·ai agent
AI Agent 如何从演示到生产我最近在网上看到一套“Agent 的 12 种核心构建范式”,感觉它实际上很明确的介绍了AI Agent如何从一个演示程序到生产可用的搭建过程和原则。挺完整,就顺手记录、翻译了一下,也补了一点自己在工程视角下的理解。
北邮刘老师1 天前
服务器·网络·数据库·人工智能·大模型·智能体·智能体互联网
从SEO到ADO:智能体时代的流量密码但在即将到来的智能体互联网时代,入口正在悄悄变形,而且这次变形更像“换代”,而不是“升级”。用户越来越少在搜索框里做功课,越来越多把任务直接交给智能体:写方案、对比产品、规划行程、挑选课程、筛选简历、生成合同条款……它不像搜索那样把十个链接甩给你,而是试图直接给你一个可执行的答案,甚至替你把下一步也做了。
CoderJia程序员甲1 天前
ai·开源·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-1-12)生成于:2026-1-12共发现热门项目: 13 个榜单类型:日榜本期GitHub热榜显示人工智能编程助手和智能体开发正席卷开发者社区,以Claude Code为核心的多个生态项目表现亮眼,包括开源编码代理OpenCode、技能库Superpowers以及自主开发循环工具Ralph,凸显终端内AI辅助编程已成主流。同时,多模态AI智能体平台UI-TARS和SimStudio的崛起表明构建复杂AI工作流的需求激增。开源项目管理工具Plane和CRM系统Twenty的持续走强,则反映开发者正积极寻求可替代商业
持续升级打怪中2 天前
大模型
大模型微调实战指南:从理论到实践的全流程解析近年来,大规模预训练模型(如GPT系列、BERT、LLaMA等)在各种自然语言处理任务中展现出了惊人的能力。然而,这些“通用”大模型在面对特定领域任务时,往往表现不尽如人意。这就引出了一个关键问题:如何让通用大模型更好地适应我们的特定需求?
韦东东2 天前
人工智能·macos·大模型·mac mini·边缘算力·知识库应用
万元级边缘算力方案:Mac Mini在几个知识库项目的部署实践做企业知识库项目,私有化部署是绕不开的话题。有些行业有明确的合规要求,数据必须落在自己的服务器上;还有一些中小企业,数据本身可能并没那么敏感,但老板出于个人偏好也倾向于做本地化。这类项目的交付方式都是软硬件一体,不光要调好模型,还要把算力设备一起配好。
人工智能培训2 天前
人工智能·深度学习·机器学习·大模型·aigc·ai工程师证书·ai证书
AIGC技术与进展(2)AIGC(人工智能生成内容)核心价值是通过文本、图像、音频、视频等多模态内容的自动化生成,实现降本增效、创意激发、个性化规模化交付,并推动产业模式与社会价值的双重升级,已成为企业数字化转型与内容生态重构的核心引擎。以下从核心价值维度、行业落地与社会价值展开说明。
KAI智习2 天前
人工智能·大模型
大模型榜单周报(2026/1/17)本周大模型领域继续保持快速发展态势,各大厂商在医疗AI、视频生成、代码能力等多个领域取得显著进展。OpenRouter模型调用量排名发生重要变化,Claude系列模型表现抢眼,百度新模型ERNIE-5.0-0110在全球LMArena文本排行榜上排名第八,展现了中国模型的强劲实力。
CoderJia程序员甲2 天前
ai·开源·大模型·github·ai教程
GitHub 热榜项目 - 日榜(20260116)生成于:20260116共发现热门项目: 10 个榜单类型:日榜本期GitHub热榜显示AI与开发者工具仍是核心驱动力。LocalAI作为开源私有化AI解决方案持续火爆,配合MediaPipe等跨平台ML工具,凸显边缘计算与模型轻量化趋势。同时,eBPF技术(Cilium)在云原生网络与安全领域稳扎稳打,而YOLO目标检测框架保持高热度。开发者生产力工具如Eigent协作桌面和WaveTerm终端革新工作流,React可视化编辑器Puck则体现低代码趋势。整体呈现AI平民化、开发工具智能化、基础设施云原生
TGITCIC2 天前
langchain·大模型·ai agent·ai智能体·agent开发·rag教程·agent教程
从玩具到工具:LangChain 入门 (一)本文所用可运行langchain已经按照生产级框架配置,位于csdn的资源下载:从玩具到工具:LangChain 入门教程代码demo
精致先生3 天前
大模型·智能体·langgraph
LangGraph框架在LangChain体系中,LangGraph 是一种基于状态机的框架,专为构建复杂的 AI 工作流而设计。它允许开发者定义图结构来表示不同的操作节点以及它们之间的流转逻辑。包含 START 初始入口、END 某个分支或者整体工作的结束节位置、自定义任务节点。
清 澜3 天前
人工智能·面试·职场和发展·大模型
大模型扫盲式面试知识复习 (二)并非模型参数本身,而是KV Cache(Key-Value 缓存)。在自回归生成中,为避免重复计算历史 Token 的 KKK 和 VVV,系统会将其缓存。对于 MHA,每个头都需独立存储一份 KV,导致缓存体积随头数线性增长。
人工智能培训3 天前
人工智能·深度学习·大模型·知识图谱·强化学习·智能体搭建·大模型工程师
如何大幅降低大模型的训练和推理成本?大模型的训练与推理成本主要源于海量参数带来的算力消耗、存储开销和资源利用率低下等问题。要实现成本的大幅降低,需从模型本身、计算架构、训练流程、部署管理等多维度协同优化,在保证模型性能不显著下降的前提下,最大化资源利用效率。以下是经过产业实践验证的核心策略: