大模型

CoderJia程序员甲12 小时前
ai·大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-12)生成于:2026-04-12共发现热门项目: 13 个榜单类型:日榜Token赞助:siliconflow
微尘hjx13 小时前
人工智能·深度学习·大模型·标注工具·训练数据集·yolo数据集
【数据集】数据集汇总(按比例划分训练、验证、测试)包含训练好的模型汇总往期的数据集链接。家庭室内烟火数据集吸烟行为数据集参考链接【深度学习02】YOLO模型的数据集、训练、验证、预测、导出_yolo训练数据集-CSDN博客
披星の月13 小时前
人工智能·大模型
一次完整大模型Lora训练实现“AI面试风”闲来无事,最近面试工作比较多,搞个模型训练下,看看能不能实现回答风格语气,符合面试的要求。本地物理机Ubuntu22.04系统 CPU ultra 265K 20核 内存32GB GPU RTX 5080 16GB显存 可正常访问所有网络,下载pytorch相关依赖包可能会需要国外网络环境。
汤姆yu13 小时前
gpt·大模型·gpt6
GPT-6核心能力解析及与现有主流大模型对比随着人工智能技术的飞速迭代,大模型已从“参数竞赛”迈入“架构创新+场景深耕”的新阶段,OpenAI作为行业引领者,即将推出的GPT-6被定义为“AGI最后一公里”的核心载体,并非前代模型的简单迭代,而是实现了架构、能力、应用的全方位革新。本文将详细解析GPT-6的核心能力,结合当前国内外主流大模型(如GPT-5、Gemini 2.5 Pro、Claude 4 Opus、通义千问3.0等)的核心参数与性能表现,从多维度进行全面对比,清晰呈现GPT-6的优势与定位,为行业应用与选型提供参考。
xixixi7777715 小时前
大数据·人工智能·机器学习·ai·大模型·算力·通信
Token 经济引爆 AI 产业加速:从百模大战到百虾大战,谁在定义 2026 的中国 AI?当全球 AI 产业的焦点还在为单一模型的性能突破争论不休时,2026 年春天的中国 AI 市场,正在上演一场更为宏大且多维的产业变革。中国 AI 大模型周调用量连续五周超越美国,字节跳动、阿里、智谱、腾讯等巨头密集发布新一代模型与智能体,一场围绕“Token 经济”的全球竞赛正进入白热化阶段。
拥抱AGI17 小时前
人工智能·学习·程序员·开源·大模型·大模型训练·qwen3.5
Qwen3.5开源矩阵震撼发布!从0.8B到397B,不同规模模型性能、显存、速度深度对比与选型指南来了!截至今天2026年3月3日,Qwen3.5已形成从0.8B到397B的完整开源矩阵,分为轻量稠密(0.8B/2B/4B/9B/27B)、中型MoE(35B-A3B/122B-A10B)、旗舰MoE(397B-A17B)三大梯队。不同尺度在性能、显存、速度、场景上差异显著,下面是完整对比与选型指南,仅供参考。
comedate17 小时前
大模型·本地部署·ollama·vibe coding
【OpenClaw】 8GB 显卡本地大模型部署指南本文档整理自实际问答,针对 8GB 显存环境下的本地大模型部署方案进行对比分析。Linux/macOS:
nix.gnehc17 小时前
人工智能·大模型·llm·ollama
实战部署|Ollama\+Qwen2\.5:3b\+Open WebUI 本地AI助手搭建全记录(附避坑指南)在AI大模型普及的今天,很多人都想拥有一个本地可部署、隐私安全、无API费用的AI助手——既不用依赖云端服务,数据全程不离开自己的设备,又能满足日常学习、编程辅助、基础问答等需求。我用一台10年前的惠普暗夜精灵2游戏本(原本16GB内存,为折腾k8s特意升级到32GB),成功部署了Ollama+Qwen2.5:3b+Open WebUI本地AI系统,全程踩坑少、操作简单,适合新手入门,今天就把完整部署过程整理出来,供大家参考。
淡海水17 小时前
人工智能·大模型
【AI模型】API-GoogleGemini【AI&游戏】专栏-直达Google Gemini API是Google DeepMind团队打造的大语言模型服务,提供了业界领先的多模态AI能力。作为Google在AI领域的重要战略产品,Gemini系列模型在2023年12月正式发布后迅速成为业界焦点。与其他模型相比,Gemini在长上下文窗口、多模态理解、视频处理和成本效率等方面展现出独特的优势。本篇文章将全面介绍Google Gemini API的核心功能、模型家族、开发指南以及在游戏开发中的应用场景。
盛世隐者17 小时前
大模型
【Ollama本地大模型】性能优化思考deepseek提供的模型参数量与推荐的硬件配置如下。如果内存16GB,显存8GB,推荐模型参数量小于7b,如qwen3.5:4b
guslegend18 小时前
人工智能·大模型·rag
第8节:打造可配置,可扩展的自动化预处理流水线RAG与Agent性能调优:第8节:打造可配置,可扩展的自动化预处理流水线Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
汤姆yu1 天前
ai·大模型·智能体·hermes
Hermes智能体使用指南Hermes智能体是由Nous Research研发的开源自主AI智能体,区别于普通聊天机器人和代码助手,它具备自我进化、持久记忆、多平台适配等核心优势,可运行在多种基础设施上,通过40+内置工具完成各类自动化任务,是开发者、研究者及普通用户的高效辅助工具。本文将从核心认知、安装部署、基础操作、高级功能、场景应用、故障排查及日常维护七个维度,详细讲解其使用方法,严格控制3000字,兼顾易懂性和实用性,帮助不同需求的用户快速上手。
Tadas-Gao1 天前
人工智能·语言模型·架构·大模型·llm·harness
从“驯马”到“驭队”:Harness Engineering 如何重构 AI 产品化的底层逻辑想象你有一个朋友,智商高达 180,读过世界上所有的书(大模型的预训练)。你让他帮你“筹备一次生日派对”。
guslegend1 天前
人工智能·大模型·ocr·rag
第6节:OCR文本错漏频发?结合LLM纠错,让图像文本也能精确使用RAG与Agent性能调优:6.OCR文本错漏频发?结合LLM纠错,让图像文本也能精确使用Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
Wenweno0o2 天前
golang·大模型·智能体·eino
Eino - 从0到1跑通大模型调用Eino 是字节跳动开源的 AI 应用开发框架,提供了丰富的大模型组件支持。本文将基于 代码示例,详细介绍如何使用 Eino 框架实现单轮对话、多轮对话、流式输出以及模型参数配置,帮助你从零开始掌握大模型调用,代码链接。
华农DrLai2 天前
数据库·人工智能·大模型·nlp·prompt
怎么用大模型生成推荐的训练数据?Data Augmentation怎么做?🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!
guslegend2 天前
人工智能·大模型
4月11日(Codex使用)Claude Code:https://github.com/anthropics/claude-code
CoderJia程序员甲2 天前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-11)生成于:2026-04-11共发现热门项目: 12 个榜单类型:日榜Token赞助:siliconflow
见合八方2 天前
ai·chatgpt·大模型·llm·入门教程
AI大模型入门教程:从零开始理解ChatGPT背后的技术本文面向对 AI 感兴趣但没有深厚技术背景的读者,带你用最直观的方式理解大语言模型(LLM)的工作原理、使用方法以及实际应用场景。
CoderJia程序员甲3 天前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-09)生成于:2026-04-09共发现热门项目: 11 个榜单类型:日榜Token赞助:siliconflow