大模型

山顶夕景10 小时前
大模型·强化学习·dapo·vapo
【RL】DAPO的后续:VAPO算法VAPO: Efficient and Reliable Reinforcement Learning for Advanced Reasoning Tasks
viperrrrrrrrrr718 小时前
langchain·大模型·agent·rag
Agent向量存储中的记忆衰退与记忆过载解决方案🍋🍋大数据学习🍋🍋🔥系列专栏: 👑哲学语录: 用力所能及,改变世界。 💖如果觉得博主的文章还不错的话,请点赞👍+收藏⭐️+留言📝支持一下博主哦🤞
CoderJia程序员甲19 小时前
ai·开源·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2025-10-18)生成于:2025-10-18共发现热门项目:17 个榜单类型:日榜本期GitHub热榜呈现出人工智能与大模型技术的强劲发展态势,miniGPT的2小时快速训练方案和nanoGPT的简化实现展现了AI民主化趋势,而PaddleOCR的多语言文档识别能力突出了OCR与LLM结合的应用价值。跨平台技术持续升温,Rust+Vue3构建的即时通讯应用HuLa、纯Python的Web开发框架Reflex以及跨平台终端WaveTerm体现了开发者对一致性用户体验的追求。容器化和虚拟化技术日趋成熟,Docker中运行Wi
测试开发技术1 天前
人工智能·ai·大模型·prompt
什么样的 prompt 是好的 prompt?一个好的 prompt 应该是清晰、有条理,并提供足够的上下文信息,使得人工智能模型能够准确理解并生成预期的答案。关键要素包括明确的要求、具体的情境和期望的输出格式。
小新学习屋1 天前
大模型·智能体
大模型-智能体-【篇一:单智能体框架】本文介绍几种单智能体框架,重点关注单个智能体的能力。Transformers(2023年,Huggingface):引入Transformers-Agents。功能:模型解释指令并相应地生成代码片段,支持各种开源和专有模型
小新学习屋1 天前
大模型·多智能体
大模型-智能体-【篇二:多智能体框架】本文介绍几种多智能体框架,强调多个智能体之间的协作:AutoGen(2023)提供了一个通用的基础设施,允许开发者使用自然语言和代码编程交互模式。这个框架通过促进可定制的智能体之间的对话,可以利用各种 LLMs、人类输入和工具的组合,从而促进了多样化应用程序的开发。
居7然1 天前
人工智能·分布式·架构·大模型·transformer
DeepSeek-7B-chat 4bits量化 QLora 微调本文较长,建议点赞收藏,以免遗失。更多AI大模型开发 学习视频/籽料/面试题 都在这>>Github<< >>Gitee<<
OpenCSG2 天前
人工智能·ai·开源·大模型·支付安全
【活动预告】2025斗拱开发者大会,共探支付与AI未来当 10 月 24 日 —— 这个专属程序员的节日如约而至,这份“用代码改变世界”的热爱,将被赋予更特别的意义。
万俟淋曦2 天前
人工智能·ai·机器人·大模型·论文·robotics·具身智能
【论文速递】2025年第28周(Jul-06-12)(Robotics/Embodied AI/LLM)中文使用 googletrans 翻译,翻译不对的地方以英文为准We introduce a full-stack framework that scales up reasoning in vision-language models (VLMs) to long videos, leveraging reinforcement learning. We address the unique challenges of long video reasoning by integrating three
梵得儿SHI2 天前
大模型·prompt·交互·提示词·对话·大模型提问艺术·极简指令
Prompt Engineering 核心知识:从基础模式到思维链,掌握大模型高效交互秘籍在大模型时代,"问对问题" 的能力比以往任何时候都更重要。同样的模型,用不同的提示词(Prompt)提问,得到的结果可能天差地别 —— 这就是 Prompt Engineering(提示词工程)的价值。本文将系统拆解 Prompt 编写的核心模式,从基础的 Zero-Shot 到进阶的思维链(CoT),再到灵活的角色扮演,帮你掌握与大模型高效对话的 "底层逻辑"。
hzp6662 天前
人工智能·深度学习·机器学习·大模型·llm·数据湖·大数据存储
Magnus:面向大规模机器学习工作负载的综合数据管理方法Magnus,一个专为解决大规模机器学习(ML)工作负载中数据管理挑战而设计的综合性系统。针对传统数据湖表格式(如Iceberg)在处理海量数据、多模态数据、频繁更新和大模型训练时面临的存储效率低、元数据开销大、读写性能差等问题,Magnus提出了多项创新。其核心包括:为宽表和多模态数据设计的高效Krypton和Blob存储格式;通过消除冗余和索引优化来提升元数据管理效率;支持列级更新和主键Upsert的轻量级MOR机制;以及为大型语言模型(LLM)和长序列推荐模型(LRM) 训练优化的双表设计和分片机制
尽兴-3 天前
macos·ai·chatgpt·大模型·ollama·私有化
【10 分钟!M4 Mac mini 离线部署「私有 ChatGPT」完整实录】(支持上传文件 / 图片 / 代码高亮,全程 4 命令 3 点击)2025 年,开源大模型已卷到 8B 就能打 GPT-3.5。 手里这台 M4 Mac mini(24 GB + 512 GB)空着也是吃灰,不如 10 分钟搭一个「离线 ChatGPT」:
桃子叔叔3 天前
人工智能·大模型·多模态
从0到1讲解大模型中的关键步骤(一)分词、词性标注、命名实体识别分词是将连续的文本序列切分成有意义的词汇单元的过程,是自然语言处理的基础步骤。最大正向匹配 (Maximum Forward Matching)
搞科研的小刘选手3 天前
人工智能·物联网·大模型·智慧城市·数据科学·ai驱动·计算科学
【大会邀请】2025年AI驱动下:业务转型和数据科学创新国际学术会议(ICBTDS 2025)2025年AI驱动下:业务转型和数据科学创新国际学术会议(ICBTDS 2025)2025 International conference on AI-Driven Business Transformation and Data Science Innovation
sight-ai4 天前
人工智能·开源·大模型·api
超越基础:SightAI 智能路由与多模型选择实战在第一周的入门指南中,我们已经学会了如何使用 SightAI 的基础 API 调用,实现了一个简单的对话交互。不少开发者会面临新的需求:想降低推理成本时,如何找到性价比更高的模型?追求交互速度时,怎样获取更快的响应?需要特定能力(如 Claude 的长文本处理)时,又该如何精准对接?这些问题的答案,就藏在 SightAI 的智能路由机制与多模型灵活调用能力中。本文将带大家跳出基础调用框架,深入实战智能路由配置、流式传输与函数调用,让 SightAI 更好地适配复杂业务场景。
喜欢吃豆4 天前
人工智能·语言模型·自然语言处理·大模型·强化学习
一份关于语言模型对齐的技术论述:从基于PPO的RLHF到直接偏好优化本部分旨在为大型语言模型(LLM)的对齐工作奠定概念基础,阐述其必要性,并概述构成后续更高级技术基础的经典三阶段流程。
CoderJia程序员甲4 天前
ai·开源·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2025-10-15)生成于:2025-10-15共发现热门项目:15 个榜单类型:日榜本期GitHub热榜集中反映了AI智能体和提示工程的持续升温趋势。以Anthropic的交互式Prompt教程、dair-ai的《Prompt Engineering Guide》和阿里巴巴的Spring AI框架为代表,表明“Agent化”和“提示优化”成为AI研发核心方向。同时,MinerU、Happy-LLM等项目推动大模型实践落地,强调从数据预处理到模型部署的全链路效率。开源社区在AI安全与透明领域也表现活跃,如System Pro
nueroamazing5 天前
vue.js·python·语言模型·flask·大模型·项目·ppt
PPT-EA:PPT自动生成器PS:给大家写个博客吧,这博客好久没写了,好多年没写了。谢谢谢谢一直没来得及更新,PPT-EA是之前做的一个小项目,主要是想简化PPT生成的流程,其实现在有很多平台可以使用,例如KIMI等,他们的PPT效果也挺好的,但是相对来说开源的相关项目还是比较少的,所以之前是做了这么一个工作,想把这套流程自己实现以下。
CoderJia程序员甲5 天前
ai·开源·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2025-10-14)生成于:2025-10-14共发现热门项目:15 个榜单类型:日榜本期GitHub热榜彰显"AI原生开发"全面爆发:Prompt工程正式走向主流,Anthropic的交互式教程与系统提示泄露集合项目反映开发者对提示优化的强烈需求;AI智能体生态蓬勃发展,claude-code终端编程助手、Klavis的MCP工具集成平台、Archon任务管理系统展现从单点工具向完整开发环境演进;底层性能优化持续受关注,llama.cpp推进C++大模型推理、Bun的Zig技术栈与Cubyz游戏引擎体现高性能语言崛起;同时
王者鳜錸5 天前
开源·大模型·录音文件转文字·角色自动定位
科大讯飞【免费】的开源模型实现录音转写与角色判定在智能客服、语音分析等场景中,我们经常需要从对话记录中自动识别不同说话者的身份角色。本文将介绍如何利用大语言模型(LLM)实现对话人身份判定,将原始的Speaker标识转换为具体的业务角色。