llm

win4r1 小时前
llm·aigc·openai
🚀重磅开源!本地部署1.7B参数超强OCR大模型dots.ocr!超越GPT-4o和olmOCR!结构化精准提取复杂PDF扫描件!完美识别中英文文档、模糊扫描dots.ocr是小红书团队开源的一个多语言文档解析神器。它能干什么呢?给它一张包含文字、表格、公式的复杂文档图片,它就能准确地告诉你每个元素在哪里、是什么类型、里面写的什么内容,甚至还能保持人类阅读的逻辑顺序。
测试者家园3 小时前
人工智能·llm·性能测试·ai赋能·智能化测试
用 LLM 辅助性能测试报告生成性能测试是软件生命周期中的关键环节,其质量直接关系到系统上线后的可用性与稳定性。而性能测试报告,作为承载测试结论、问题分析与优化建议的核心输出,决定了性能评估的专业性与决策价值。
GetcharZp12 小时前
人工智能·llm·deepseek
爆肝整理!带你快速上手LangChain,轻松集成DeepSeek,打造自己的AI应用还在惊叹大模型?不如用LangChain+DeepSeek亲手打造更强大的AI应用!本文从核心概念、使用方法、竞品对比到快速上手,附带简易版RAG,一文讲透,小白也能看懂。
GeeJoe13 小时前
人工智能·机器学习·llm
凡人炼丹传之 · 我让 AI 帮我训练了一个 AI修仙路漫漫,炼丹不易,唯有借助仙师指点,方能事半功倍。在这个 AI 技术日新月异的时代,作为一个机器学习领域的"凡人",我却接到了一个颇具挑战的任务:开发一个能在用户输入文本时实时识别文本实体的功能。简单来说,就是当用户输入"我是一只小猪"这样的文字时,系统能够立刻识别出"小猪"是一个实体词。 这种任务交给大模型处理自然不在话下,但产品对性能提出了苛刻要求:实时性高,准确率高。这意味着我需要训练一个能在移动端本地运行的模型,而不是依赖云端 API。 就这样,我这个从未接触过模型训练的"凡人",踏上了 AI
bastgia13 小时前
人工智能·llm
Transformer终结者?Google DeepMind新架构实现2倍推理速度和一半内存占用随着大语言模型规模的不断扩大,我们似乎已经习惯了一个发展模式:更大的模型、更多的参数、更强的性能。然而,这种"暴力美学"正在遭遇瓶颈。最近,Google DeepMind联合KAIST AI和Mila发布的一篇论文为我们展示了另一种可能性。
计算机科研圈19 小时前
人工智能·深度学习·机器学习·llm·ai编程
不靠海量数据,精准喂养大模型!上交Data Whisperer:免训练数据选择法,10%数据逼近全量效果从未微调目标数据集,一个预训练模型竟能自己筛选出「黄金训练样本」?上海交通大学等团队提出 Data Whisperer —— 首个免训练的注意力驱动数据选择框架。它直接利用预训练模型的上下文学习(ICL)能力,无需额外微调打分模型,仅用 10% 数据就能让微调效果逼近全量数据!
袁庭新1 天前
人工智能·llm·deepseek
大模型本地部署3种方式大家好,我是袁庭新。为什么要将大模型部署到本地呢?如果特别注重数据安全与资源可控性,可以将DeepSeek部署在本地,实现数据闭环管理,有效避免敏感信息外泄,这样的要求在金融、医疗等高合规性要求行业中普遍存在。
小小小小小鹿1 天前
人工智能·llm
Ai入门-结合rag搭建一个专属的ai学习助手在前面的文章中我们了解了 提示词和工具的调用。今天我们来了解一下 rag。rag 全称Retrieval Augmented Generation 即检索增强生成,通过本地知识与问题的结合让大模型生成更好的答案。整个rag包含的知识如下
三桥君1 天前
人工智能·llm·产品经理
AI驱动的智能设备健康评估系统究竟如何应对企业运维挑战?你好,我是✨三桥君✨ 助你迈向AGI时代!!!在数字化浪潮下,企业运维正面临前所未有的挑战。传统的巡检制度和点表记录已经无法满足现代企业的需求。随着设备数量和复杂性的增加,企业亟需一种更加智能、高效的运维方式。AI驱动的智能设备健康评估系统应运而生,它不仅能够定期主动评估设备健康状态,还能提前预警潜在故障,从而实现从“事后维护”到“预测性运维”的转变。
Blessed_Li2 天前
docker·ai·llm·milvus·dify
【dify+milvus避坑指南】将向量库milvus集成给dify作为知识库milvus v2.5.6 dify v1.6.0 Attu v2.5.0如果如上图一样,milvus库中可以自动生成collection,那就成功了!
冥想的小星星2 天前
安全·llm
Prevent Prompt Injection随着大语言模型(LLM)在聊天机器人、搜索引擎、代码生成器以及企业自动化等领域的广泛应用,Prompt Injection(提示词注入)攻击正日益成为影响系统安全与可控性的核心威胁。
数据智能老司机2 天前
架构·llm·aigc
让流浪汉都能学会的大模型教程——用大语言模型设计解决方案本章你将看到这些实用干货:前情回顾:你已经掌握了大模型的基本功到现在为止,你应该已经对 LLM 有了比较“像回事儿”的理解了:
聚客AI2 天前
人工智能·llm·agent
⚡工程师的AGI落地指南:从基础概念到智能体开发的完整地图本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。在人工智能的浪潮中,大型语言模型(LLM)已成为推动产业变革的核心引擎。作为AI应用开发工程师,理解大模型的内在机制和开发范式至关重要。本文将从零开始,系统拆解LLM的核心技术栈,结合工程实践案例,助您掌握从模型选型到部署优化的全流程。无论您是初学者还是资深开发者,都能从中获得实战洞见。
深度学习机器2 天前
人工智能·llm·agent
GLM-4.5系列模型导读,综合能力更强的高性价比模型在沉寂了半年之后,智谱推出了新一代开源模型GLM-4.5系列,采用MOE架构并使用混合推理模式。模型统一提升了在推理、代码与智能体等多方面的能力,专为复杂智能体应用打造。由于官方的技术报告暂未发布,模型细节暂时无从得知,本文内容仅做导读,方便读者对该系列模型有个初步认识。
数据智能老司机2 天前
架构·llm·aigc
让流浪汉都能学会的大模型教程——关于大模型的误解、局限和惊人本事本章要聊的事:感谢 ChatGPT 的横空出世,现在全世界都知道“大模型”这玩意儿有多牛了。不过,知道是一回事,误解也是一大堆。
阿里云云原生2 天前
云原生·llm
企业AI落地实践(三):使用 AI 网关解决 AI Agent 与 LLM 的交互挑战作者:计缘从上一篇内容开始,我们开始具体分析 AI 应用实践过程中每一个环节的核心挑战,以及我们对应的解法和思路。
字节跳动安全中心2 天前
安全·llm·agent
AI时代身份验证 | 智能体身份和访问控制思考随着AI大模型在各行各业的应用,智能体将作为AI终端参与到数字生活中,身份认证作为核心安全问题,对于智能体来说也不例外,需要一套完善的身份系统来确保智能体之间安全、高效的交互。在本文中,火山引擎云安全团队将分享当前对智能体的身份分析及我们所做的一些访问控制的实践。
Jacob02342 天前
前端·llm·ai编程
UI 代码不写也行?我用 MCP Server 和 ShadCN 自动生成前端界面最近我在尝试一套非常实用的 AI + UI 开发流程,彻底改变了我写界面的方式。以往写 UI,动手敲代码很累,修改也费时。而这次,借助一个叫 MCP Server 的工具,配合 AI 辅助,让 AI 理解组件用法、结构,直接帮我生成高质量的界面代码。
AI大模型2 天前
java·程序员·llm
35岁程序员的出路:AI赛道疯狂抢人,年薪百万不是梦本文较长,建议点赞收藏,以免遗失。更多AI大模型开发 学习视频/籽料/面试题 都在这>>Github<<
AI大模型2 天前
java·程序员·llm
Java程序员转型大模型应用开发:掌握这12步就够了!本文较长,建议点赞收藏,以免遗失。更多AI大模型开发 学习视频/籽料/面试题 都在这>>Github<<