ai大模型

ShiMetaPi9 天前
resnet·ai大模型·大模型部署·bm1684x·图片ai
【ShiMetaPi】边缘计算高并发视频流AI分析应用:BM1684X算力盒子上的ResNet部署指南深度神经网络(DNN)的性能通常随网络层数增加而提升,但当层数超过一定阈值时,会出现 “退化问题”(Degradation Problem):网络准确率饱和甚至下降,并非由于过拟合或梯度消失 / 爆炸,而是深层网络难以优化。
minhuan11 天前
人工智能·语言模型·自然语言处理·bert·ai大模型·rag
构建AI智能体:二十八、大语言模型BERT:原理、应用结合日常场景实践全面解析BERT(Bidirectional Encoder Representations from Transformers)是谷歌在2018年发布的自然语言处理模型,它彻底改变了NLP领域的发展轨迹。在BERT出现之前,主流模型如Word2Vec只能提供静态的词向量表示,这些方法虽然解决了词汇的分布式表示问题,但无法处理一词多义和复杂的上下文信息。例如,"苹果"这个词在不同语境中既可能指水果,也可能指科技公司,传统模型无法区分这种差异。
算家云13 天前
人工智能·谷歌·ai大模型·算家云·ai生图·租算力,到算家云·nano banana 提示词
nano banana官方最强Prompt模板来了!六大场景模板详解最近,相信大家的朋友圈和社交媒体都被一个叫nano banana的AI图像生成工具刷屏了。从精致的手办模型到名画人物穿越,再到中土世界场景还原,nano banana已然成为了最火爆的“整活工具之一。
爱喝白开水a17 天前
人工智能·深度学习·学习·ai·大模型·编程·ai大模型
从零开始学无监督学习:图像混合与标签平滑技术详解,收藏不走丢文章介绍提升无监督学习性能的方法,结合图像混合和标签平滑技术。标签平滑可防模型过度自信,平滑决策边界;图像混合包括全局混合和区域混合(带背景衰减),能使输出特征更平滑。实验表明,增加训练轮数能显著提升准确率,效果甚至优于图像混合方法,有效提高模型性能和迁移能力。
AIGC安琪18 天前
人工智能·学习·ai·语言模型·大模型·llm·ai大模型
字节跳动把AI大模型入门知识点整理成手册了,高清PDF开放下载大家好,作为一名互联网行业的从业者,我发现AI大模型正在成为技术领域的新热点。就像Python曾经凭借其简洁高效成为编程入门首选一样,AI大模型如今也以其强大的能力和广泛的应用前景吸引着越来越多的学习者。今天我想分享一份全面的AI大模型学习路线图,希望能帮助大家系统性地掌握这一前沿技术。
CodeCraft Studio23 天前
开发语言·c#·powerpoint·markdown·ppt·aspose·ai大模型
PPT处理控件Aspose.Slides教程:在 C# 中将 PPTX 转换为 Markdown将您的PowerPoint幻灯片转换为Markdown格式,使其兼容 AI 技术。在这个人工智能驱动的时代,GPT和Claude等大模型能够读取和生成基于 Markdown 的内容。此外,Markdown 还可用于博客文章和文档。因此,作为一名 .NET 开发人员,如果您希望自动化 PPTX 到 MD 的转换,Aspose.Slides for .NET就是不错的选择。这款 SDK 提供了一系列功能,支持您使用 C# 以编程方式将 PPTX 转换为 Markdown。它是一款开发者友好的 SDK,可以为您
TGITCIC24 天前
人工智能·ai大模型·ai agent·ai智能体·企业ai·大模型ai·企业大模型
RAG概念被误用:AI应用落地需回归上下文工程本质在生成式AI爆发式发展的当下,"RAG"(Retrieval-Augmented Generation)作为技术热词频繁出现在行业讨论中。这个将检索与生成简单组合的概念,被普遍视为大模型落地的标准方案。但Chroma创始人Jeff Huber在Latent Space播客中的犀利观点,犹如一记警钟:RAG本质上是误导性的概念包装,其模糊的工程边界正在阻碍AI应用的深度发展。
martian6651 个月前
人工智能·docker·分类·ai大模型·hugging face
大模型部署:AI大模型在医学影像分类中的ONNX、TensorRT和Docker应用🧑 博主简介:CSDN博客专家、CSDN平台优质创作者,高级开发工程师,数学专业,10年以上C/C++, C#,Java等多种编程语言开发经验,拥有高级工程师证书;擅长C/C++、C#等开发语言,熟悉Java常用开发技术,能熟练应用常用数据库SQL server,Oracle,mysql,postgresql等进行开发应用,熟悉DICOM医学影像及DICOM协议,业余时间自学JavaScript,Vue,qt,python等,具备多种混合语言开发能力。撰写博客分享知识,致力于帮助编程爱好者共同进步。欢迎
浩瀚蓝天dep1 个月前
ai大模型·ollama·deepseek
使用Ollama部署自己的本地模型服务器版本:CentOS10Ollama版本:v0.11.6官网地址:Ollama Search 搜索需要的模型,这里以deepseek-r1为例
kkcodeer1 个月前
人工智能·prompt·ai大模型
大模型Prompt原理、编写原则与技巧以及衡量方法大语言模型(LLM,如 GPT 系列)在处理 Prompt 时,首先会将输入文本转换为一系列词向量。接着,模型通过自回归生成的方式逐词预测输出。在生成每个词时,模型都会参考输入的 Prompt以及此前已生成的词。这一过程不断迭代,直到生成完整的回答或达到最大长度限制。
AIGC安琪1 个月前
人工智能·深度学习·ai·语言模型·大模型·transformer·ai大模型
Transformer中的编码器和解码器是什么?今天,我们来具体介绍Transformer的架构设计。一个完整的Transformer模型就像一个高效的语言处理工厂,主要由两大车间组成:编码车间和解码车间。
TGITCIC1 个月前
人工智能·ai大模型·ai智能体·ai搜索·大模型ai·deepsearch·ai search
AI Search进化论:从RAG到DeepSearch的智能体演变全过程在AI技术狂飙突进的今天,大模型的"知识幻觉"始终是悬在头顶的达摩克利斯之剑。斯坦福大学研究显示,GPT-4对2023年后知识的准确率骤降至62%。这种知识时效性危机催生了检索增强生成(RAG)技术,但传统RAG的机械流程已难以应对复杂任务。随着推理模型和工具调用能力的突破,AI Search正经历从"检索工具"到"自主智能体"的质变。本文将带您穿越技术演进的三个关键阶段,解密DeepSearch如何突破知识边界与能力边界,揭示智能体自主性背后的技术密码。通过对比Jina AI、Google Gemini
TGITCIC1 个月前
人工智能·智能客服·ai大模型·大模型落地·ai落地·大模型ai·rag增强检索
从依赖到自研:一个客服系统NLP能力的跃迁之路2015年在某平台上线初期,智能客服系统即采用行业通用的第三方NLP解决方案。在随后的八年发展历程中,系统虽历经三次重大版本迭代,但始终未能突破核心语义识别能力的外部依赖。这种依赖带来了三重困境:定制化需求响应滞后导致业务适配性不足,数据安全边界模糊引发合规风险,持续增长的调用成本挤压运营空间。随着平台交易规模突破千亿,日均咨询量超过50万次,传统模式已难以支撑精细化服务需求。
martian6651 个月前
人工智能·ai大模型·医学影像·影像大模型·肺结节
AI大模型实践项目:医学影像分类器(肺结节检测)🧑 博主简介:CSDN博客专家、CSDN平台优质创作者,高级开发工程师,数学专业,10年以上C/C++, C#,Java等多种编程语言开发经验,拥有高级工程师证书;擅长C/C++、C#等开发语言,熟悉Java常用开发技术,能熟练应用常用数据库SQL server,Oracle,mysql,postgresql等进行开发应用,熟悉DICOM医学影像及DICOM协议,业余时间自学JavaScript,Vue,qt,python等,具备多种混合语言开发能力。撰写博客分享知识,致力于帮助编程爱好者共同进步。欢迎
大数据在线1 个月前
人工智能·亚信科技·ai大模型·ai大模型交付·ai大模型交付与应用
押注AI大模型交付业务,亚信科技构建战略支点旧的范式发生变迁,新的力量随之破土而出。当大模型、生成式AI等技术快速崛起,经济周期波动与行业结构性调整又接踵而至之际,信息科技业所面临的不仅是一次关乎生存与发展的技术变革,更迎来一场影响深远的产业范式重塑。
一包烟电脑面前做一天1 个月前
.net·向量数据库·ai大模型·rag·ollama·qdrant·文本分块
RAG实现:.Net + Ollama + Qdrant 实现文本向量化,实现简单RAG本文使用.Net + Ollama + 向量数据库Qdrant,实现简单RAG,代码仅实现基本演示功能。
一包烟电脑面前做一天1 个月前
.net·ai大模型·ollama·mcp·mcp服务端
MCP实现:.Net实现MCP服务端 + Ollama ,MCP服务端工具调用本文使用.Net编写MCP服务端 + Ollama ,实现简单MCP调用,代码仅实现基本演示功能。请移步:https://blog.csdn.net/MrTraum/article/details/139240885
大数据在线2 个月前
ai大模型·ai-native·智能体·数智化转型·超聚变
超聚变:智能体时代,AI原生重构城企数智化基因2025 世界人工智能大会(WAIC)世博展览馆内,超聚变展台前人头攒动,其展示的AI落地全栈解决方案及上百个AI应用场景吸引了众多参观者驻足观看。
没事学AI2 个月前
ai大模型
DeepSeek-R1详解咱把这张 DeepSeek-R1 的架构图拆成几块唠,保证小白也能听懂!就当是带着大家“逛” 模型从训练到能用的 “流水线工厂”,每个模块是干啥的、数据咋流动,一一说清楚~
没事学AI2 个月前
ai大模型
LangChain 架构入门指南LangChain 是一个强大的框架,它能帮助开发者轻松地利用大型语言模型(LLMs)来构建各种智能应用。就好比搭积木,LangChain 把开发智能应用所需的各种功能模块都准备好了,你只要按照自己的想法把这些 “积木” 组合起来,就能搭建出独特的应用。它的官方 GitHub 地址为:https://github.com/langchain-ai/langchain ,在这个仓库里,你能找到丰富的代码示例、文档以及社区贡献的各种资源。