ai大模型

TGITCIC14 天前
人工智能·开源·多模态·ai大模型·开源大模型·视觉模型·大模型ai
LLaVA-OV:开源多模态的“可复现”革命,不只是又一个模型在大模型狂飙突进的今天,开源社区似乎陷入一种奇特的悖论:模型权重免费公开,但真正能复现结果的人寥寥无几。你下载一个号称“SOTA”的多模态模型,跑起来却发现效果平平;想自己训练?数据来源模糊、训练脚本缺失、超参配置像谜语——开源成了“半开源”,复现成了玄学。这种困境,在视觉语言模型(VLM)领域尤为突出。
TGITCIC17 天前
人工智能·深度学习·神经网络·ai大模型·模型训练·训练模型·手搓模型
有趣的机器学习-利用神经网络来模拟“古龙”写作风格的输出器在探索大模型落地应用的旅程中,我们常常聚焦于其解决严肃商业问题的解决方案、策略,如:优化客服、生成报告、辅助决策……这些固然重要,但技术的魅力远不止于此。有时,跳出“实用主义”的框架,用一点“玩心”去触碰技术的边界,反而能更深刻地理解其内核。
FunTester1 个月前
自动化测试·语言模型·ai大模型·自然语言·使用指南·browse_use
以自然语言实现AI自动化Browser-use 详细介绍与使用指南Browser-use 是一款基于 Python 的开源 AI 自动化工具,旨在通过集成大型语言模型(LLM)与浏览器自动化技术,让 AI 智能体具备“浏览网页、抓取信息、动态交互”的能力。只需简单配置与少量代码,即可快速构建浏览器自动化智能体,广泛适用于数据采集、网页测试、自动化任务执行等场景。目前项目在 GitHub 已获得 45.1K Stars,是智能体应用开发领域的热门工具。
ShiMetaPi2 个月前
resnet·ai大模型·大模型部署·bm1684x·图片ai
【ShiMetaPi】边缘计算高并发视频流AI分析应用:BM1684X算力盒子上的ResNet部署指南深度神经网络(DNN)的性能通常随网络层数增加而提升,但当层数超过一定阈值时,会出现 “退化问题”(Degradation Problem):网络准确率饱和甚至下降,并非由于过拟合或梯度消失 / 爆炸,而是深层网络难以优化。
minhuan2 个月前
人工智能·语言模型·自然语言处理·bert·ai大模型·rag
构建AI智能体:二十八、大语言模型BERT:原理、应用结合日常场景实践全面解析BERT(Bidirectional Encoder Representations from Transformers)是谷歌在2018年发布的自然语言处理模型,它彻底改变了NLP领域的发展轨迹。在BERT出现之前,主流模型如Word2Vec只能提供静态的词向量表示,这些方法虽然解决了词汇的分布式表示问题,但无法处理一词多义和复杂的上下文信息。例如,"苹果"这个词在不同语境中既可能指水果,也可能指科技公司,传统模型无法区分这种差异。
算家云2 个月前
人工智能·谷歌·ai大模型·算家云·ai生图·租算力,到算家云·nano banana 提示词
nano banana官方最强Prompt模板来了!六大场景模板详解最近,相信大家的朋友圈和社交媒体都被一个叫nano banana的AI图像生成工具刷屏了。从精致的手办模型到名画人物穿越,再到中土世界场景还原,nano banana已然成为了最火爆的“整活工具之一。
爱喝白开水a2 个月前
人工智能·深度学习·学习·ai·大模型·编程·ai大模型
从零开始学无监督学习:图像混合与标签平滑技术详解,收藏不走丢文章介绍提升无监督学习性能的方法,结合图像混合和标签平滑技术。标签平滑可防模型过度自信,平滑决策边界;图像混合包括全局混合和区域混合(带背景衰减),能使输出特征更平滑。实验表明,增加训练轮数能显著提升准确率,效果甚至优于图像混合方法,有效提高模型性能和迁移能力。
AIGC安琪2 个月前
人工智能·学习·ai·语言模型·大模型·llm·ai大模型
字节跳动把AI大模型入门知识点整理成手册了,高清PDF开放下载大家好,作为一名互联网行业的从业者,我发现AI大模型正在成为技术领域的新热点。就像Python曾经凭借其简洁高效成为编程入门首选一样,AI大模型如今也以其强大的能力和广泛的应用前景吸引着越来越多的学习者。今天我想分享一份全面的AI大模型学习路线图,希望能帮助大家系统性地掌握这一前沿技术。
CodeCraft Studio2 个月前
开发语言·c#·powerpoint·markdown·ppt·aspose·ai大模型
PPT处理控件Aspose.Slides教程:在 C# 中将 PPTX 转换为 Markdown将您的PowerPoint幻灯片转换为Markdown格式,使其兼容 AI 技术。在这个人工智能驱动的时代,GPT和Claude等大模型能够读取和生成基于 Markdown 的内容。此外,Markdown 还可用于博客文章和文档。因此,作为一名 .NET 开发人员,如果您希望自动化 PPTX 到 MD 的转换,Aspose.Slides for .NET就是不错的选择。这款 SDK 提供了一系列功能,支持您使用 C# 以编程方式将 PPTX 转换为 Markdown。它是一款开发者友好的 SDK,可以为您
TGITCIC2 个月前
人工智能·ai大模型·ai agent·ai智能体·企业ai·大模型ai·企业大模型
RAG概念被误用:AI应用落地需回归上下文工程本质在生成式AI爆发式发展的当下,"RAG"(Retrieval-Augmented Generation)作为技术热词频繁出现在行业讨论中。这个将检索与生成简单组合的概念,被普遍视为大模型落地的标准方案。但Chroma创始人Jeff Huber在Latent Space播客中的犀利观点,犹如一记警钟:RAG本质上是误导性的概念包装,其模糊的工程边界正在阻碍AI应用的深度发展。
martian6652 个月前
人工智能·docker·分类·ai大模型·hugging face
大模型部署:AI大模型在医学影像分类中的ONNX、TensorRT和Docker应用🧑 博主简介:CSDN博客专家、CSDN平台优质创作者,高级开发工程师,数学专业,10年以上C/C++, C#,Java等多种编程语言开发经验,拥有高级工程师证书;擅长C/C++、C#等开发语言,熟悉Java常用开发技术,能熟练应用常用数据库SQL server,Oracle,mysql,postgresql等进行开发应用,熟悉DICOM医学影像及DICOM协议,业余时间自学JavaScript,Vue,qt,python等,具备多种混合语言开发能力。撰写博客分享知识,致力于帮助编程爱好者共同进步。欢迎
浩瀚蓝天dep2 个月前
ai大模型·ollama·deepseek
使用Ollama部署自己的本地模型服务器版本:CentOS10Ollama版本:v0.11.6官网地址:Ollama Search 搜索需要的模型,这里以deepseek-r1为例
kkcodeer2 个月前
人工智能·prompt·ai大模型
大模型Prompt原理、编写原则与技巧以及衡量方法大语言模型(LLM,如 GPT 系列)在处理 Prompt 时,首先会将输入文本转换为一系列词向量。接着,模型通过自回归生成的方式逐词预测输出。在生成每个词时,模型都会参考输入的 Prompt以及此前已生成的词。这一过程不断迭代,直到生成完整的回答或达到最大长度限制。
AIGC安琪2 个月前
人工智能·深度学习·ai·语言模型·大模型·transformer·ai大模型
Transformer中的编码器和解码器是什么?今天,我们来具体介绍Transformer的架构设计。一个完整的Transformer模型就像一个高效的语言处理工厂,主要由两大车间组成:编码车间和解码车间。
TGITCIC2 个月前
人工智能·ai大模型·ai智能体·ai搜索·大模型ai·deepsearch·ai search
AI Search进化论:从RAG到DeepSearch的智能体演变全过程在AI技术狂飙突进的今天,大模型的"知识幻觉"始终是悬在头顶的达摩克利斯之剑。斯坦福大学研究显示,GPT-4对2023年后知识的准确率骤降至62%。这种知识时效性危机催生了检索增强生成(RAG)技术,但传统RAG的机械流程已难以应对复杂任务。随着推理模型和工具调用能力的突破,AI Search正经历从"检索工具"到"自主智能体"的质变。本文将带您穿越技术演进的三个关键阶段,解密DeepSearch如何突破知识边界与能力边界,揭示智能体自主性背后的技术密码。通过对比Jina AI、Google Gemini
TGITCIC3 个月前
人工智能·智能客服·ai大模型·大模型落地·ai落地·大模型ai·rag增强检索
从依赖到自研:一个客服系统NLP能力的跃迁之路2015年在某平台上线初期,智能客服系统即采用行业通用的第三方NLP解决方案。在随后的八年发展历程中,系统虽历经三次重大版本迭代,但始终未能突破核心语义识别能力的外部依赖。这种依赖带来了三重困境:定制化需求响应滞后导致业务适配性不足,数据安全边界模糊引发合规风险,持续增长的调用成本挤压运营空间。随着平台交易规模突破千亿,日均咨询量超过50万次,传统模式已难以支撑精细化服务需求。
martian6653 个月前
人工智能·ai大模型·医学影像·影像大模型·肺结节
AI大模型实践项目:医学影像分类器(肺结节检测)🧑 博主简介:CSDN博客专家、CSDN平台优质创作者,高级开发工程师,数学专业,10年以上C/C++, C#,Java等多种编程语言开发经验,拥有高级工程师证书;擅长C/C++、C#等开发语言,熟悉Java常用开发技术,能熟练应用常用数据库SQL server,Oracle,mysql,postgresql等进行开发应用,熟悉DICOM医学影像及DICOM协议,业余时间自学JavaScript,Vue,qt,python等,具备多种混合语言开发能力。撰写博客分享知识,致力于帮助编程爱好者共同进步。欢迎
大数据在线3 个月前
人工智能·亚信科技·ai大模型·ai大模型交付·ai大模型交付与应用
押注AI大模型交付业务,亚信科技构建战略支点旧的范式发生变迁,新的力量随之破土而出。当大模型、生成式AI等技术快速崛起,经济周期波动与行业结构性调整又接踵而至之际,信息科技业所面临的不仅是一次关乎生存与发展的技术变革,更迎来一场影响深远的产业范式重塑。
一包烟电脑面前做一天3 个月前
.net·向量数据库·ai大模型·rag·ollama·qdrant·文本分块
RAG实现:.Net + Ollama + Qdrant 实现文本向量化,实现简单RAG本文使用.Net + Ollama + 向量数据库Qdrant,实现简单RAG,代码仅实现基本演示功能。
一包烟电脑面前做一天3 个月前
.net·ai大模型·ollama·mcp·mcp服务端
MCP实现:.Net实现MCP服务端 + Ollama ,MCP服务端工具调用本文使用.Net编写MCP服务端 + Ollama ,实现简单MCP调用,代码仅实现基本演示功能。请移步:https://blog.csdn.net/MrTraum/article/details/139240885