ai大模型

请叫我啊腻3 小时前
google·ai大模型·nanobanana·aiapi·nanobananapro·gemini3.
全网都在找的Nano Banana Pro API 来了!便宜稳定0.15/张
only-code6 天前
人工智能·ai大模型·论文解读·ai检测·文本检测
Provable Robust Watermarking for AI-Generated Text:给大模型文字“打上隐形指纹”- 标题:Provable Robust Watermarking for AI-Generated Text - 作者:Xuandong Zhao, Prabhanjan Ananth, Lei Li, Yu-Xiang Wang - 机构:UC Santa Barbara - 年份:2023(arXiv:2306.17439v2) - 研究方向:大语言模型(LLM)、文本水印、鲁棒检测、理论保证、对抗攻击 - 核心方法名词:Unigram-Watermark、K-gram watermark、gree
TGITCIC9 天前
人工智能·大模型·prompt·提示词·ai大模型·大模型ai·上下文工程
User Prompt 与 System Prompt:大模型沟通的“双引擎”机制深度拆解在企业推进大模型落地的过程中,一个高频出现的困惑是:“模型能力明明很强,为什么我用起来总是差一口气?”很多团队把问题归咎于模型选型、算力不足或数据质量,却忽略了最基础也最关键的环节——人与模型之间的沟通方式。提示词工程(Prompt Engineering)正是解决这一断层的核心桥梁。它不是玄学,也不是堆砌华丽辞藻,而是一套可学习、可复现、可优化的交互设计方法论。笔者在多个行业的大模型项目实践中反复验证:一个结构清晰、角色明确、边界合理的提示体系,往往比更换更强的底模带来更显著的效果提升。而要构建这样的体
TGITCIC11 天前
gpt·ai大模型·开源大模型·kimi·月之暗面·大模型ai·国产大模型
开源模型登顶?Kimi K2 Thinking 实测解析:它真能超越 GPT-5 吗?过去两年,国产大模型的发展轨迹清晰可见:从早期对标 ChatGPT 的追赶式创新,到如今在推理架构、训练策略和开源生态上走出自己的路径。我们不再只是“复刻”国外模型的能力,而是在某些关键维度——比如长链条推理、工具调用效率、本地部署友好性——开始形成差异化优势。Kimi K2 Thinking 的出现,正是这一趋势的集中体现。它宣称在多个权威榜单上超越 GPT-5 和 Claude 4.5 Sonnet,这在开源领域尚属首次。作为长期关注企业级 AI 落地的技术实践者,我既兴奋又警惕。兴奋在于,一个真正可
TGITCIC14 天前
人工智能·ai大模型·ai agent·ai智能体·开源大模型·金融ai·金融rag
金融RAG落地之痛:不在模型,而在数据结构过去两年,大模型在企业内部掀起了一轮又一轮“智能问答”热潮。尤其在金融行业,从银行到保险、证券、资管,几乎每个机构都在尝试构建自己的RAG(Retrieval-Augmented Generation)系统,希望用AI快速响应客户或员工关于产品条款、监管政策、风险说明等问题。但现实很骨感:很多团队投入大量人力搭建了完整链路,结果上线后却发现,问答质量忽高忽低,错误频出,甚至不如人工查阅效率高。我接触过不下十家金融机构的技术负责人,他们反复提到同一个困惑:“模型没换,架构也没问题,为什么效果就是上不去?”
TGITCIC1 个月前
人工智能·开源·多模态·ai大模型·开源大模型·视觉模型·大模型ai
LLaVA-OV:开源多模态的“可复现”革命,不只是又一个模型在大模型狂飙突进的今天,开源社区似乎陷入一种奇特的悖论:模型权重免费公开,但真正能复现结果的人寥寥无几。你下载一个号称“SOTA”的多模态模型,跑起来却发现效果平平;想自己训练?数据来源模糊、训练脚本缺失、超参配置像谜语——开源成了“半开源”,复现成了玄学。这种困境,在视觉语言模型(VLM)领域尤为突出。
TGITCIC1 个月前
人工智能·深度学习·神经网络·ai大模型·模型训练·训练模型·手搓模型
有趣的机器学习-利用神经网络来模拟“古龙”写作风格的输出器在探索大模型落地应用的旅程中,我们常常聚焦于其解决严肃商业问题的解决方案、策略,如:优化客服、生成报告、辅助决策……这些固然重要,但技术的魅力远不止于此。有时,跳出“实用主义”的框架,用一点“玩心”去触碰技术的边界,反而能更深刻地理解其内核。
FunTester2 个月前
自动化测试·语言模型·ai大模型·自然语言·使用指南·browse_use
以自然语言实现AI自动化Browser-use 详细介绍与使用指南Browser-use 是一款基于 Python 的开源 AI 自动化工具,旨在通过集成大型语言模型(LLM)与浏览器自动化技术,让 AI 智能体具备“浏览网页、抓取信息、动态交互”的能力。只需简单配置与少量代码,即可快速构建浏览器自动化智能体,广泛适用于数据采集、网页测试、自动化任务执行等场景。目前项目在 GitHub 已获得 45.1K Stars,是智能体应用开发领域的热门工具。
ShiMetaPi2 个月前
resnet·ai大模型·大模型部署·bm1684x·图片ai
【ShiMetaPi】边缘计算高并发视频流AI分析应用:BM1684X算力盒子上的ResNet部署指南深度神经网络(DNN)的性能通常随网络层数增加而提升,但当层数超过一定阈值时,会出现 “退化问题”(Degradation Problem):网络准确率饱和甚至下降,并非由于过拟合或梯度消失 / 爆炸,而是深层网络难以优化。
minhuan2 个月前
人工智能·语言模型·自然语言处理·bert·ai大模型·rag
构建AI智能体:二十八、大语言模型BERT:原理、应用结合日常场景实践全面解析BERT(Bidirectional Encoder Representations from Transformers)是谷歌在2018年发布的自然语言处理模型,它彻底改变了NLP领域的发展轨迹。在BERT出现之前,主流模型如Word2Vec只能提供静态的词向量表示,这些方法虽然解决了词汇的分布式表示问题,但无法处理一词多义和复杂的上下文信息。例如,"苹果"这个词在不同语境中既可能指水果,也可能指科技公司,传统模型无法区分这种差异。
算家云2 个月前
人工智能·谷歌·ai大模型·算家云·ai生图·租算力,到算家云·nano banana 提示词
nano banana官方最强Prompt模板来了!六大场景模板详解最近,相信大家的朋友圈和社交媒体都被一个叫nano banana的AI图像生成工具刷屏了。从精致的手办模型到名画人物穿越,再到中土世界场景还原,nano banana已然成为了最火爆的“整活工具之一。
爱喝白开水a3 个月前
人工智能·深度学习·学习·ai·大模型·编程·ai大模型
从零开始学无监督学习:图像混合与标签平滑技术详解,收藏不走丢文章介绍提升无监督学习性能的方法,结合图像混合和标签平滑技术。标签平滑可防模型过度自信,平滑决策边界;图像混合包括全局混合和区域混合(带背景衰减),能使输出特征更平滑。实验表明,增加训练轮数能显著提升准确率,效果甚至优于图像混合方法,有效提高模型性能和迁移能力。
AIGC安琪3 个月前
人工智能·学习·ai·语言模型·大模型·llm·ai大模型
字节跳动把AI大模型入门知识点整理成手册了,高清PDF开放下载大家好,作为一名互联网行业的从业者,我发现AI大模型正在成为技术领域的新热点。就像Python曾经凭借其简洁高效成为编程入门首选一样,AI大模型如今也以其强大的能力和广泛的应用前景吸引着越来越多的学习者。今天我想分享一份全面的AI大模型学习路线图,希望能帮助大家系统性地掌握这一前沿技术。
CodeCraft Studio3 个月前
开发语言·c#·powerpoint·markdown·ppt·aspose·ai大模型
PPT处理控件Aspose.Slides教程:在 C# 中将 PPTX 转换为 Markdown将您的PowerPoint幻灯片转换为Markdown格式,使其兼容 AI 技术。在这个人工智能驱动的时代,GPT和Claude等大模型能够读取和生成基于 Markdown 的内容。此外,Markdown 还可用于博客文章和文档。因此,作为一名 .NET 开发人员,如果您希望自动化 PPTX 到 MD 的转换,Aspose.Slides for .NET就是不错的选择。这款 SDK 提供了一系列功能,支持您使用 C# 以编程方式将 PPTX 转换为 Markdown。它是一款开发者友好的 SDK,可以为您
TGITCIC3 个月前
人工智能·ai大模型·ai agent·ai智能体·企业ai·大模型ai·企业大模型
RAG概念被误用:AI应用落地需回归上下文工程本质在生成式AI爆发式发展的当下,"RAG"(Retrieval-Augmented Generation)作为技术热词频繁出现在行业讨论中。这个将检索与生成简单组合的概念,被普遍视为大模型落地的标准方案。但Chroma创始人Jeff Huber在Latent Space播客中的犀利观点,犹如一记警钟:RAG本质上是误导性的概念包装,其模糊的工程边界正在阻碍AI应用的深度发展。
martian6653 个月前
人工智能·docker·分类·ai大模型·hugging face
大模型部署:AI大模型在医学影像分类中的ONNX、TensorRT和Docker应用🧑 博主简介:CSDN博客专家、CSDN平台优质创作者,高级开发工程师,数学专业,10年以上C/C++, C#,Java等多种编程语言开发经验,拥有高级工程师证书;擅长C/C++、C#等开发语言,熟悉Java常用开发技术,能熟练应用常用数据库SQL server,Oracle,mysql,postgresql等进行开发应用,熟悉DICOM医学影像及DICOM协议,业余时间自学JavaScript,Vue,qt,python等,具备多种混合语言开发能力。撰写博客分享知识,致力于帮助编程爱好者共同进步。欢迎
浩瀚蓝天dep3 个月前
ai大模型·ollama·deepseek
使用Ollama部署自己的本地模型服务器版本:CentOS10Ollama版本:v0.11.6官网地址:Ollama Search 搜索需要的模型,这里以deepseek-r1为例
kkcodeer3 个月前
人工智能·prompt·ai大模型
大模型Prompt原理、编写原则与技巧以及衡量方法大语言模型(LLM,如 GPT 系列)在处理 Prompt 时,首先会将输入文本转换为一系列词向量。接着,模型通过自回归生成的方式逐词预测输出。在生成每个词时,模型都会参考输入的 Prompt以及此前已生成的词。这一过程不断迭代,直到生成完整的回答或达到最大长度限制。
AIGC安琪3 个月前
人工智能·深度学习·ai·语言模型·大模型·transformer·ai大模型
Transformer中的编码器和解码器是什么?今天,我们来具体介绍Transformer的架构设计。一个完整的Transformer模型就像一个高效的语言处理工厂,主要由两大车间组成:编码车间和解码车间。
TGITCIC3 个月前
人工智能·ai大模型·ai智能体·ai搜索·大模型ai·deepsearch·ai search
AI Search进化论:从RAG到DeepSearch的智能体演变全过程在AI技术狂飙突进的今天,大模型的"知识幻觉"始终是悬在头顶的达摩克利斯之剑。斯坦福大学研究显示,GPT-4对2023年后知识的准确率骤降至62%。这种知识时效性危机催生了检索增强生成(RAG)技术,但传统RAG的机械流程已难以应对复杂任务。随着推理模型和工具调用能力的突破,AI Search正经历从"检索工具"到"自主智能体"的质变。本文将带您穿越技术演进的三个关键阶段,解密DeepSearch如何突破知识边界与能力边界,揭示智能体自主性背后的技术密码。通过对比Jina AI、Google Gemini