gpt

RamendeusStudio2 天前
数据库·人工智能·gpt·音视频·stablediffusion·controlnet
4.1-1 IS-NET-Pro视频转图片的插件IS-NET-Pro这个插件真的让人惊讶,可以视频转帧图片,也可以将帧图片序列转换成视频。同时还有抠图等功能。
*星星之火*2 天前
python·gpt·jupyter
【GPT入门】第27课 Jupyter 感知到通过命令行生成的内核要让 Jupyter 感知到通过命令行生成的内核,可按照以下步骤操作:如果上述方法仍然无法让 Jupyter 感知到新的内核,可以尝试查看 Jupyter 的日志文件,以查找可能的错误信息,或者检查内核的安装路径和配置文件是否正确。
算力魔方AIPC3 天前
gpt
用PaddleNLP为GPT-2模型制作FineWeb二进制预训练数据集作者:算力魔方创始人/英特尔创新大使刘力《用PaddleNLP在4060单卡上实践大模型预训练技术》发布后收到读者热烈反响,很多读者要求进一步讲解更多的技术细节。本文主要针对大语言模型的预训练流程,使用PaddleNLP将FineWeb数据集中文本形式的数据,经过分词化(Tokenize),转换为大语言模型能直接使用的二进制数据,以便提升训练效果。
Chaos_Wang_3 天前
gpt·自然语言处理·bert
NLP高频面试题(七)——GPT和Bert的mask有什么区别?在NLP领域,GPT 和 BERT 是最具代表性的预训练语言模型之一。它们都在训练过程中使用了 Mask 机制来引导模型学习语言表示,但具体实现方式和目标却有所不同。本文将深入探讨 GPT 和 BERT 的 Mask 方法的核心区别,并分析其优化策略。
Climber474 天前
gpt
Mac - Cursor 配置 + GPT 4.0/4.5/o1/o3/Deepseek Api 使用新换了电脑,所以需要新配置一些环境。已经安装好了Goland,但近期可能有Go+Java+前端的需求,所以使用Cursor。
花千树-0104 天前
gpt·架构·prompt·aigc·embedding·llama·agi
Dify - 架构、部署、扩展与二次开发指南本文详细解析 Dify 的架构、部署流程、高可用中间件的独立部署方法,以及二次开发流程,帮助开发者更高效地管理和扩展 Dify。
量子位4 天前
人工智能·gpt
GPT-5 将免费向用户开放,DeepSeek 逼的“DeepSeek 给了 OpenAI 一个教训,我们隐藏思维链给它们留下病毒式传播的机会,这是一个警钟。”
江江江江江江江江江4 天前
gpt·chatgpt
Hugging Face预训练GPT微调ChatGPT(微调入门!新手友好!)在实战中,⼤多数情况下都不需要从0开始训练模型,⽽是使⽤“⼤⼚”或者其他研究者开源的已经训练好的⼤模型。
程序猿阿伟4 天前
gpt·自然语言处理·bert
《深度剖析:BERT与GPT——自然语言处理架构的璀璨双星》在自然语言处理(NLP)的广袤星空中,BERT(Bidirectional Encoder Representations from Transformers)与GPT(Generative Pretrained Transformer)系列模型宛如两颗最为耀眼的星辰,引领着NLP技术不断迈向新的高度。它们基于独特的架构设计,以强大的语言理解与生成能力,彻底革新了NLP的研究与应用范式,成为学界和业界竞相探索与应用的焦点。
*星星之火*6 天前
python·gpt·langchain
【GPT入门】第20课 langchain的function calling 初步体验query = “3 加 4的和 的 5 倍是多少?” 这个会调用两次函数 query = " 4的 5 倍是多少?"
RamendeusStudio7 天前
人工智能·gpt·ai·llm·stablediffusion·controlnet·ai agent
5-29 有趣的指令Pix2Pix(P2P)上一节我们介绍了ControlNet中使用IP-Adapter能力本节主要介绍ControlNet中的指令P2P。
*星星之火*7 天前
gpt·langchain
【GPT入门】第22课 langchain LCEL介绍LCEL 即 LangChain Expression Language,是 LangChain 推出的一种声明式语言,用于简化和优化在 LangChain 框架内构建复杂链和应用的过程。以下详细介绍其特点和作用: 特点 声明式语法:传统的链式操作构建方式可能需要编写较多的代码和复杂的逻辑,而 LCEL 使用简洁的声明式语法,让开发者能够以一种直观的方式描述数据在各个组件之间的流动。例如,使用 | 操作符来连接不同的组件,就像搭积木一样轻松组合各个模块,大大提高了代码的可读性和可维护性。 易于组合:支持将
RamendeusStudio8 天前
人工智能·gpt·ai·stablediffusion·controlnet
5-26 黑白照片上色-Recolor上一节我们介绍了如何制作艺术二维码本一节主要介绍ControlNet中的Recolor。重新上色。实际上我们针对颜色的处理可以使用语义分割,或者边缘检测后单独处理,reColor相对方便的内置算法,帮我们自动的一体化处理。
晴天彩虹雨8 天前
gpt·ai·语言模型·transformer
大语言模型(LLM)解析:从 GPT 到 DeepSeek(Transformer 结构、主流 LLM 的对比)大语言模型(LLM, Large Language Model)近年来发展迅速,从早期的基于统计和规则的语言处理模型,到深度学习时代的 Transformer 结构,再到目前各国科技企业推出的大规模预训练模型,如 OpenAI 的 GPT 系列、国内的 DeepSeek、Manus、通义千问等。这些模型在自然语言处理(NLP)领域取得了突破性的进展,使 AI 具备更强的理解和生成能力。本文将深入探讨 LLM 的核心技术、发展历程以及主流模型的对比分析。
*星星之火*9 天前
gpt·langchain
【GPT入门】第18课 langchain介绍与API初步体验LangChain 是一个用于开发由语言模型驱动的应用程序的开源框架,它在大语言模型(LLM)应用开发领域发挥着重要作用,以下为你详细介绍它的定义和特点:
*星星之火*10 天前
gpt·dubbo
【GPT入门】第20课 文心千帆注册与API调用本文,讲解注册文心千帆步骤,再用API体验调用流程,调用接口跟OPENAI一样申请文心千帆的AK(API Key)和SK(Secret Key),具体步骤如下:
IT从业者张某某11 天前
人工智能·gpt·语言模型·datawhale
大语言模型-1.3-GPT、DeepSeek模型介绍本博客内容是《大语言模型》一书的读书笔记,该书是中国人民大学高瓴人工智能学院赵鑫教授团队出品,覆盖大语言模型训练与使用的全流程,从预训练到微调与对齐,从使用技术到评测应用,帮助学员全面掌握大语言模型的核心技术。并且,课程内容基于大量的代码实战与讲解,通过实际项目与案例,学员能将理论知识应用于真实场景,提升解决实际问题的能力。
RamendeusStudio11 天前
人工智能·gpt·ai·stablediffusion·controlnet
5-27 临摹大师-IP-Adapter前一节我们主要介绍ControlNet中如何对黑白照片进行上色主要介绍ControlNet中的IP-Adapter。这个也是一种类似的风格借鉴,类似Reference的能力。
*星星之火*12 天前
java·gpt·openai
【GPT入门】第11课 FunctionCall调用本地代码入门为了了解,funcationCall底层,手写一个functionCall多方法,并调用,体验思路: 任务:让openai调用sum方法,对加法进行求和 1.定义sum方法,给openAi接口 2.让大模型自动识别用户问题,解释参数,获取调用方法id、方法名称、方法参数 3.把第二步的结果,给大模型,让大模型调用函数,并返回结果
花千树-01012 天前
java·gpt·langchain·prompt·github·aigc·ai编程
J-LangChain - Agent - 编排一个 ReAct + Function Call 反应链系列文章索引 J-LangChain 入门j‑langchain 是一款基于 Java 的 AIGC 编排框架,致力于集成多种大模型(LLM)调用及 RAG 工具。自 1.0.8 版本起,我们引入了工具函数(Function Call)调用能力,正式实现了 Tools 功能,并将其与 ReAct(Reasoning + Acting) 模式结合,从而构建出功能丰富、交互智能的 Agent 系统。