llm

Milkha11 小时前
llm·模型训练
大模型训练工具,小白也能轻松搞定!Axolotl 是一款旨在简化各种人工智能模型微调的工具,支持多种配置和架构。主要特点:示例:使用零代码命令行与 Web UI 轻松训练百余种大模型,并提供高效的训练和评估工具。
HyperAI超神经14 小时前
人工智能·深度学习·llm·html·数据集·多模态·gpt-4o
超越 GPT-4o!从 HTML 到 Markdown,一键整理复杂网页;AI 对话不再冰冷,大模型对话微调数据集让响应更流畅面对信息冗余的网页内容,如何快速提取全面的核心信息?Reader-LM 模型为你提供了专业的解决方案。Reader-LM 能高效处理高达 256K 字节的超长内容,精准将 HTML 转换为清晰的 Markdown 格式。它的表现甚至超过了 GPT-4o 等大型语言模型,其轻量化设计也使它更适合资源受限的场景。
阿正的梦工坊21 小时前
llm
使用Sum计算Loss和解决梯度累积(Gradient Accumulation)的Bug学习 https://unsloth.ai/blog/gradient:Bugs in LLM Training - Gradient Accumulation Fix 这篇文章的记录。
yuanlulu1 天前
人工智能·深度学习·llm·ocr·ppstructure
昇腾环境ppstreuct部署问题记录我是在华为昇腾910B3上测试的PPStructure。完整的报错如下:报错很明显,找不到/root/.paddleclas/inference_model/PULC/text_image_orientation/inference.json这个文件,这个文件目录是自动下载的模型目录,的确没这个文件。应该是百度的模型格式改了,导致找不到。
高性能服务器2 天前
大数据·语言模型·llm·aigc·gpu算力·智算中心·ai算力
英伟达 2025 CES:GPU与智算中心协同驱动 GPU算力智能变革2025年1月7日,英伟达CEO黄仁勋在 2025 CES 上的演讲再次将 AI 算力推到聚光灯下,揭示了智算中心与 GPU 协同驱动智能变革的新路径。
uncle_ll3 天前
人工智能·gpt·chatgpt·大模型·llm
ChatGPT大模型极简应用开发-目录要理解 ChatGPT,了解其背后的 Transformer 架构和 GPT 技术一路的演进则变得非常必要。
AI趋势预见3 天前
人工智能·深度学习·神经网络·语言模型·自然语言处理·金融·llm
基于金融新闻的大型语言模型强化学习在投资组合管理中的应用“Financial News-Driven LLM Reinforcement Learning for Portfolio Management”
goomind3 天前
人工智能·深度学习·llm·nlp·transformer
Transformer之Decoder在开始处理输入序列之前,模型对输出嵌入进行向右偏移一个位置,确保在训练阶段,解码器内的每个符号都能正确地获取之前生成符号的上下文信息。
AI-智能3 天前
人工智能·自然语言处理·程序员·llm·prompt·ai编程·ai大模型
NLP入门书籍《掌握NLP:从基础到大语言模型》免费下载pdf您是否想要掌握自然语言处理(NLP)但不知从何开始?这本书将为您指明正确的方向。本书由机器学习和NLP领域的领导者撰写,《掌握NLP:从基础到大语言模型》深入介绍了相关技术。
SpikeKing4 天前
llm·clm·mlm·scalinglaws·isoflops·symbolab
LLM - 大模型 ScallingLaws 的 CLM 和 MLM 中不同系数(PLM) 教程(2)欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/145188660
SpikeKing4 天前
人工智能·llm·迁移学习·plm·scalinglaws·混合训练
LLM - 大模型 ScallingLaws 的迁移学习与混合训练(PLM) 教程(3)欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/145212097
uncle_ll4 天前
人工智能·gpt·chatgpt·大模型·llm
ChatGPT大模型极简应用开发-CH1-初识 GPT-4 和 ChatGPTGPT-4 和其他 GPT 模型是基于大量数据训练而成的大语言模型 (large language model,LLM),它们能够以非常高的准确性识别和生成人类可读的文本。
开出南方的花4 天前
人工智能·自然语言处理·lora·llm·prompt·peft·adapter
大模型微调介绍-Prompt-Tuning基于「传统机器学习模型」的范式,如TF-IDF特征+朴素贝叶斯等机器算法.基于「深度学习模型」的范式,如word2vec特征+LSTM等深度学习算法,相比于第一范式,模型准确有所提高,特征工程的工作也有所减少.
致Great5 天前
人工智能·llm·nlp
RAG 切块Chunk技术总结与分块实现思路分享TrustRAG项目地址🌟:github.com/gomate-comm…可配置的模块化RAG框架在RAG(Retrieval-Augmented Generation)任务中,Chunk切分是一个关键步骤,尤其是在处理结构复杂的PDF文档时。PDF文档可能包含图片、奇怪的排版等,增加了Chunk切分的难度。
诸神缄默不语5 天前
chatgpt·llm·论文·openai·transformers·大规模预训练语言模型·gpt-4
Re78 读论文:GPT-4 Technical Report诸神缄默不语-个人CSDN博文目录 诸神缄默不语的论文阅读笔记和分类论文全名:GPT-4 Technical Report
yuanlulu5 天前
lora·llm·transformer·分布式训练·大语言模型·huggingface·多卡训练
llamafactory使用8张昇腾910b算力卡lora微调训练qwen2-72b大模型我需要在昇腾服务器上对Qwen2-72B大模型进行lora微调,改变其自我认知。 我的环境下是8张910B1卡。显存约512GB。
听吉米讲故事5 天前
pdf·llm·markdown
MinerU:高效智能PDF文档解析工具完全指南MinerU是一款开源的智能文档解析工具,专注于将PDF等文档高效转换为Markdown和JSON等结构化格式。在当前大语言模型(LLM)蓬勃发展的时代,高质量的结构化数据对于训练和微调LLM至关重要。MinerU通过其强大的智能文档解析能力,不仅可以为LLM提供清晰的训练语料,还能作为AI应用的重要数据预处理工具。与传统PDF处理工具不同,MinerU的智能解析能力涵盖了文本、图片、表格和公式等多模态内容,尤其适用于多语言文档和复杂布局的PDF文件批量处理。本文将重点介绍MinerU的核心特点、环境配置
量子位5 天前
人工智能·llm·unity3d
国产 3D 生成大模型火爆外网!歪果仁年都不过了,都在测这个“3D 大模型终于可以生成锐利的边角了!”“在钻研了一阵 3D 人工智能后,我总算通过 Hyper3D.ai 用上了 Rodin1.5,它真的可能改变游戏规则。”
探索云原生6 天前
ai·llm·sft
大模型微调基本概念指北本文主要分享一下大模型微调相关的基本概念,包括大模型(GPT)训练流程、微调(SFT)方法&分类&框架&最佳实践、强化学习(RLHF),最后则是分享了如何训练垂直领域大模型。
阿里云大数据AI技术6 天前
人工智能·阿里云·llm·rag·pai
面向法律场景的大模型RAG检索增强解决方案在现代信息检索领域,检索增强生成(Retrieval-Augmented Generation, RAG)模型结合了信息检索与生成式人工智能的优点,从而在特定场景下提供更为精准和相关的答案。在特定场景下,例如法律等领域,用户通常需要精确且相关的信息来支持决策。传统生成模型虽然在自然语言理解和生成方面表现良好,但在专业知识的准确性上可能有所不足。RAG模型通过将检索与生成相结合,能有效提升回答的准确性和上下文相关性。本方案以人工智能平台PAI为基础产品,为您介绍面向法律场景的大模型RAG检索增强解决方案。