llama

模型优化师11 小时前
人工智能·学习·chatgpt·transformer·llama
对不起,AI大模型不是风口“我们正处在全新起点,这是一个以大模型为核心的人工智能新时代,大模型改变了人工智能,大模型即将改变世界。”——5月26日,百度创始人、董事长兼CEO李彦宏先生在2023中关村论坛发表了《大模型改变世界》演讲。
新加坡内哥谈技术19 小时前
人工智能·安全·语言模型·自然语言处理·llama
AI风险管理新利器:SAIF CHECK利用Meta Llama 3保障合规与安全每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/
AGI八零后1 天前
人工智能·学习·机器学习·langchain·llama
扛鼎中国AI搜索,天工凭什么?人类的创作不会没有瓶颈,但AI的热度可不会消停。大模型之战依旧精彩,OpenAI选择在Google前一天举行发布会,两家AI企业之间的拉扯赚足了热度。
fengbeely2 天前
百度·prompt·llama
百度智能云升级:接入33个大模型,Llama 2引领创新,103个Prompt模板上线大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。
yumuing blog3 天前
人工智能·语言模型·llama
LangGPT:高质量提示词框架研究团队开发了一种名为LangGPT的框架,旨在为大型语言模型(LLMs)提供结构化且可重用的提示设计方法。LangGPT的设计灵感来源于编程语言的结构化特性,以解决非AI专家在为LLMs设计高效指令时面临的挑战。该框架通过定义一套标准模块和基本元素,以及扩展模块和自定义元素,提升了提示设计的通用性和复用性。
爱学习的uu3 天前
人工智能·深度学习·机器学习·自然语言处理·llama
大模型应用实战4——开源大模型微调(基于LLaMA-Factory)所谓微调,通俗理解就是围绕大模型进行参数修改,从而永久性的改变模型的某些性能。而大模型微调又分为全量微调和高效微调两种,所谓全量微调,指的是调整大模型的全部参数,而高效微调,则指的是调整大模型的部分参数,目前常用的高效微调方法包括LoRA、QLoRA、p-Tunning、Prefix-tunning等。
MonkeyKing_sunyuhua3 天前
llama·模型微调
Llama 3 模型微调的步骤创建一个新的conda环境:激活刚刚创建的conda环境:下载LLama_Factory源码:建议在执行项目的依赖安装之前升级 pip 的版本,如果使用的是旧版本的 pip,可能无法安装一些最新的包,或者可能无法正确解析依赖关系。升级 pip 很简单,只需要运行命令如下命令:
营赢盈英3 天前
python·llama·rag·weaviate
Unable to get expected results using BM25 or any search functions in Weaviate题意:使用 Weaviate 中的 BM25 或任何搜索函数都无法获得预期结果I have created a collection in Weaviate, and ingested some documents into the Weaviate database using LlamaIndex. When I used the default search, I found that it was retrieving wrong documents the whole time. After t
三月七(爱看动漫的程序员)5 天前
开发语言·人工智能·python·语言模型·自然语言处理·chatgpt·llama
深入了解 GPT-4 和 ChatGPT 的 API---使用 OpenAI Python 库OpenAI 将 GPT-4 和 ChatGPT 作为服务提供。这意味着用户无法直接访问模型代码,也无法在自己的服务器上运行这些模型。OpenAI 负责部署和运行其模型,只要用户拥有 OpenAI 账户和 API 密钥,就可以调用这些模型。在执行以下步骤之前,请确保你已登录 OpenAI 账户。
云帆@7 天前
人工智能·llama
llama-factory微调chatglm34. 推理5. 合并并导出
2401_857600957 天前
llama
探索开源宝藏:LLaMA 2 模型的全面优势与实践指南在大型语言模型(LLM)的领域中,Meta AI 开发的 LLaMA 2 以其开源的优势和强大的性能,迅速成为研究和开发社区的新宠。本文将深入探讨 LLaMA 2 的优势,并提供详细的实践指南,帮助读者充分利用这一强大的工具。
云帆@7 天前
学习·llama
llama系列模型学习llama1 模型与transformer decoder的区别 Transformer Decoder 架构,做了以下修改: 1.和GPT3-样将Normalization从每个子层的输出位置移动到了输入位置。 2.将Layer Norm 改为 RMS Norm。 3.采用旋转位置编码, 4.采用silu激活函数。(根据光滑,实验效果更好)
bigshark_software8 天前
人工智能·语言模型·llama
2024-06-21 问AI: 在大语言模型中,什么是LLama IndexLLama Index是一个针对基于LLM(大型语言模型)的应用程序的数据框架,旨在提供RAG(检索增强生成,Retrieval-Augmented Generation)能力。以下是关于LLama Index的清晰概述:
ShowMeAI8 天前
人工智能·gpt·prompt·aigc·大语言模型·llama·agi
一份LLM资源清单围观技术大佬的日常;手把手教你在美国搭建「百万卡」AI数据中心;为啥大模型做不好简单的数学计算? | ShowMeAI日报👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦!司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o),组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试,然后由经验丰富的判卷老师评判得分。
花生糖@8 天前
人工智能·语言模型·llama
深入探索Llama 2:下一代开源语言模型的革新与影响Llama 2是Meta AI发布的一款先进的开源大模型,属于大型语言模型(LLM)类别。它是Transformer架构的一种变体,经过预先训练并在多种文本和代码数据集上进行微调,旨在提升功能和安全性。Llama 2的关键特点包括:
AIGCTribe9 天前
人工智能·langchain·llama
AI视频教程下载-用LangChain 开发 OpenAI、 LLAMA 、 Gemini 等AI应用LangChain MasterClass- OpenAI LLAMA 2 GPT LLM Apps__ Python(LangChain MasterClass-Develop 7 OpenAI LLM Apps using Python)
zRezin10 天前
人工智能·pdf·llama
OpenAI项目爆改GLM——以基于llama_index的pdf阅读助手最近在做大模型agent构建,看了许多不错的开源项目,但是clone下来就是一整个不能用,因为github上开源的项目基本都是基于openai做的。而如果想要转成国内大模型backbone,需要修改的地方挺多的。
知来者逆10 天前
人工智能·深度学习·神经网络·语言模型·自然语言处理·llama·qwen2
Qwen2——阿里巴巴最新的多语言模型挑战 Llama 3 等 SOTA经过几个月的期待, 阿里巴巴 Qwen 团队终于发布了 Qwen2 – 他们强大的语言模型系列的下一代发展。 Qwen2 代表了一次重大飞跃,拥有尖端的进步,有可能将其定位为 Meta 著名的最佳替代品 骆驼3 模型。在本次技术深入探讨中,我们将探讨使 Qwen2 成为大型语言模型 (LLM) 领域强大竞争者的关键功能、性能基准和创新技术。
bylander12 天前
人工智能·学习·语言模型·自然语言处理·llama
【AI学习】LLaMA 系列模型的进化(一)一直对LLaMA 名下的各个模型关系搞不清楚,什么羊驼、考拉的,不知所以。幸好看到两篇综述,有个大致了解,以及SEBASTIAN RASCHKA对LLaMa 3的介绍。做一个记录。
coolkidlan12 天前
人工智能·aigc·llama
【AI应用探讨】— Meta Llama-3模型应用场景目录一、智能对话系统聊天机器人虚拟助手二、内容创作与生成文本生成代码生成三、自然语言处理(NLP)任务