大模型日报
2024-06-06
大模型资讯
- 摘要: 研究表明,像ChatGPT这样的流行AI平台在推理测试中给出的答案不一致,并且在增加上下文信息后也没有改善。这揭示了当前大型语言模型在推理能力上的局限性。
- 摘要: Databricks与MIT发布了一篇AI论文,提出了一种基于困惑度的数据修剪方法,旨在提升3B参数模型的性能,并增强大型语言模型的效果。这一方法在机器学习领域具有重要意义,尤其是在提升大型语言模型性能和减少训练成本方面。
- 摘要: GPT-4作为一种大型语言模型,在眼科问题评估上表现优于不同阶段的医生,包括非专业的初级医生和实习医生。
- 摘要: 该方法使机器人能够将多项家庭任务逻辑地分解为子任务,并在遇到干扰时进行物理调整,从而提升机器人在家庭环境中的实用性和灵活性。
- 摘要: 本文探讨了Anthropic公司的一项突破性技术,该技术旨在揭示大型语言模型(LLMs)的内部运作机制,帮助人们更好地理解这些复杂的AI系统。
- 摘要: IPA子公司BioStrand宣布推出用于电子健康记录的先进大语言模型(LLM)。IPA技术负责人Dirk Van Hyfte博士将在2024年6月9日至12日的InterSystems全球峰会上进行现场演示。
- 摘要: 语言模型领域日益有趣,新的小型语言模型能够适应各种用途和设备。本文对大语言模型(LLMs)、小型语言模型(SLMs)和超小型语言模型(STLMs)进行了全面分析。
- 摘要: SAP与领先的大型语言模型制造商Mistral AI达成合作。这一合作是AI专业知识与技术的共生结合,旨在推动技术进步和创新。了解更多关于这一合作的信息。
- 摘要: 德国商业软件公司SAP正在扩大与美国科技巨头的人工智能合作伙伴关系,以推动其在人工智能领域的发展。
- 摘要: 大型语言模型(LLM)的迅速崛起重新定义了人工智能的格局,为保险行业带来了创新的可能性。这些先进的模型正在改变保险业务的处理方式,提升效率和客户体验。
大模型产品
大模型论文
- 摘要: 研究GPT模型在模块算术任务中上下文学习与技能组合的出现。发现两层Transformer块可实现分布外泛化,深层模型需早停。
- 摘要: 本文提出VisInContext方法,通过视觉标记处理长文本,显著减少GPU内存和计算成本,提高多模态模型性能。
- 摘要: 研究了大语言模型中的不确定性量化,提出信息论度量方法检测模型输出的不可靠性,并通过实验验证其优势。
- 摘要: Loki通过降低注意力机制中键向量的维度,提出一种新的稀疏注意力方法,提高计算效率并减少内存开销。
- 摘要: Parrot通过文本引导实现视觉标记的多语言对齐,提升非英语语言性能,并发布多语言多模态基准MMMB。
- 摘要: 研究视觉语言模型在顶视图空间推理中的能力,提出TopViewRS数据集,并评估其在多任务中的表现,发现其性能有限。
- 摘要: 本文提出通过缩放位置隐藏状态来缓解大语言模型在长上下文场景中的位置偏差,实验表明该方法有效提升性能。
- 摘要: SpecExec利用并行推理方法,实现50B+参数的大模型在消费级GPU上的高效推理,速度可达每秒2-6个token。
- 摘要: 本文提出了一种无需矩阵乘法的语言模型,在保持性能的同时显著减少内存使用,并提供了GPU和FPGA上的高效实现。
- 摘要: CheckEmbed通过嵌入对比实现LLM答案验证,适用于知识提取等任务,提升准确性和效率。
大模型开源项目
- 摘要: Ollama是一个用Go语言编写的项目,帮助用户快速上手Llama 3、Mistral、Gemma等大型语言模型。
- 摘要: GPT-4o是一款用Python编写的工具,支持在Windows、macOS和Ubuntu系统上运行,方便多平台用户使用。
- 摘要: lllyasviel是一个用Python编写的AI项目,旨在提升图像质量,让你的图像更接近完美。
- 摘要: OpenBMB推出MiniCPM-Llama3-V 2.5,基于Python编写,实现GPT-4V级别的多模态语言模型,可在手机上运行。
- 摘要: 基于ChatTTS的音频生成工具,支持音色抽卡、长音频生成和分角色朗读。简单易用,无需复杂安装,含离线整合包。
- 摘要: 微软提供18节生成式AI入门课程,使用Jupyter Notebook编写,帮助初学者快速上手构建生成式AI应用。
- 摘要: Aider是一个用Python编写的终端AI配对编程工具,帮助开发者在终端内进行高效编程。
- 摘要: 本项目通过Jupyter Notebook,逐步讲解如何使用PyTorch从零实现类似ChatGPT的大语言模型。
- 摘要: eosphoros-ai是一个使用Python编写的AI原生数据应用开发框架,包含AWEL和智能代理功能。
- 摘要: 一个简单的本地网页界面,使用ChatTTS将文字合成为语音,并支持API接口,基于Python开发。