大模型日报2024-03-28

大模型资讯

  1. Databricks发布世界上最强大的开源AI语言模型DBRX
  • 摘要: 创业公司Databricks近日推出了DBRX,这是迄今为止最强大的开源大型语言模型。据悉,DBRX的性能超越了Meta的Llama 2模型。DBRX的发布标志着在开源社区中人工智能技术的又一重大进展,为研究人员和开发者提供了前所未有的机器学习工具。
  1. Databricks发布开源大型语言模型DBRX
  • 摘要: 数据和人工智能公司Databricks宣布推出了一款名为DBRX的通用大型语言模型(LLM)。DBRX作为一款开源工具,旨在提升机器学习和自然语言处理的能力,进而推动AI技术的发展和应用。
  1. Databricks推出开源大型语言模型DBRX,与Llama 2、Mixtral和GPT-3.5竞争
  • 摘要: Databricks宣布推出一款开源的大型语言模型DBRX,旨在与现有的Llama 2、Mixtral和GPT-3.5模型竞争。DBRX模型将使企业能够自主控制其生成性AI工具的开发,为商业用户提供了更多的选择和灵活性。
  1. Databricks发布开源大型语言模型DBRX,性能超越现有模型
  • 摘要: Databricks公司今日发布了其大型通用语言模型DBRX,并宣称其性能超过了所有现有的开源模型。DBRX作为一个开源项目,其推出可能会在自然语言处理领域引起重大影响,为开发者提供更强大的工具来构建语言相关的应用。
  1. 大型语言模型使用简单机制检索知识
  • 摘要: 2024年3月27日,波士顿消息:研究表明,驱动流行人工智能聊天机器人如ChatGPT等的大型语言模型,能够通过一种出人意料的简单机制来检索它们储存的知识。这一发现对理解这些高级AI系统的工作原理具有重要意义。
  1. MIT研究人员利用大型语言模型为机器人赋予常识
  • 摘要: 麻省理工学院的工程师们开发了一个新框架,该框架通过应用大型语言模型来为机器人提供常识性认知。这项技术有望提高机器人对环境的理解能力,并使其更加自然地与人类互动。
  1. 斯坦福医学界将大型语言模型引入临床:AI与医患互动新篇章
  • 摘要: 斯坦福医学的医生和研究人员正在改进现有的聊天机器人,使其在医学领域的新前沿------AI增强医疗中表现出色。这标志着人工智能技术在改善医患沟通和提升诊疗效率方面迈出了重要一步。
  1. 研究大型语言模型如何通过策略性提示工程和总结进行决策
  • 摘要: 最新研究探讨了如何利用策略性提示工程和总结技术来指导大型语言模型的决策过程。该研究位于人工智能潜能开发的前沿,旨在通过强化学习等方法提升模型的决策效率和准确性,为人工智能的应用和发展带来新的突破。
  1. 大型语言模型成功简化放射学报告
  • 摘要: 最新研究表明,ChatGPT等大型语言模型在简化放射学报告的描述方面表现出色。该研究于周二发布,结果显示这些模型能够有效地将放射报告中的专业术语转换为更易于理解的语言,有助于非专业人士的理解。
  1. 首个模型窃取攻击揭示黑盒生产语言模型秘密
  • 摘要: 近期,一种新型的模型窃取攻击成功揭露了大型语言模型如GPT-4、Claude 2或Gemini等的内部运作机制。这些语言模型虽然功能强大,但该攻击表明它们的保密性可能被威胁,从而对其安全性提出了新的疑问。

大模型产品

  1. Creatie:AI驱动的一站式产品设计工具
  • 摘要: Creatie是一款源于设计热情并融合AI魔法的产品设计软件。它集思维导图、设计、协作、原型制作及交接于一体,旨在让整个设计过程更加轻松愉快。
  1. FinCheck财务健康免费检测
  • 摘要: FinCheck by Trezy是一款AI工具,用户只需上传年度报表,即可免费获得一份全面的财务健康分析报告。该报告包括关键的财务健康指标、公司估值及破产可能性等内容。
  1. DIKTATORIAL套件:文字指令AI音频母带
  • 摘要: DIKTATORIAL套件是您的全天候AI音频母带工具,通过文本提示进行升级和增强。它能够快速、创造性地改善音质,节省时间和金钱,无需聘请昂贵的母带工程师。现在就免费试用。
  1. Martin:你的AI管家,像贾维斯一样
  • 摘要: Martin是一个iOS应用中的AI助手,您可以通过语音、文字或邮件与之交流。他会随着时间了解你,并主动提供帮助,能整合搜索引擎、日历、邮件等功能,会在会议前提供简报,在你回家时迎接你。
  1. Talkie AI:梦中角色亲密互动
  • 摘要: Talkie AI让你与梦中角色随时深入交流成真。无限长聊,全天候呼叫,更有珍藏卡片记录难忘瞬间,体验前所未有的互动。
  1. JobTrackerAI:一站式求职申请管理
  • 摘要: JobTrackerAI由Wonsulting推出,通过AI整合求职进程。仅需连接Gmail账号,即可自动追踪从申请到面试、拒信及录用的全过程。数据私密,且完全免费。
  1. Alice:智能AI执行助手
  • 摘要: Alice是一款原生应用,通过集成OpenAI等模型,提供快速可靠体验。支持键盘快捷键和预设指令,提升工作效率。不仅回答问题,还能连接应用执行操作。
  1. DermaQ: AI秃发检测与治疗
  • 摘要: DermaQ利用AI技术评估脱发程度和原因。用户只需上传头皮照片,即可获得深入的毛发分析、未来秃发可能性及专家定制的治疗方案。
  1. Wiser:你的知识版Pinterest
  • 摘要: Wiser AI是你的个性化学习助手,每天为你推荐7个定制化的播客、视频、通讯和书籍,每24小时更新,助你每天学习新知识。
  1. AI背景移除工具:免费快速
  • 摘要: 体验我们的AI背景移除工具的魔力吧!完全免费,只需几秒钟,即可轻松去除高清照片背景。现在就来试试看!

大模型论文

  1. MAGIS:基于LLM的GitHub问题解决框架
  • 摘要: 本文提出了一个基于大型语言模型(LLM)的多智能体GitHub问题解决框架MAGIS。通过集成管理者、代码库管理员、开发者和质量保证工程师智能体,MAGIS在实验中显著优于现有技术,解决率提升了八倍。
  1. LISA:高效大型语言模型微调
  • 摘要: 本文提出了LISA策略,通过层次重要性采样优化大型语言模型微调的内存效率。相较于LoRA和全参数训练,LISA在多个任务上以更低的内存消耗取得了更高的性能。
  1. IgBert与IgT5:抗体特异性语言模型
  • 摘要: 本文介绍了IgBert和IgT5,这两个抗体特异性语言模型能处理成对和非成对变区序列,通过训练超过20亿非成对序列和200万成对序列,显著提升抗体工程设计和回归任务表现。
  1. 基于HCXAI的大型语言模型社会误解研究
  • 摘要: 本研究提出扩展社会透明度框架,以解决大型语言模型在敏感领域如心理健康中的社会误解风险。通过增加第五个'W-question',明确设计师和用户对模型的社会属性赋予,促进伦理负责任的技术发展和使用。
  1. 利用LLMs减少NLP高置信误判
  • 摘要: 本研究探讨了大型语言模型(LLMs)生成文本数据以增强NLP模型训练集的方法。通过三项分类任务评估,结果显示该方法能有效减少高置信误分类,且成本远低于人工,同时保持准确率。
  1. ChroniclingAmericaQA:历史报纸问答数据集
  • 摘要: ChroniclingAmericaQA是基于历史性美国报纸收藏Chronicling America创建的,包含485K问答对的大型数据集。面向QA和MRC任务,涵盖120年,提供原始、校正文本和扫描图像三种形式,为语言模型训练提供独特资源。
  1. 评估五种LLMs的英语零派生
  • 摘要: 本文首次研究了大型语言模型(LLMs)对英语词汇零派生的处理能力。通过自然语言推理范式设计任务,测试了五种模型,包括GPT-3.5、GPT-4及开源模型,发现GPT-4表现最佳。
  1. ArabicaQA: 阿拉伯问答数据集
  • 摘要: 本文介绍了ArabicaQA,这是首个大规模阿拉伯语机器阅读理解和开放域问答数据集。包含89296个问题和AraDPR阿拉伯文检索模型。
  1. 分层开放词汇3D场景图导航
  • 摘要: 本研究提出了HOV-SG,一种用于语言引导的机器人导航的分层开放词汇3D场景图方法。通过利用开放词汇视觉基础模型,实现了在多层建筑中进行机器人导航,并在三个数据集上超越了以往基准,显著减少了表示大小。
  1. 多模态大型语言模型人值对齐评估
  • 摘要: 研究提出了Ch3Ef数据集和评估策略,用于检验多模态大型语言模型(MLLMs)与人类价值观的一致性。该数据集包含1002个基于帮助、诚实和无害原则的人类注释样本,涵盖12个领域和46项任务。

大模型开源项目

  1. 一键生成短视频的AI大模型
  • 摘要: harry0703是一个Github上的AI项目,使用Python编写。该项目采用大型机器学习模型,用户可以轻松一键生成短视频内容,简化视频制作流程。
  1. OpenInterpreter:自然语言计算机界面
  • 摘要: OpenInterpreter是一个用Python编写的AI项目,旨在为用户提供一个自然语言的计算机操作界面,通过简单的语言即可与计算机交互。
  1. AI生成研究一站式资源库
  • 摘要: aishwaryanr项目是一个综合性资源库,专注于提供生成性AI研究的最新动态、面试资源、笔记本等,便于学习和研究。
  1. Devika:智能AI软件工程师项目
  • 摘要: Devika是一款开源的Agentic AI软件工程师项目,能够理解人类高层次指令,研究信息并编写代码,旨在成为Cognition AI的Devin的竞争对手。
  1. OpenDevin:低代码,高效能
  • 摘要: OpenDevin项目,旨在通过低代码开发提高效率。该项目使用Jupyter Notebook编写,让开发者能够用更少的代码完成更多工作。
  1. semanser:全自主AI终端助手
  • 摘要: semanser是一个用TypeScript编写的AI项目,能够通过终端、浏览器和编辑器执行复杂任务,实现全自动操作。
  1. 从零开始实现类ChatGPT模型
  • 摘要: 该项目由rasbt创建,旨在逐步指导如何从零开始实现一个类似ChatGPT的大型语言模型,全部内容使用Jupyter Notebook编写。
  1. 零样本语音编辑与TTS项目
  • 摘要: jasonppy项目,实现了零样本语音编辑与文本转语音功能。该项目使用Python编写,能够在多种环境下进行高质量的语音生成与修改。
  1. Mora:全能视频生成新范式
  • 摘要: 该项目名为Mora,旨在打造类似Sora的通用视频生成工具。项目采用Jupyter Notebook编写,通过AI技术创造出高质量的视频内容。
  1. IDEA研究推出T-Rex2目标检测
  • 摘要: IDEA-Research项目发布了T-Rex2,这是一种通过文本-视觉提示协同工作来实现通用对象检测的方法。该项目采用Python编写,旨在提升目标检测的效率和准确性。
相关推荐
AI极客菌1 小时前
Controlnet作者新作IC-light V2:基于FLUX训练,支持处理风格化图像,细节远高于SD1.5。
人工智能·计算机视觉·ai作画·stable diffusion·aigc·flux·人工智能作画
阿_旭1 小时前
一文读懂| 自注意力与交叉注意力机制在计算机视觉中作用与基本原理
人工智能·深度学习·计算机视觉·cross-attention·self-attention
王哈哈^_^1 小时前
【数据集】【YOLO】【目标检测】交通事故识别数据集 8939 张,YOLO道路事故目标检测实战训练教程!
前端·人工智能·深度学习·yolo·目标检测·计算机视觉·pyqt
Power20246662 小时前
NLP论文速读|LongReward:基于AI反馈来提升长上下文大语言模型
人工智能·深度学习·机器学习·自然语言处理·nlp
数据猎手小k2 小时前
AIDOVECL数据集:包含超过15000张AI生成的车辆图像数据集,目的解决旨在解决眼水平分类和定位问题。
人工智能·分类·数据挖掘
好奇龙猫2 小时前
【学习AI-相关路程-mnist手写数字分类-win-硬件:windows-自我学习AI-实验步骤-全连接神经网络(BPnetwork)-操作流程(3) 】
人工智能·算法
沉下心来学鲁班2 小时前
复现LLM:带你从零认识语言模型
人工智能·语言模型
数据猎手小k2 小时前
AndroidLab:一个系统化的Android代理框架,包含操作环境和可复现的基准测试,支持大型语言模型和多模态模型。
android·人工智能·机器学习·语言模型
YRr YRr2 小时前
深度学习:循环神经网络(RNN)详解
人工智能·rnn·深度学习
sp_fyf_20243 小时前
计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-11-01
人工智能·深度学习·神经网络·算法·机器学习·语言模型·数据挖掘