大模型日报
2024-07-02
大模型资讯
- Gemma 2 模型以 27B 的参数击败 70B 的 Llama 3-Instruct,成为开源模型性能第一,在 LMSYS Chatbot Arena 排行表现出色,但微调数据来源引争议。 🔗:http://www.jintiankansha.me/t/gHkDg76fPe
- 《奇点更近了》作者 Ray Kurzweil 预言 2045 年智能将扩展到 100 万倍,文中还提及计算能力增长和 AI 在医学领域应用。 🔗:http://www.jintiankansha.me/t/37eJiiIfLP
- 拓扑 Transformer 模型 TopoFormer 可将分子三维信息转化为药物相互作用模型可用数据,助力药物研发,研究发表在《Nature Machine Intelligence》。 🔗:https://www.jiqizhixin.com/articles/2024-07-02
- 长城汽车董事长魏建军直播展示长城汽车全场景 NOA 在重庆挑战性路段的实际表现,检验了 SEE 模型和全场景 NOA 的能力。 🔗:https://www.jiqizhixin.com/articles/2024-06-30-8
- 浙大、腾讯团队发布 SciKnowEval 评测基准评估大型语言模型的科学知识能力,国产大模型表现亮眼。 🔗:https://www.jiqizhixin.com/articles/2024-07-02-2
- 研究指出层标准化(Layer Normlization,LN)及其计算退化版本 RMSNorm 具有非线性表达能力,分组层标准化技术(LN-G)可加强其非线性。 🔗:https://www.jiqizhixin.com/articles/2024-07-02-4
- 麻省理工学院开发出全球首个神经连接机械腿,帮助截肢者恢复自然行走和空间感,相关论文发表于《自然医学》杂志。 🔗:https://www.jiqizhixin.com/articles/2024-07-02-5
- 普林斯顿大学教授承现峻认为大语言模型的种子可追溯到克劳德·香农 1951 年提出的预测下一个单词的问题。 🔗:https://www.jiqizhixin.com/articles/2024-07-02-6
- 国产 AI 编程助手豆包 MarsCode 上线,具备多项能力,能提高程序员工作和学习效率。 🔗:https://www.jiqizhixin.com/articles/2024-07-02-8
- 2024 年 7 月 4 日上海世博中心将举办 WAIC 2024 科学前沿主论坛,主题为"可信 AI,善治共享",嘉宾阵容强大,将发布多项成果。 🔗:https://www.jiqizhixin.com/articles/2024-07-02-9
- WAIC 2024 将于 7 月在上海世博中心等地举行,涵盖多重点话题,完整论坛日程安排已公布。 🔗:https://www.jiqizhixin.com/articles/2024-07-02-10
大模型产品
- 摘要: Arc是一个全球市场,汇集顶尖开发者、设计师和营销人员。通过HireAI,快速匹配自由职业和全职远程工作,覆盖190个国家的35万+专家。
- 摘要: 使用Plus AI,几分钟内即可创建专业PPT。无需学习新工具,直接在PowerPoint中生成,兼容性无忧。
- 摘要: Respired.io 提供经济实惠的AI驱动社交媒体管理,自动生成和安排Instagram、Facebook和LinkedIn的帖子。
- 摘要: 使用AI梦想板,从照片和文字生成你梦想中的逼真图像,并包含AI生活教练帮助你规划和实现梦想。
- 摘要: Motiff提供AI工具箱、AI设计系统和Motiff实验室,助设计师提升10倍效率,确保设计一致性。
- 摘要: Summer AI为您的博客内容添加智能摘要按钮,读者点击即可获取内容摘要和相关产品列表。
- 摘要: 使用prompteasy.ai轻松微调GPT。与我们的AI聊天,根据您的需求从零开始创建微调数据集。
- 摘要: 使用AI工具简化财务任务、检测欺诈、提升客户服务。支持Tally和Zoho,提供精准数据匹配、详细财务洞察和智能聊天机器人。
大模型论文
- 摘要: Web2Code 提供网页截图到HTML代码的转换数据集和评估框架,提升多模态大语言模型在网页理解和代码生成任务中的表现。
- 摘要: LLaRA框架通过将机器人动作策略表述为对话,利用视觉语言模型生成最优策略决策,显著提升机器人学习效果。
- 摘要: 提出一种利用大语言模型生成多样化合成数据的方法,介绍了包含十亿角色的Persona Hub,展示其在多种场景中的应用。
- 摘要: LLaVolta通过阶段性视觉上下文压缩,在不损失性能的情况下显著提高多模态模型的训练效率和表现。
- 摘要: 本文提出ProgressGym框架,通过学习历史文本中的道德进步机制,解决AI系统中道德对齐的挑战,并提供基准测试和开放排行榜。
- 摘要: 提出Auto Cherry-Picker框架,通过大语言模型生成布局和图像,使用CLIS评估,提升下游任务性能,尤其在长尾分布和不平衡数据集上表现显著。
- 摘要: 本文探讨了上下文在原子化事实中的作用,提出并量化了去上下文化对最小化的影响,提出了生成分子化事实的基线方法。
- 摘要: 本文提出EVF-SAM,通过早期视觉-语言融合提升SAM的文本提示分割能力,在RefCOCO/+/g数据集上取得了最先进的性能。
- 摘要: 本文提出了一种灵活的智能体工程框架,旨在通过多智能体协作解决复杂任务,适用于多领域工业应用。
- 摘要: 本文提出了一个新的生物医学方法实体识别数据集,并探讨了多种NER方法,发现ALBERT与CRF结合效果最佳。
大模型开源项目
- 摘要: 微软推出18节课的生成式AI入门教程,使用Jupyter Notebook编写,帮助初学者快速上手生成式AI技术。
- 摘要: 微软提供了一款用C#编写的工具,帮助开发者快速、轻松地将前沿的LLM技术集成到应用程序中。
- 摘要: VinciGit00是一个基于AI的Python爬虫项目,能够高效地抓取并处理网页数据,适用于各种数据采集需求。
- 摘要: EricLBuehler项目提供了一个用Rust语言编写的超快LLM推理工具,显著提升推理速度。
- 摘要: Fabric是一个用Python编写的开源框架,通过众包AI提示模块化解决特定问题,增强人类能力。
本文由mdnice多平台发布