大模型日报 2024-07-02

GPT01232024-07-04 8:26

大模型日报

2024-07-02

大模型资讯

Gemma 2 模型以 27B 的参数击败 70B 的 Llama 3-Instruct，成为开源模型性能第一，在 LMSYS Chatbot Arena 排行表现出色，但微调数据来源引争议。 🔗：http://www.jintiankansha.me/t/gHkDg76fPe
《奇点更近了》作者 Ray Kurzweil 预言 2045 年智能将扩展到 100 万倍，文中还提及计算能力增长和 AI 在医学领域应用。 🔗：http://www.jintiankansha.me/t/37eJiiIfLP
拓扑 Transformer 模型 TopoFormer 可将分子三维信息转化为药物相互作用模型可用数据，助力药物研发，研究发表在《Nature Machine Intelligence》。 🔗：https://www.jiqizhixin.com/articles/2024-07-02
长城汽车董事长魏建军直播展示长城汽车全场景 NOA 在重庆挑战性路段的实际表现，检验了 SEE 模型和全场景 NOA 的能力。 🔗：https://www.jiqizhixin.com/articles/2024-06-30-8
浙大、腾讯团队发布 SciKnowEval 评测基准评估大型语言模型的科学知识能力，国产大模型表现亮眼。 🔗：https://www.jiqizhixin.com/articles/2024-07-02-2
研究指出层标准化（Layer Normlization，LN）及其计算退化版本 RMSNorm 具有非线性表达能力，分组层标准化技术（LN-G）可加强其非线性。 🔗：https://www.jiqizhixin.com/articles/2024-07-02-4
麻省理工学院开发出全球首个神经连接机械腿，帮助截肢者恢复自然行走和空间感，相关论文发表于《自然医学》杂志。 🔗：https://www.jiqizhixin.com/articles/2024-07-02-5
普林斯顿大学教授承现峻认为大语言模型的种子可追溯到克劳德·香农 1951 年提出的预测下一个单词的问题。 🔗：https://www.jiqizhixin.com/articles/2024-07-02-6
国产 AI 编程助手豆包 MarsCode 上线，具备多项能力，能提高程序员工作和学习效率。 🔗：https://www.jiqizhixin.com/articles/2024-07-02-8
2024 年 7 月 4 日上海世博中心将举办 WAIC 2024 科学前沿主论坛，主题为"可信 AI，善治共享"，嘉宾阵容强大，将发布多项成果。 🔗：https://www.jiqizhixin.com/articles/2024-07-02-9
WAIC 2024 将于 7 月在上海世博中心等地举行，涵盖多重点话题，完整论坛日程安排已公布。 🔗：https://www.jiqizhixin.com/articles/2024-07-02-10

大模型产品

Arc 3.0：全球顶尖科技人才远程工作匹配

摘要: Arc是一个全球市场，汇集顶尖开发者、设计师和营销人员。通过HireAI，快速匹配自由职业和全职远程工作，覆盖190个国家的35万+专家。

Plus AI：快速生成专业PPT

摘要: 使用Plus AI，几分钟内即可创建专业PPT。无需学习新工具，直接在PowerPoint中生成，兼容性无忧。

Respired.io：AI社交媒体助手

摘要: Respired.io 提供经济实惠的AI驱动社交媒体管理，自动生成和安排Instagram、Facebook和LinkedIn的帖子。

AI梦想板：用AI可视化你的梦想

摘要: 使用AI梦想板，从照片和文字生成你梦想中的逼真图像，并包含AI生活教练帮助你规划和实现梦想。

Motiff: AI驱动的专业UI设计工具

摘要: Motiff提供AI工具箱、AI设计系统和Motiff实验室，助设计师提升10倍效率，确保设计一致性。

Summer AI：博客内容智能摘要按钮

摘要: Summer AI为您的博客内容添加智能摘要按钮，读者点击即可获取内容摘要和相关产品列表。

prompteasy.ai：5分钟内创建GPT微调数据集

摘要: 使用prompteasy.ai轻松微调GPT。与我们的AI聊天，根据您的需求从零开始创建微调数据集。

InsightAI：智能财务管理助手

摘要: 使用AI工具简化财务任务、检测欺诈、提升客户服务。支持Tally和Zoho，提供精准数据匹配、详细财务洞察和智能聊天机器人。

大模型论文

Web2Code: 网页到代码大规模数据集与评估框架

摘要: Web2Code 提供网页截图到HTML代码的转换数据集和评估框架，提升多模态大语言模型在网页理解和代码生成任务中的表现。

LLaRA：提升机器人学习数据的视觉语言策略

摘要: LLaRA框架通过将机器人动作策略表述为对话，利用视觉语言模型生成最优策略决策，显著提升机器人学习效果。

基于十亿角色的多样化数据合成方法

摘要: 提出一种利用大语言模型生成多样化合成数据的方法，介绍了包含十亿角色的Persona Hub，展示其在多种场景中的应用。

LLaVolta:高效多模态模型的阶段性视觉上下文压缩

摘要: LLaVolta通过阶段性视觉上下文压缩，在不损失性能的情况下显著提高多模态模型的训练效率和表现。

ProgressGym：道德进步对齐算法研究

摘要: 本文提出ProgressGym框架，通过学习历史文本中的道德进步机制，解决AI系统中道德对齐的挑战，并提供基准测试和开放排行榜。

Auto Cherry-Picker: 基于高质量生成数据的自动挑选

摘要: 提出Auto Cherry-Picker框架，通过大语言模型生成布局和图像，使用CLIS评估，提升下游任务性能，尤其在长尾分布和不平衡数据集上表现显著。

大模型事实验证中的分子化事实研究

摘要: 本文探讨了上下文在原子化事实中的作用，提出并量化了去上下文化对最小化的影响，提出了生成分子化事实的基线方法。

EVF-SAM: 文本提示的早期融合分割模型

摘要: 本文提出EVF-SAM，通过早期视觉-语言融合提升SAM的文本提示分割能力，在RefCOCO/+/g数据集上取得了最先进的性能。

基于多智能体协作的任务自动化框架

摘要: 本文提出了一种灵活的智能体工程框架，旨在通过多智能体协作解决复杂任务，适用于多领域工业应用。

BioMNER: 生物医学方法实体识别数据集

摘要: 本文提出了一个新的生物医学方法实体识别数据集，并探讨了多种NER方法，发现ALBERT与CRF结合效果最佳。

大模型开源项目

微软生成式AI入门教程

摘要: 微软推出18节课的生成式AI入门教程，使用Jupyter Notebook编写，帮助初学者快速上手生成式AI技术。

微软LLM技术快速集成工具

摘要: 微软提供了一款用C#编写的工具，帮助开发者快速、轻松地将前沿的LLM技术集成到应用程序中。

VinciGit00：AI驱动的Python爬虫

摘要: VinciGit00是一个基于AI的Python爬虫项目，能够高效地抓取并处理网页数据，适用于各种数据采集需求。

高速LLM推理工具

摘要: EricLBuehler项目提供了一个用Rust语言编写的超快LLM推理工具，显著提升推理速度。

Fabric: 开源AI增强人类框架

摘要: Fabric是一个用Python编写的开源框架，通过众包AI提示模块化解决特定问题，增强人类能力。

本文由mdnice多平台发布

上一篇：基于weixin小程序乡村旅游系统的设计

下一篇：小程序打包

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04AI科技热点日报 | 2026年07月01日 05幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？092026 年 AI 大模型 & AI 编程工具实战全总结 10【解构】DeepSeek V4 发布：技术报告深度解读 + 横向对比六大开源模型，我们的判断是……