苹果AI功能，GPU内存瓶颈，大气预测模型，Chrome内置Gemini

智源社区

刚刚！苹果发布Apple Intelligence，官宣免费接入ChatGPT，Siri迎来重磅更新

大模型竞速赛鸣枪开跑后，苹果似乎已经脱离了第一梯队，曾经的行业风向标并没有像其他大厂那样频繁地宣讲 AI，加之缺乏能够参与竞争的「明星产品」，其一度被贴上了「落后」的标签。但其实熟悉苹果的网友都知道，这是一家「重落地」的公司，更加擅长的是把创新技术工程化，实现「工程创新」。也正因如此，在生成式 AI 发展如火如荼之际，仍有很多网友在期待苹果的「划时代」产品。

如今，苹果终于「提枪上马」了。在刚刚结束的 WWDC24 主题演讲中，苹果发布了生成式 AI 模型 Apple Intelligence，并介绍了 iOS 18、Siri 等基于 Apple Intelligence 实现...

来源：

Nucleic Acids Res. | GPSFun：使用语言模型的几何感知蛋白序列功能预测

DRUGAI今天为大家介绍的是来自中山大学杨跃东团队的一篇论文。了解蛋白质功能对于阐明疾病机制和发现新药靶点至关重要。然而，蛋白质序列的指数增长与其有限的功能注释之间的差距正在扩大。在之前的研究中，作者开发了一系列方法，包括GraphPPIS、GraphSite、LMetalSite和SPROF-GO，用于蛋白质残基或蛋白质水平的功能注释。为了进一步提高这些方法的适用性和性能，作者现推出GPSFun，这是一款用于几何感知蛋白质序列功能注释的多功能网络服务器，结合了语言模型和几何深度学习以提升以往工具的性能。具体而言，GPSFun利用大型语言模型高效预测输入蛋白质序列的3D构象，并提取有用的序列...

来源：http://mp.weixin.qq.com/s?__biz=MzU2ODU3Mzc4Nw==\&mid=2247505451\&idx=1\&sn=49d2384e0504d79822c9b851ff25c7f6\&chksm=fd2ed1f543080afc6e2421c1e71c592ab2358d13f5c827116266d6302d0a253aa25c3820eda0\&scene=0\&xtrack=1#rd

5秒完成3D生成，真香合成数据集已开源，上交港中文新框架超越Instant3D

陈林投稿自凹非寺量子位 | 公众号 QbitAI使用大模型合成的数据，就能显著提升3D生成能力？来自上海交大、香港中文大学等团队还真做到了。他们推出Bootstrap3D框架，结合微调的具备3D感知能力的多模态大模型。这个框架能够自动生成任意数量的高质量的多视角图片数据，助力多视图扩散模型的训练。结果表明，新的合成数据能够显著提高现有3D生成模型的生成物体的美学质量和文本prompt的控制能力。目前，Bootstrap3D的数据集已经全面开源。用大模型合成数据近年来，3D内容生成技术迎来了飞速发展。然而，相对于2D图片生成，生成高质量的3D物体仍面临诸多挑战。其中核心的瓶颈即在于3D数据，...

来源：http://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==\&mid=2247732880\&idx=3\&sn=93a9097421f9b2657cf3f57aa02277de\&chksm=e9de2f3c47eba775093437ff1ebfeea603b49c664b13c3453b2dc6683dc429065ce799f59fb0\&scene=0\&xtrack=1#rd

博士论文 | 2024年Northwestern | 智能体建模：基于智能体的多级模型的设计与分析 319页

基于智能体的建模 (Agent-based modeling，ABM) 在复杂系统研究中发挥着关键作用，它允许研究人员研究个体之间的相互作用如何共同引起群体级和系统级行为。然而，从社会环境系统到肿瘤生物学再到交通建模等领域，越来越多地寻求对不同规模系统之间的相互作用进行建模。多级基于智能体的建模 (Multi-level agent-based modeling，ML-ABM) 扩展了经典的 ABM 技术以满足这一需求。尽管这种需求不断增长，但多级建模技术为建模过程带来了相当大的复杂性，尚未在 ABM 从业者中得到广泛采用。我们为广泛使用的 NetLogo ABM 平台...

来源：http://mp.weixin.qq.com/s?__biz=MzU4NTQyNjc5Mg==\&mid=2247490783\&idx=1\&sn=740b0693e854b51c429485da664b6ea5\&chksm=fcd3131f59086f6552ac9b122506ff4bfa4ad38cd0acd677e5aa2cc2a67a87ebedad9ec65a11\&scene=0\&xtrack=1#rd

AlphaFold3不开源，DeepMind商业化最大的一道坎来了

AlphaFold3的出现，对于整个生物医药都有巨大的意义。但因为其没有立刻开源，掀起了一场强烈的开源闭源争议，甚至遭到了科学界的抵制。据专业人士估计，像DeepMind那样训练AlphaFold3可能需要花费超过100万美元的云计算资源。对于如今动辄上亿美元的AI大模型军备赛不算什么，但也已经是非常多实验室无法承受的数字。尽管DeepMind立马"滑跪"，宣布将在6个月内面向学术界开源，但这个决定仍然不能让科学家们满意。学术进步岂能受到资本制约？已经有不少团体立项复现AlphaFold3，难不成DeepMind的商业化之路要断了？开源争议今年5月，Google DeepMind 和 Isom..

来源：http://mp.weixin.qq.com/s?__biz=MzkzMDQyNTY0Mw==\&mid=2247505443\&idx=1\&sn=c9cf2b73995a5b364ae06181851c7a71\&chksm=c3e79aca71d5cdac806bd40beb98ca00dbb591746d7e14a6eb6619d8818f0f89b3f29e8df716\&scene=0\&xtrack=1#rd

InfoQ

在这里，一起见证 AI 时代的数智化跃迁

InfoQ 中国成立17周年，继续与各位并肩前行。

来源：https://www.infoq.cn/article/pW4B4xse6Nh8MDTDhIKQ

国内科技企业和机构发力AI研发，50余篇论文入选顶会ICML2024

2024年国际机器学习大会（ICML2024）共收到9473篇论文投稿，最终录用了2609篇，接收率为27.5%。

来源：https://www.infoq.cn/article/Z4mcTK6XujWIoHbwJE6m

"都是调用的GPT？"ChatGPT、Claude、Perplexity、Gemini 同时都宕机了

"为什么三年之前就在到处宣扬的快速数字化转型，直到今天也无法实现站点的高效规模伸缩？"

来源：https://www.infoq.cn/article/rNDOUPUd2fCg32ykpgU1

抖音Android端图片优化实践

本文介绍抖音Android端通过使用BDFresco图片框架进行图片优化的实践、经验和价值，分享问题和解决策略，旨在为同行提供参考。

来源：https://www.infoq.cn/article/JDQ1rO5gAACNvZZU2SFi

操作系统与AI融合之路再进一步！首个AI原生开源操作系统，openEuler 24.03 LTS正式发布

本次发布会汇聚操作系统产业界顶尖力量，共探openEuler社区技术、生态、国际化发展。

来源：https://www.infoq.cn/article/cWVQffwgQdIg8xUmgDdF

ShowMeAI社区

打造AI爆款应用<新>黄金法则；盘点20款最流行AI搜索工具；ChatGPT对在线知识社区的影响；100万用户教会我的5个教训 | ShowMeAI日报

盘点 20 款最流行的AI搜索应用，你最喜欢哪几个？ [图片] 国内秘塔AI搜索 https://metaso.cn/ 好用，免费，国内 Top 水平天工AI (昆仑万维) https://www.tiangong.cn/ 好用，免费，技术实力 Top 且快速升级中简单搜索 App (百度) https://secr.baidu.com/ 只有手机版，规规矩矩的一款AI增强搜索应用 360 AI 搜索 https://so.360.com 最近数据增长蛮快的，综合体验比较流畅澜舟AI搜索 https://ai-search.langboat.com 中规中矩 BrainStorm ...

来源：https://zhuanlan.zhihu.com/p/698345703

又一款爆火AI游戏诞生！《换你来当爹》做对了什么？| ShowMeAI体验报告

现在是使用大语言模型 (LLMs) 构建产品的激动人心的时刻。在过去的一年中，LLMs 的表现已经"足够好"可以应用于现实世界。LLMs 改进的速度，加上社交媒体上的大量演示，将推动预计到 2025 年 AI 投资达到 2000 亿美元。LLMs 的广泛可用性，让每个人，而不仅仅是机器学习工程师和科学家，都能在他们的产品中构建智能。虽然构建 AI 产品的门槛已经降低，但要创建那些不仅仅是演示效果好的产品，仍然充满挑战。

来源：https://baoyu.io/translations/llm/what-we-learned-from-a-year-of-building-with-llms

测试 Chrome 内置 Gemini Nano 大语言模型 (4bit 3.25B) 的方法

如何测试 Chrome 内置的 Gemini Nano 大语言模型

来源：https://baoyu.io/blog/ai/how-to-enable-gemini-nano-for-chrome

问答：如何使用 GPT 知道我写 R 代码？

我用文字描述的方式请教 copilot 指导我写 R 代码（科研作图用），但效果不好。与此同时我查到一现成的完美代码，但因为看不懂，无法根据实际情况调整，所以也无法复现。这个时候我想让 copilot 帮我协调一下，即用现成的代码基础上根据我的说明进行调整，promote 我应该一次性说清楚，还是分多次？

来源：https://baoyu.io/blog/ai/qa-how-to-use-gpt-to-write-code

问答：有校对好的视频文稿如何用文稿纠正字幕错误？

我有校对好的视频文稿，但是 Whisper 生成的字幕有错误，我该如何用文稿纠正字幕错误？

来源：https://baoyu.io/blog/prompt-engineering/qa-how-to-correct-subtitle-with-text

什么是提示词注入攻击？ [译]

我们将介绍提示词注入的工作原理、常见类型以及潜在的风险和后果。你将了解提示词注入如何使得系统生成错误信息、编写恶意软件，甚至可能导致数据泄露和系统远程接管。视频还会探讨应对提示词注入的多种方法，包括数据审查、最小权限原则、人类反馈强化学习等。

来源：https://baoyu.io/translations/transcript/what-is-a-prompt-injection-attack

Github

Codium-ai/cover-agent

CodiumAI Cover-Agent: An AI-Powered Tool for Automated Test Generation and Code Coverage Enhancement! 💻🤖🧪🐞

来源：https://github.com/Codium-ai/cover-agent

BuilderIO/micro-agent

An AI agent that writes (actually useful) code for you

来源：https://github.com/BuilderIO/micro-agent

openrecall/openrecall

OpenRecall is a fully open-source, privacy-first alternative to proprietary solutions like Microsoft's Windows Recall. With OpenRecall, you can easily access your digital history, enhancing your memory and productivity without compromising your privacy.

来源：https://github.com/openrecall/openrecall

Bklieger/groqbook

Groqbook: Generate entire books in seconds using Groq and Llama3

来源：https://github.com/Bklieger/groqbook

SawyerHood/tlbrowse

Generate imagined websites on an infinite canvas

来源：https://github.com/SawyerHood/tlbrowse

本文档由扣子生成，资讯版权属于原作者。豆包机器人链接：https://www.coze.cn/store/bot/7343089859382444051?bot_id=true 一支烟花社区提供技术支持，了解更多点击：https://sourl.cn/MsNyXj