1008 早早聊 AI 资讯|8G 内存老电脑轻松运行 Llama 2、微软摆脱英伟达?新 AI 芯片即将发布、英特尔暗示微软明年推出 Win12 系统...

👉👉原文链接👈👈

阅读详细图文,可访问知识库

「 行业动态 」

◇ 8G内存老电脑轻松运行 Llama 2 🔗 News

特斯拉前 AI 总监 Andrej Karpathy 创建了一个名为 llama2.c 的项目,允许用户在 PyTorch 中训练一个 baby Llama 2 模型。基于这个项目,有开发者创建了 Llama 2 Everywhere(L2E)项目,包括一个演示操作系统和内核模块,用于进行 Llama 2 推理。L2E 项目包含一些彩蛋,旨在确保在各种设备上的兼容性,可用于在不同文本源上训练小规模模型并在老旧计算机上运行,适用于互联网连接有限或无网络的环境。这个项目的最终目标是创建一个包容性的 AI 生态系统,适应多样化的环境,并赋能个人和社区,可以在各种 x86_64 操作系统上运行,具备便携性和独立性,可在 CPU/GPU 上运行。

◇ 英特尔暗示微软明年推出 Win12 系统,刺激 PC 换代需求 🔗 News

英特尔透露,2024 年将有一场"Windows 更新"来刺激 PC 换代需求,可能是 Windows 12。英特尔正在为下一代 Windows 12 准备 Meteor Lake 桌面平台,并包括 AI 协处理器。微软也在考虑在未来版本的 Windows 中集成更多 AI 功能,以增强用户体验和效率。微软已在 Windows 11 中添加了 AI 驱动的 Copilot,关注 AI,并添加了神经处理单元(NPU)芯片,以实现更高效的 AI 处理。

◇ 微软摆脱英伟达?下月推首款 AI 芯片,降低依赖 🔗 News

微软计划推出专为人工智能设计的芯片"雅典娜",旨在减少对英伟达的依赖并提供更多选择。该芯片将在微软 Ignite 大会上与英伟达的 H100 GPU 竞争,用于数据中心的人工智能加速。微软希望与英伟达的芯片相媲美,降低成本,同时减少依赖。雅典娜的性能细节尚不清楚,但微软希望与英伟达的 H100 相媲美。微软与 AMD 密切合作,也在人工智能芯片领域多样化,以满足不同需求。云计算竞争对手也采用类似策略,整合自己的人工智能芯片,以避免供应商锁定。

◇ MathCoder:提升数学推理能力超越 GPT-4 🔗 Twitter

MathCoder 通过微调开源语言模型,使其能够使用代码进行数学建模和推导,增强了数学推理能力,并在竞赛级别的数学问题上超过了 GPT-4。其工作原理包括代码生成、执行和结果解释,使模型能够生成、执行代码,然后根据执行结果进行自然语言推理。MathCoder 使用 MathCodeInstruct 数据集和有监督微调方法来提高大型语言模型在数学推理方面的能力,主要方法包括自然语言推理、代码执行和执行结果,以及使用特殊标记进行有监督微调。

◇ 分解大模型的神经元 !Claude 团队最新研究火了 🔗 News

Anthropic 公司利用字典学习将 500 个神经元分解为 4000 个可解释特征,解决了 AI 领域的可解释性问题。这些特征代表不同含义,如 DNA 序列、HTTP 请求等,通过激活特定特征可引导模型输出预期结果。字典学习是解决神经元多语义性的关键方法,稀疏自动编码器可生成更具单一语义的分析单元。Anthropic 发布了报告详细介绍他们的研究成果,包括 7 个关键结论、可解释特征的提取和应用。

AI 大牛景鲲离职百度! CIO 李莹接任小度 CEO 🔗 News

百度宣布李莹接替景鲲成为小度科技的新 CEO,旨在加强大模型在小度产品中的应用。李莹曾担任百度集团副总裁和首席信息官,主导百度产品基于文心大模型的重构。小度科技是百度的子公司,估值达 200 亿元人民币,致力于推出多种智能产品。景鲲是小度业务的创始人之一,担任百度副总裁和小度科技 CEO,推动智能硬件产品的发展。根据 2023 年第一季度的数据,小度科技在中国智能屏和智能音箱市场位居第一,估值暴涨至 355 亿元人民币。

◇ 生成式 AI 碳排放堪比开车往返月球? 🔗 News

生成式人工智能技术的发展引发了对碳排放和环境影响的担忧。虽然这些担忧被认为可能夸大了,但人们建议提高透明度,监测人工智能模型的碳排放,并采取措施减少环境影响。这些措施包括选择简单模型架构和适度权衡性能与碳排放,以及在长期中集成碳排放指标到 DevOps 或 MLOps 流程中。这些举措有助于充分发挥生成式人工智能技术的潜力,同时减轻其对环境的潜在影响。

◇ Stable Signature:将水印根植于潜在扩散模型中 🔗 Link

人工智能驱动的图像生成技术正在快速发展,带来了创意和易用性的同时,也引发了滥用和欺诈的担忧。例如,虚假的照片在网络上流传,让人难以分辨真假。为了防止滥用,一种名为"Stable Signature"的方法被提出,它涉及到联合训练、水印提取和微调生成模型等步骤。该方法具有低误报率和应对图像修改的优势,同时与微调模型兼容。然而,技术的快速发展需要负责任的研究和共享,并标记生成的图像内容。未来这种技术可能集成到更多的生成 AI 模型中,但也会存在局限性。

◇ 大型语言模型的易受欺骗性和轻信性 🔗 Twitter

大型语言模型(LLMs)虽然具备强大的语言生成能力,但其容易被欺骗和轻信的科学背后原因在于它们缺乏真正的理解,对输入敏感,容易接受误导性或虚假信息。LLMs 的行为受培训数据和信息流的影响,它们可能坚持内部知识而拒绝与之冲突的外部信息,更容易接受精心制作的错误信息,受众所知的主题更加固执,对证据的顺序敏感,倾向于跟随多数人,容易受无关信息干扰。尽管 LLMs 具有令人印象深刻的语言生成能力,但它们缺乏真正的理解,因此如何处理它们生成的内容应该由人类来决定,而不是依赖于人工智能。

◇ BBC 阻止 OpenAI 抓取数据,对人工智能用于新闻持开放态度 🔗 News

BBC 发布了使用生成型人工智能(Gen AI)的原则,重点关注新闻、档案和个性化体验领域的研究和制作。BBC 认为人工智能技术提供了为观众和社会带来更多价值的机会,并提出了以公众利益为出发点、优先考虑人才和创造力、保持对 AI 生成内容的开放和透明态度等指导原则。BBC 将与科技公司、其他媒体组织和监管机构合作,安全开发生成式人工智能,以维护新闻行业的信任。此外 BBC 还阻止了 OpenAI 和 Common Crawl 等网络爬虫访问其网站,以维护许可费支付者的利益。其他新闻机构也采取了类似措施,阻止网络爬虫访问他们的受版权保护的内容。

◇ 各行业的艺术家正在围绕人工智能问题共同制定战略 🔗 News

艺术家们对人工智能在创意产业的迅速发展表示担忧,呼吁采取行动以防止技术对创意社区造成损害。数字版权组织"为未来而战"与音乐工会"联合音乐家和联合工人"合作发起了#AIdayofaction,呼吁国会阻止企业获取人工智能艺术作品的版权。此举旨在阻止大型唱片公司等使用人工智能制作的音乐获得版权,以鼓励人类参与创作。同时,创意产业也看到了人工智能自动化在个人层面可能带来的益处,但音乐家们担心唱片公司滥用人工智能技术。联邦贸易委员会主办圆桌会议,研究生成式人工智能对创意人员的影响。

◇ 2023 年人工智能十大关键意见领袖 🔗 Twitter

AI 相关网站访问量统计 Top30-9 月 🔗 Twitter

「 融资快讯 」

◇ 英伟达 3200 万美元领投「Machina」 🔗 News

Machina Labs 是一家结合 AI 和机器人技术的创新制造企业,已完成由英伟达旗下风投部门 NVenture 领投的 3200 万美元融资,累计融资达 4500 万美元。他们开发了机器人工匠平台,通过 7 轴机器人和人工智能流程模型进行快速迭代和生产,团队来自多个领域,包括机器人专家、材料科学家、软件工程师等。Machina 旨在构建下一代制造业,设计不同的商业模式和产品线,以满足多种公司的需求,从概念验证到内部生产规模扩大。目前 Machina 的 AI 工厂将应用于多个领域,受到投资方和合作伙伴的高度期待。

「 早点趣玩 」

◇ 开源论文神器 DocsGPT 登顶 GitHub 热榜! 🔗 News

DocsGPT 是一款由 ARC53 开发的文档管理工具,使用 GPT-3.5 等技术,支持多种文档类型和模式,包括免费和付费版本。在 GitHub 上受到热烈欢迎,并提供了网页端、本地化部署和 Chrome 插件版本。与 Claude 相比,DocsGPT 注重结果分析,并且有专门的 DocsGPT-7b 开源模型进行优化。使用 DocsGPT 需要上传文档或提供论文内容,然后可以提问。DocsGPT 还提供了提示指南、本地部署和 Chrome 插件安装指南。

「 技术阅读 」

◇ 如何构建"星球级"RAG 🔗 Twitter

Arcus 是一个数据驱动的平台,利用检索增强生成(RAG)技术,整合内外部数据,提升人工智能应用性能。它自动发现适合每个 AI 应用的数据,提供实时信息,可用于不同领域,如财务文件,以改进检索和性能。

相关推荐
吃个糖糖1 分钟前
37 Opencv SIFT 特征检测
人工智能·opencv·计算机视觉
麦田里的稻草人w7 分钟前
【YOLO】(基础篇一)YOLO介绍
人工智能·python·神经网络·yolo·机器学习
BTColdman124 分钟前
探索 Pencils Swap 的叙事:为 DeFi 的再次爆发蓄力
人工智能·区块链
Do1phln31 分钟前
论文阅读 - 《Large Language Models Are Zero-Shot Time Series Forecasters》
论文阅读·人工智能·语言模型
小嗷犬37 分钟前
【论文笔记】Visual Alignment Pre-training for Sign Language Translation
论文阅读·人工智能·机器翻译·多模态·手语翻译·手语识别
GPT祖弘1 小时前
【Agent】Chatbot、Copilot与Agent如何帮助我们的提升效率?
人工智能·copilot
Ainnle1 小时前
VS Code AI开发之Copilot配置和使用详解
人工智能·copilot
司南OpenCompass1 小时前
CompassArena新升级:Judge Copilot提升竞技体验,新一代Bradley-Terry模型还原模型真实能力
人工智能·语言模型·大模型·大模型评测·opencompass
zaim11 小时前
计算机的错误计算(一百九十二)
人工智能·ai·大模型·llm·错误·误差/error·余割/csc
敖行客 Allthinker1 小时前
让 AMD GPU 在大语言模型推理中崭露头角:机遇与挑战
人工智能·语言模型·自然语言处理