0731 早早聊 AGI 资讯|杭州政府发钱助力中小企业算力、DeepMind 推出机器人与医疗领域大模型...

👉👉 AGI 早早聊知识库

「 行业动态 」

杭州政府发钱啦 每年 5000 万 " 算力 券"支持中小企业 🔗 News

市政府提出了加快推进人工智能产业创新发展的意见,目标是在 2025 年打造全国领先、国际一流的人工智能产业高地,促进人工智能与实体经济深度融合,建设"高算力+强算法+大数据"的产业生态。

机器人| 大模型 进现实世界 DeepMind 重量级突破 🔗 Link

DeepMind 推出 RT-2:全球第一个控制机器人的视觉-语言-动作模型,机器人可以像 ChatGPT 一样通过简单的自然语言指令操纵物体,这代表着具身智能的重大进展。

◇ 医疗保健 |Google 推出医用 多模态 生成 模型 Med-PaLM M 🔗 Link1 Link2

Google Health、Google Deepmind 和 Google AI 推出了 Med-PaLM M,这是一种多模态 LLM,可以灵活编码和解释生物医学数据,处理临床语言、医学图像和基因组学等任务,表现优异。

  • Med-PaLM M 通过对 Google AI 的语言模型 PaLM-E 进行微调和调整,使用 MultiMedBench 的开源基准构建,甚至优于专业模型和 PaLM-E。
  • MultiMedBench 包含 7 种生物医学数据类型和 14 种不同的任务,鼓励开发通用生物医学 AI 系统。

AI 创作 科幻电影《创世纪》 预告片 震撼登场 🔗 Link

《创世纪》是一部使用多种 AI 工具制作的火爆科幻电影预告片,制作者 Nicolas Neubert 在其中运用了 Midjourney、Runway、Pixabay 和 CapCut 等工具来完成图像、视频、音乐和剪辑等制作过程。

华为超级 大模型 基建: AI 算力 平台先遣组、数据中心军团 🔗 Link

华为在内部会议中宣布成立"AI 算力平台先遣组"和"数据中心军团",对标英伟达、Azure 和 Open AI,旨在全力支持国内大模型的算力需求,并发布了华为云盘古大模型 3.0,应用于多个领域。

  • "AI 算力平台先遣组"由陶景文担任组长,成员包括多个业务线的总裁或 VP。
  • "数据中心军团"由邹志磊领导,他曾担任华为原运营商 BG 总裁,现为华为煤炭军团董事长。
  • 华为发布了 AI 大模型华为云盘古大模型 3.0,已应用于煤矿、铁路、气象、金融、代码开发、数字内容生成等领域。
  • 华为三大数据中心预计投入使用 10W 张卡,华为云总裁张平安负责卡的规划建设与资源利用。

训练数据 质量不行?Skill-It:用于理解和训练 LMs 的数据驱动框架 🔗 Twitter1 Twitter2

正如人类以有意的顺序获得相互依赖的技能一样,语言模型在从训练数据中学习一组技能时也遵循自然顺序。如果存在这样的顺序,它可以用于增进对 LM 的理解和数据高效的训练。Skill-It 框架正是根据相关数据形式化了技能和有序技能集的概念。

paper: 《Skill-it! A Data-Driven Skills Framework for Understanding and Training Language Models》

「 融资快讯」

◇ 提供数据 Pipeline 大模型 中间件能力,「灵奥科技」宣布完成数百万美元 种子轮 融资 🔗 News

灵奥科技近完成数百万美元的种子轮融资,投资方为靖亚资本和 Plug and Play。灵奥科技致力于构建数据 Pipeline 和大模型中间件,当前主要提供两款产品:

  • Vanus Connect 可打通 SaaS 应用等业务工具,基于非结构化的业务数据,建立事件处理引擎,并针对不同来源的数据,基于用户的要求响应处理。
  • Vanus AI 可帮助企业链接大模型和构建知识库,并同时进行提示词(prompt engineering) 调试,搭建企业自己的 AI 应用。

◇ 00 后华人 大模型 创业,挑战 langchain,获硅谷顶级创始人投资 🔗 News

Cortex 背后的公司叫做 Kinesys AI,由两位华人创始人领导的 7 人团队发起,是一个大模型中间件项目,在国外已有 10 多家付费用户和上千个个人用户,并获得 Silicon Valley 顶级创始人的支持。

  • Cortex 允许外接私有数据库,包括 Notion、Slack、Google Drive 等,为特定领域提供定制版 GPT,同时可打造千人千面的 Copilot。
  • Cortex 团队计划接入 Slack confluence、Microsoft 全家桶和 Google 全家桶等,持续增加功能。

◇ Tromero 筹集了 150 万 英镑 ,通过加密货币挖矿降低 ****AI 训练 和托管成本 🔗 News

总部位于伦敦的机器学习训练和托管平台 Tromero 在由 BlueYard Capital 领投的种子轮融资中筹集了 150 万英镑。该初创公司将利用这笔投资组建团队,并在未来 12 个月内交付功能测试版。Tromero 通过区块链技术提供"Proof of Work"和"Proof of Useful Work",以解决机器学习培训需求,打破了现有云计算巨头如 AWS、Azure 和 Google Cloud 的垄断地位。

◇ 这到底是不是一门好生意?独家解密 Palantir 差异化竞争优势|深度研报(下篇) 🔗 News

深度研报揭示 Palantir 的赛道地位、竞争格局和六大视角的异化竞争优势:本体论、模块化、通用性、军事级护栏、高壁垒、高转换成本及高留存率、帮派文化。

  • Palantir 专注于数据整合,与大模型发展相结合,成为全球领头羊,具备军事级护栏。
  • Palantir 面临 ToG 和 ToB 市场竞争,与老牌军工企业和 AIP 同行竞争。
  • Palantir 产品项目制定制化,对客户关系要求高,需考验战略耐心。

「 早点趣玩 」

AI 视频创作十八法:超级工具合集让你轻松创作各种形式的视频! 🔗 News

文章整理了各种生成短视频的方法和工具,点击链接阅读对应教程。包含:

  • 图片转视频双雄:Runway Gen-2 和 AI 图片工具 Midjourney。
  • 文字生成视频三强:Runway Gen-2、Pikalabs 和 Zeroscope。
  • 使用 Midjourney 的 Vary、Pan、Zoom Out 功能制作视频。
  • 使用其他 AI 软件创作视频:Runway frame interpolation、Wonder Studio、Stable Diffusion 等。

◇ 眼镜内置字幕 🔗 Twitter

使用 Whisper 等语音转文本 API,更改语言将是最简单的部分。

用好 ChatGPT 为什么要在 ChatGPT 里面实现分析超长文本、上传并分析特定文件 🔗 Twitter

  • 免费使用
  • 方便自定义 prompt
  • 就在手边,不需要再打开新的工具
  • 数据直接发到 OpenAI,不经过中间人

操作指南:《讓免費版 ChatGPT 上傳文件的 Chrome 套件,可分析摘要超長內容》

AI 实时测谎仪, LiarLiar-AI 🔗 News

LiarLiar 是一款尖端的人工智能工具,能够在视频通话和视频分析过程中检测谎言和心率波动。易于使用并与所有流行的视频平台兼容。LiarLiar 使用计算机视觉神经网络模型来捕捉人的面部和身体动作,包括眼睛注视方向,甚至可以通过监测额头微动来确定一个人的心跳。利用数学将心理学转化成数字,并通过"真实度计"来综合所有因素,判断一个人是否说谎。

「 技术阅读 」

◇ 模块架构解析:一图带你了解 LangChain 的内部结构 🔗 Twitter

LangChain (JS) Modules Overview v0.2.0 released for npm:langchain@0.0.114.

  • feat: introduce agents and callbacks
  • fix: correct some data flow arrows

Meta ****AI 公布了有关 Llama 2 架构、训练计算、微调方法等更多细节 ****🔗 Twitter

论文发布了关于 Llama 2 架构、训练计算和微调方法的详细信息,使社区能够以其为基础,并为 LLMs 的负责任发展做出贡献。Llama-2 具备在 GPU 或 CPU 上本地运行,并支持不同规模和硬件的推理。

paper: 《Llama 2: Open Foundation and Fine-Tuned Chat Models》

◇ 一文读懂 Transformer:Transformer 神经网络 架构的整体指南 🔗 News

Transformer 模型是一种神经网络架构,于 2017 年提出,革命性地影响了深度学习和计算机科学。它成功应用于序列到序列建模,克服了其他神经网络架构的局限性。关键词解读:

  • MLPs (多层感知器) 一种经典神经网络方法,使用广泛但不适合序列建模,因为无法保留序列中信息的顺序。
  • CNN(卷积神经网络)对于图像和模式处理非常成功,但不适用于序列建模,因为无法处理可变长度的数据。
  • RNN(循环神经网络) 能够处理序列,但对于长序列可能不稳定,而且无法并行化。
  • Transformer 是一种能够处理序列数据的神经网络架构,不使用循环或卷积层,其核心是 Attention 机制。
  • Transformer 包含编码器和解码器两个部分,多层感知器 (MLP) 是其中一个基本层。

◇ 什么是 AI 的"智能涌现",以及为什么理解它对创业者、从业者、普通人都价值巨大 🔗 News

本文介绍了 AI 大模型中的智能涌现现象,通过图像实验演示了涌现的过程和阈值,并强调

  • 对创业者:理解涌现有助于看清 AI 发展前景和终局思维的重要性。
  • 对从业者:理解涌现可帮助指引 AI 工作并理解 AI 能力的本质。
  • 对所有人:通过涌现的理解,拥有更好的预判力和适应 AI 时代的能力。

◇ 简单微调 Llama 2 指南 🔗 News

本指南展示如何将 Llama 2 微调为对话摘要器,并介绍使用 Huggingface 库在 samsum 对话摘要数据集上的微调步骤。

  • 📚 首先,下载模型克隆 Meta 的 Llama 推理存储库:git clone github.com/facebookres... download.sh,以获取 7B 模型。
  • 🔄 接着,将模型转换为 Hugging Face 格式,执行以下命令:
ruby 复制代码
wget https://raw.githubusercontent.com/huggingface/transformers/main/src/transformers/models/llama/convert_llama_weights_to_hf.py
pip install git+https://github.com/huggingface/transformers
pip install -e .
python convert_llama_weights_to_hf.py \
  --input_dir llama-2-7b --model_size 7B --output_dir models_hf/7B
  • 💻 运行微调笔记本的步骤:

    • 克隆 Llama-recipies 存储库:git clone github.com/facebookres...
    • 打开 quickstart.ipynb 文件并运行整个笔记本,确保更改模型路径为转换后的模型路径。
  • 🧠 对微调后的模型进行推理的步骤:

    • 导入所需库:import torch, from transformers import LlamaForCausalLM, LlamaTokenizer, from peft import PeftModel, PeftConfig
    • 加载分词器和模型:tokenizer = LlamaTokenizer.from_pretrained(model_id),model = LlamaForCausalLM.from_pretrained(model_id, load_in_8bit=True, device_map='auto', torch_dtype=torch.float16)
    • 从训练后保存的位置加载适配器:model = PeftModel.from_pretrained(model, "/root/llama-recipes/samsungsumarizercheckpoint")
    • 运行推理并生成对话摘要。

「 招聘信息 」

HC 曝光,简历投递可联系小助手(wx:wongmicky)

「 讲师招募 」

2023 年 8 月 26 日,早早聊计划举办线上【前端搞构建】专场

📃 讲师报名,可联系早早聊负责人 Micky (wx:wongmicky)

🎙️ 可以聊聊:各类跨端、跨栈构建解决方案、构建的难点与挑战、Bundle 与 Bundleless 构建工具、本地/远程/上云构建方案、工程体积与构建性能、模块标准与模块规范、基于服务/浏览器的构建、分发等...

🎁 讲师福利,一次分享,即可享受:

  • 永久免费与会前端早早聊大会
  • 免费参与早早聊举办的酒蒙子局,认识更多技术人、创业人、AI 同行者
  • 线上招聘,社区优先简历内推
  • 还有更多等你来解锁...
相关推荐
AI极客菌3 小时前
Controlnet作者新作IC-light V2:基于FLUX训练,支持处理风格化图像,细节远高于SD1.5。
人工智能·计算机视觉·ai作画·stable diffusion·aigc·flux·人工智能作画
水豚AI课代表9 小时前
分析报告、调研报告、工作方案等的提示词
大数据·人工智能·学习·chatgpt·aigc
程序员X小鹿11 小时前
全部免费!6款AI对口型神器,让照片开口说话唱歌,早晚用得上,建议收藏!(附保姆级教程)
aigc
真忒修斯之船11 小时前
大模型分布式训练并行技术(三)流水线并行
面试·llm·aigc
学习前端的小z13 小时前
【AIGC】如何通过ChatGPT轻松制作个性化GPTs应用
人工智能·chatgpt·aigc
光芒再现dev14 小时前
已解决,部署GPTSoVITS报错‘AsyncRequest‘ object has no attribute ‘_json_response_data‘
运维·python·gpt·语言模型·自然语言处理
zzZ_CMing15 小时前
大语言模型训练的全过程:预训练、微调、RLHF
人工智能·自然语言处理·aigc
杰说新技术18 小时前
Meta AI最新推出的长视频语言理解多模态模型LongVU分享
人工智能·aigc
热爱跑步的恒川1 天前
【论文复现】基于图卷积网络的轻量化推荐模型
网络·人工智能·开源·aigc·ai编程
火山引擎边缘云1 天前
创新实践:基于边缘智能+扣子的智慧婴儿监控解决方案
物联网·aigc·边缘计算