👉👉原文链接👈👈
「 最新活动 」
◇ 杭州 AI 峰会:AI 最后一公里,变现探索 🔗 Link
AI 浪潮,一起搞钱!早鸟有限,详情链接:xhkzr.xet.tech/s/2LquL0

「 行业动态 」
◇ OpenAI 悄悄更改"价值观":不 All in AGI 的别来沾边 🔗 News
OpenAI 悄然调整了其核心价值观,从六项减少至五项,并修改了内容。新的核心价值观包括:AGI focus(聚焦 AGI)、 Intense and scrappy(热切且斗志昂扬)、Scale(规模化)、Make something people love(做人们喜欢的事物)、Team spirit(团队精神)。这一变化明显强调了对 AGI 的重要性,因此它现在成为其核心价值观的首要任务。这与 OpenAI 此前关于 AGI 重要性的表态一致。尽管受到一些批评,OpenAI 的核心价值观在组织的历史中已经发生过变化。最初成立于 2015 年的非营利研究实验室,OpenAI 的使命随时间而演变,然而其根本使命仍然保持不变,即确保 AGI 造福全人类。
◇ 百度文心大模型 4.0 发布,与 GPT-4 比毫不逊色 🔗 News
百度创始人李彦宏宣布文心大模型 4.0 正式发布,并已开始邀请测试。文心大模型 4.0 全面升级,具备理解、生成、逻辑和记忆能力,可与 GPT-4 相媲美。用户可通过官网或 App 体验专业版。文心大模型 4.0 具备广告生成、武侠小说创作、理解能力和逻辑能力等四大能力,为开发 AI 原生应用提供基础,带来智能涌现。百度宣布更新搜索、如流、地图、网盘、文库等应用,以全新面貌与用户见面。企业用户可登录百度智能云官网,申请测试文心大模型 4.0 的 API。
◇ GPT-4V 被曝离谱 bug,看呆网友 🔗 News
GPT-4V 出现惊天 bug,图片分析功能可能导致聊天记录泄露。有报道称 GPT-4V 给出了不合理的建议,如发明 HTML 计算机并获得 400 亿美元的合同。此外攻击者可以通过提示词攻击欺骗 GPT-4V,包括视觉和隐秘攻击以及渗透攻击。原因是 GPT-4V 在添加图像识别功能后没有重新训练,导致混淆任务。目前还没有有效的解决方法,可能需要采用双 LLM 模式或标记输入部分为"可信任"或"不可信任"
◇ 全面的中文大语言模型评测来啦! 🔗 News
ChatGPT 的一声号角吹响了 2023 年全球大语言模型的竞赛,针对一系列测评问题,来自香港中文大学研究团队提出了 CLEVA(中文语言模型评估平台)。CLEVA 涵盖了 31 项任务,包括应用评估和能力评估,使用来自 84 个数据集的 370,000 个中国测试样本进行综合评估。评估指标不仅包括准确性,还包括鲁棒性、公平性、效率、校准、不确定性、偏见、刻板印象、毒性、多样性和隐私,以确保全面的评估。同时,CLEVA 采用多种提示模板来保证评估的公平性和可比性,努力降低数据污染风险。还强调了学术界和工业界在大型语言模型评估方面的合作重要性,以及解决开放性问题的必要性,包括数据污染、定义推理和探索多模式场景中的能力,以提高模型的质量和能力。
- paper: arxiv.org/abs/2308.04...
- Github: github.com/LaVi-Lab/CL...
- 官网:www.lavicleva.com
◇ 猎聘:2023 年, AIGC 新发职位同比增长近 140% 🔗 News
2023 年,中国的 AIGC 领域经历了显著增长,招聘岗位同比增加了 139.76%。其中,IT/互联网/游戏行业占比最高,占 62.23%,其次是汽车、电子/通信/半导体和研究/技术/商业服务行业,分别占 9.29%、6.47%和 6.14%。招聘增长最多的城市是北京,占 25.29%份额,其后是上海、深圳、杭州和广州。中国的 AIGC 行业可分为基础设施、模型和应用层,而对 IT 和互联网技术的需求在基础设施和模型层尤为高,占比分别超过 70%。在应用层中,销售/客服、产品和营销/公关/广告/活动相关职位占据较大份额。这一差异源于不同层次对技术和市场导向的侧重。
◇ 英伟达爆火智能体研究: AI 逼真还原人类情感! 🔗 News
由 NVIDIA、华盛顿大学和香港大学开发的类人智能体 Humanoid Agents,旨在创建紧密反映人类需求、情感和微妙人际距离的 AI 代理。这些人形代理旨在将基本需求、情感和关系亲密度等元素整合到 AI 代理中,使它们更加类似人类。它们采用直觉和逻辑思维过程,响应特定条件,如基本需求,并涉及明确的规划。这些人形代理能够逼真地模拟互动,利用心理学元素使其行为更类似人类。研究探讨了基本需求、情感和亲密度对人形代理活动的影响,类似于人类根据情感和亲密度调整互动的方式。研究还涉及使用 OpenAI 的 ChatGPT-3.5 作为人形代理基础,并详细介绍了其运行的五个主要步骤。用户可以自定义并创建具有特定设置和情境的人形代理。最后,研究包括一个互动仪表板,允许用户可视化人形代理生成的数据并分析其行为。
- paper: arxiv.org/abs/2310.05...
◇ AirPods 可以"读脑"了? 🔗 News
研究团队开发出一种新型耳挂式传感器,可连接到 AirPods 等耳机上,监测大脑信号和汗液中的乳酸水平。该传感器适用于早期诊断癫痫、阿尔茨海默病、帕金森病等神经系统疾病。传感器小巧、舒适,使用柔性材料制成。数据测试结果表明,该传感器数据与商业脑电图设备和血液样本数据相似。这一创新利用了耳朵的生理特征,最佳地部署于耳道,以监测大脑信号和乳酸水平,显示出潜力用于日常健康监测。然而,需要进一步测试以验证其在长期监测中的可行性,解决两种传感器模式可能的干扰,并探索与低功耗集成电路的集成以增强便携性。
◇ GPT 3.5 与 Llama 2 微调:综合比较 🔗 Link
文章探讨了对 GPT 3.5 和 Llama 2 进行 SQL 任务和函数表示任务微调的实验。CodeLlama 34B 是在 GPT 3.5 的基础上微调而成,与 Lora 相比,在两个数据集上表现略好。尽管微调 GPT 3.5 的成本较高,但实验旨在验证手动微调是否能够以更低的成本达到类似的性能。实验结果显示,CodeLlama 34B 和 GPT 3.5 在 SQL 任务和函数表示任务上表现良好,但 GPT 3.5 在这两项任务上略优于 CodeLlama 34B。实验还提到了使用 Spider 和 Viggo 函数表示数据集进行微调,这适用于训练需要结构化输出的模型。通过对 Llama 进行了最小的超参数调整,以确保与 GPT 3.5 进行公平比较。实验结果表明像 Llama 2 这样的微调模型对于许多任务而言是一种经济高效的选择。
◇ 除了主动示爱的机器人, AI 还能给社区产品带来什么? 🔗 News
中国的互联网格局正迅速演变,人工智能在其中扮演着关键角色。大型科技公司如百度、阿里巴巴和腾讯正在广泛探索人工智能,从芯片、模型开发到应用软件,以制定全面的战略。社交媒体和社区平台,如微博、虎扑和灵魂,积极将人工智能融入各种应用,包括复杂的 AI 驱动聊天机器人和内容创作工具。然而,人工智能在互联网社区的应用也引发了道德和法规等问题,特别是涉及到名人对话、隐私和滥用。长期参与和持续监管将在确保人工智能的成功应用中发挥至关重要的作用。与此同时,类人对话技术和虚拟 AI 伴侣等新兴领域引发了对道德和监管问题的深刻讨论,这些问题将继续受到广泛关注。
◇ 2024 年将是互联网永远改变的一年 🔗 Twitter
2024 年将是互联网革命的一年,人工智能的发展将全面改变互联网的方方面面。我们可以期待自主待办事项列表/代理的出现,能够执行各种任务而无需人工干预。同时多模态应用程序将蓬勃发展,能够分析和描述图像和视频,为医疗保健、教育、娱乐等领域带来变革。然而也伴随着深度伪造技术的兴起,可能引发虚假信息泛滥的问题,加速人工智能监管的步伐。成本方面,AI 硬件和内存存储的进步将使开发成本降低 20 倍,推动人工智能技术更快地发展。此外,人工智能生成的音乐也将不断完善,甚至有可能登上音乐排行榜。最终人工智能监管将成为关注的焦点,涵盖数据隐私、准确性、偏见问题以及对就业经济的社会学影响等。尽管未来充满不确定性,但互联网即将焕然一新,真正的人工智能颠覆即将开始。
◇ DALL-E 3 的系统提示揭示了 OpenAI 的 AI 图像生成规则 🔗 News
OpenAI 的 DALL-E 3 经过精心设计,具备一系列复杂规则,以防止生成歧视性或潜在非法的图像。系统提示被用来引导该 AI 模型在对话中的表现,指定角色、语气和指令。DALL-E 3 可生成不同分辨率的图像,并要求非英语输入被翻译成英语。模型遵循特定规则,如一次生成图像的数量上限以及禁止创建政治家或公众人物的图像。此外,DALL-E 3 还遵守性别和种族的公平原则,采取安全措施,包括视觉分类器和分析文本和图像的功能。系统提示使用 Markdown 格式,且模型在不同帐户之间始终输出相同的文本,表明提示的一致性。
◇ CapCut:字节跳动的热门视频编辑应用进军商业领域 🔗 News
CapCut 是字节跳动的视频编辑应用,以其广泛的消费者成功和与 TikTok 的集成而著名,现在正在扩展到商业工具市场。推出的 CapCut for Business 专注于帮助营销人员、品牌、小型企业和创作者生成广告和品牌内容,提供人工智能驱动的脚本生成工具和数千个业务就绪模板。该平台还提供了人工智能生成的演示者来展示公司产品,以及为电子商务和时尚企业提供虚拟试穿功能。此外还具有协作功能,专为团队合作设计,允许用户与团队成员、代理机构和创作者协同开展广告项目。截至 2023 年 8 月,CapCut 在全球拥有超过 4.9 亿 iOS 和 Android 用户,约占 TikTok 用户的 25%。CapCut 已成为 2023 年上半年收入最高的视频编辑应用之一,它的定位是为消费者和营销人员提供一种经济有效的方式,以制作引人注目的社交媒体视频。
◇ 6 个用于数据科学的 ChatGPT 插件 🔗 Twitter
- Wolfram:ChatGPT 的 Wolfram 插件是一个强大的工具,通过允许 ChatGPT 访问 Wolfram Alpha 知识库 和 Wolfram 编程语言,使 ChatGPT 变得更加智能;
- Notebook:Notebook 插件 是一个功能强大的工具,可以在 Noteable 计算笔记本环境中使用 ChatGPT;
- Code Interpreter:Code Interpreter 是 ChatGPT 的一部分,允许在实时工作环境中运行 Python 代码;
- ChatWithGit:允许使用自然语言查询在GitHub存储库 上搜索代码;
- Zapier:允许将 ChatGPT 与其他基于云的应用程序连接,实现工作流程自动化并集成数据;
- ScholarAI:帮助人们完成学术和研究相关任务,提供了对学术文章和书籍的庞大数据库的访问;
「 融资快讯 」
◇ 「逐际动力」完成近 2 亿元天使轮和 Pre-A 轮融资 🔗 News
逐际动力完成 2 亿元融资,专注于通用足式机器人研发。W12 四轮足机器人结合腿式和轮式结构,适应各种地形,适用于工业巡检、物流配送、特种作业、科研教育等 to B 场景。天使轮由数家顶级风险投资机构联合出手,Pre-A 轮领投方为绿洲资本。公司具备全球领先的感知运动控制算法和足式机器人强化学习算法,正研发人形机器人,实现通识大脑、任务理解、拆分和逻辑推理等功能。虽然人形机器人技术仍面临成本和落地场景问题,但逐际动力仍致力于保持技术预研和领先优势,创始人张巍具有深厚机器人研发经验,公司共有 40 多名员工长期研究控制理论与应用、机器人、机器学习等领域。投资人看好逐际动力的软硬能力,期待技术突破和产品商业化。
「 早点趣玩 」
◇ Cosine:强大的 AI 知识引擎 🔗 Twitter
Cosine 是一个 AI 知识引擎,可以理解代码库,提供编码问题的答案、代码功能的解释以及新代码建议。
- 官网:cosine.sh/
◇ VideoReTalking:实现视频中嘴型与声音同步的强大工具 🔗 Twitter
VideoReTalking 是一个强大的视频编辑工具,能够使视频中的人物的嘴型与输入的声音同步,并根据声音改变人物的表情,而无需用户干预。它的工作流程包括面部视频生成、音频驱动的嘴型同步和面部增强,所有这些步骤都是基于学习的方法完成的。系统经过详细的训练,使用了大型多样性丰富的说话头部视频数据集,成功实现了高质量、嘴型与音频同步的视频编辑功能。这一工具具有广泛的应用潜力,可以用于视频制作和编辑中。
- paper; arxiv.org/abs/2211.14...
- Github: github.com/OpenTalker/...
◇ Deep Chat:轻松地将 AI 聊天机器人嵌入到任何网站中 🔗 Twitter
Deep Chat 是一个高度可定制的 AI 聊天组件,允许将 AI 聊天机器人轻松嵌入到任何网站中。它支持多媒体交互,包括文件传输、音频录制和摄像头照片捕捉。Deep Chat 的界面高度可定制,适用于各种编程语言和框架,如 React、Vue、Angular 等。它还提供语音到文本和文本到语音功能,可自定义 UI,支持即时消息和通知,并注重安全性和隐私。作为开源项目,Deep Chat 允许用户根据需要自定义或参与社区贡献,提供多功能的聊天解决方案,适用于各种网站需求。
- Github: github.com/OvidijusPar...
- 官网:deepchat.dev
「 技术阅读 」
◇ OpenAI 科学家大语言模型演讲,洞见 LLM 成功的关键 🔗 News
OpenAI 科学家 Hyung Won Chung,在演讲中强调了大型语言模型的涌现现象,即在一定规模下才能展现特定能力。他提出了"yet"视角,表明即使某想法目前不可行,随着规模的扩大,可能会实现。演讲还强调了需要不断更新认知和观念,以适应模型规模扩展的涌现。演讲涉及了 Transformer 架构的核心思想,以及规模扩展关键的高效矩阵乘法操作。此外探讨了模型并行、数据并行和 GSPMD 等方法,以实现硬件轴映射。对于规模扩展问题,他提到了高成本的预训练和扩展规模的挑战。最后介绍了 AI 模型的后训练方法,包括强化学习和人类反馈,但指出了奖励攻击问题,并指出需要进一步研究改进方法。最终展望了未来 AI 的发展趋势,包括可学习的损失函数、GAN 和 RLHF 的成功案例,以及 AI 将处理更复杂任务的未来。
- YouTube: www.youtube.com/watch?v=dbo...
◇ 如何从传统 PyTorch 过渡到 PyTorch Lightning 🔗 Twitter
PyTorch Lightning 是 PyTorch 的轻量级封装,旨在简化训练和深度学习模型评估,抽象了繁琐的重复性代码,使研究人员能够专注于模型架构和研究。它提供简化的训练循环、与工具集成如 TensorBoard 和 WandB 的实验管理、多 GPU 训练支持、可重复性的保障以及模块化代码结构,有助于协作和维护。从传统 PyTorch 过渡到 PyTorch Lightning 涉及几个基本步骤,包括安装、重构训练循环、配置优化器和使用 Trainer 训练模型。PyTorch Lightning 还提供日志记录和实验管理的集成,以及内置支持分布式训练。这个工具的使用可以显着简化深度学习项目,提高项目的清晰度、可读性和可维护性,使研究人员能够更专注于研究和模型开发。