今日AI:GPT-4.5意外曝光可能6月发布、UP主借AI识别情绪播放量186万、全球首个AI程序员诞生

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解: AIbase - 智能匹配最适合您的AI产品和网站

📢一分钟速看版

▶OpenAI的GPT-4.5Turbo意外曝光,可能6月发布

▶全球首个AI程序员诞生 码农饭碗被砸

▶become-image:人物照片+参考照片可生成目标风格人物照

▶Paper-Piano纸上钢琴:只需一纸就能演奏钢琴

▶全球首部AI生成长电影首映门票售罄

▶B站UP主借AI识别情绪整活《亮剑》名场面播放量186万

▶DragAnything:拖动锚点精准控制视频物体和镜头运动

▶Llama-3基础训练设施公开,用了4.9万个H100

📰🤖📢AI新鲜事

OpenAI的GPT-4.5Turbo意外曝光,可能6月发布

【AiBase提要:】

  • 💡 OpenAI 的 GPT-4.5Turbo 被泄露,搜索引擎如 Bing 和 DuckDuck Go 在官方公告前索引了产品页面。

  • 💡 GPT-4.5Turbo 被描述为 OpenAI 迄今最快、最准确、最可扩展的模型,具有256,000个token的上下文窗口。

  • 💡 传言GPT-4.5Turbo 可能具有视频或3D 功能,但泄露的信息并未提及。

详情:OpenAI的 GPT-4.5 Turbo意外曝光,可能于 6 月发布

全球首个AI程序员诞生 码农饭碗被砸

【AiBase 提要:】

⚡ 全球首位 AI 软件工程师 Devin 诞生,掌握全栈技能,云端部署、底层代码、训练和微调 AI 模型。

⚡ Cognition 公司打造 Devin,开发团队拥有10块 IOI 金牌,震撼全网,影响深远。

⚡ Devin 的能力强大,能规划复杂工程任务、构建应用程序、自主查找代码库错误、训练微调 AI 模型。

详情:全球首个AI程序员诞生,码农饭碗一夜被砸!10块IOI金牌华人团队震撼打造,996写代码训练模型

谷歌限制Gemini回答与选举相关的查询

【AiBase提要:】

  • 🤖 Google 限制 AI 聊天机器人 Gemini 回答与今年将在多个国家举行的选举有关的查询。

  • 🌍 这一决定是为了减少在技术部署中潜在的错误。

  • 🇺🇸 除美国外,还有几个大国计划进行全国选举,包括南非、俄罗斯和印度。

详情:谷歌限制AI聊天机器人Gemini回答与选举相关的查询

全球首部AI生成长电影首映门票售罄

【AiBase提要:】

🎬 "Our T2Remake":全球首部完全由AI生成的电影,翻拍《终结者2》,在洛杉矶首映,引起热议。

🤖 电影内容:AI电影以OpenAI、ChatGPT和AGI为主题,由50位艺术家合作创作,使用多种AIGC工具完成。

🔄 网友反应:社交平台上网友对电影评价较少,一些人评论讽刺,用AI制作反AI的电影,具有讽刺意味。

详情:号称全球首部完全由AI生成长篇电影上映 首映门票售罄

B站UP主借AI识别情绪整活《亮剑》名场面播放量186万

【AiBase 提要:】

⭐️ B 站 UP 主 "佛辣西威" 用《亮剑》片段制作 AI 识别情绪视频。

⭐️ 视频播放量达186万,吸引众多网友关注,形成 "梗上加梗" 场面。

⭐️ 利用AI情绪识别技术,UP主在经典剧场面中加入戏剧性和幽默感,增加了视频趣味性。

详情:B站UP主借AI识别情绪玩法整活《亮剑》名场面播放量186万

Llama-3基础训练设施公开,用了4.9万个H100

【AiBase提要:】

⭐️ Meta 发布两个24KH100GPU 集群,也就是用了49152个H100用于 Llama-3大模型训练

⭐️ Llama-3采用 RoCEv2网络和 Tectonic/Hammerspace 的 NFS/FUSE 网络存储

⭐️ 预计 Llama-3将于4月末或5月中旬上线,将拥有600,000个 H100算力

详情:Llama-3公布基础训练设施,使用49,000个H100

2024生成式AI及AIGC应用洞察报告 国内前十AI应用月活用户5000万

【AiBase提要:】

📊 国内前十AI应用月活用户达5000万,相当于ChatGPT日活用户量;

👫 用户性别失衡,男性占比超75%,年龄主要25-35岁;

📈 抖音豆包三个月超越百度文心,月活用户增长40%;

📉 头部AI应用用户活跃率仅约10%,3日留存率平均30%;

🌟 微博和B站在AI内容平台表现突出,TGI接近200。

报告地址:Docs

🤖📱💼AI应用

become-image:人物照片+参考照片可生成目标风格人物照

【AiBase 提要:】

⭐️ 只要上传一张人物照片和一张参考风格的照片就可以将任何人脸图片转换成另一种风格的图像。

⭐️ 可调节生成图片的相关参数,包括保留原始人脸图像的程度、强度控制以及样式应用等。

⭐️ 可以选择添加一些特殊效果,如控制生成图片的噪声程度、固定随机种子以确保再现性等。

项目入口:cog-become-image使用入口地址 Ai模型最新工具和软件app下载

试玩地址:fofr/become-image -- Run with an API on Replicate

快手出品!DragAnything:拖动锚点精准控制视频物体和镜头运动

⭐️ 快手科技联合浙大研究团队提出了 DragAnything 方法,利用实体表示实现了对任何物体的运动控制。

⭐️ 可以精确控制物体的运动,生成高质量视频,用户只需在交互过程中绘制一条轨迹。

⭐️该技术技术还可以同时对多个对象实现不同的运动控制。

项目入口:https://top.aibase.com/tool/draganything

Paper-Piano纸上钢琴:只需一纸就能演奏钢琴

【AiBase提要:】

🎹 纸上钢琴,不需要购买真实钢琴,只需一张纸就能演奏音乐。

📹 项目支持最多2个手指,未来将支持更多手指及高度敏感的训练模型。

🛠️ 利用网络摄像头跟踪用户的手指移动,通过识别手指在纸上的位置来模拟钢琴键的按压。

项目入口:Paper-Piano使用入口地址 Ai其他最新工具和软件app下载

MDTv2开源,Sora 核心组件 DiT 训练提速10倍

【AiBase 提要:】

⭐️ 颜水成 / 程明明团队发布最新版本的论文和代码,开源 Masked Diffusion Transformer V2。

⭐️ 提出 Masked Diffusion Transformer V2在 ImageNet 上达到1.58的 FID score。

⭐️ 利用 mask modeling 表征学习策略大幅加速 DiT 的训练速度。

论文地址:https://arxiv.org/abs/2303.14389

项目入口:Masked Diffusion Transformer (MDT)使用入口地址 Ai模型最新工具和软件app下载

AI 图片橡皮擦来了!SPM实现精准擦除特定内容,还能改头换面

【AiBase 提要:】

⭐️ AI 图片橡皮擦技术,可以精准擦除特定概念,保留其他生成内容。

⭐️ 概念半透膜模型 (SPM),可在 Diffusion 架构的 AI 作图模型中实现概念擦除。

⭐️ SPM 技术框架包括轻量化 Adapter、微调策略和动态适配,提高模型擦除效果。

项目入口:SPM使用入口地址 Ai网站最新工具和软件app下载

今AI绘画提示词:自拍少女

图源备注:图片由AI生成,图片授权服务商Midjourney

提示词:Photography photo collection,A beautiful18-year-old Chinese girl is holding her phone and taking selfies in front of the camera. She is wearing a Korean white college style sweater, paired with a light blue checkered skirt, and wearing a light blue felt beret on her head, with a well-designed layout --ar16:9--v6.0--style raw

相关推荐
YRr YRr8 分钟前
深度学习:循环神经网络(RNN)详解
人工智能·rnn·深度学习
sp_fyf_202420 分钟前
计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-11-01
人工智能·深度学习·神经网络·算法·机器学习·语言模型·数据挖掘
多吃轻食24 分钟前
大模型微调技术 --> 脉络
人工智能·深度学习·神经网络·自然语言处理·embedding
北京搜维尔科技有限公司1 小时前
搜维尔科技:【应用】Xsens在荷兰车辆管理局人体工程学评估中的应用
人工智能·安全
说私域1 小时前
基于开源 AI 智能名片 S2B2C 商城小程序的视频号交易小程序优化研究
人工智能·小程序·零售
YRr YRr1 小时前
深度学习:Transformer Decoder详解
人工智能·深度学习·transformer
知来者逆1 小时前
研究大语言模型在心理保健智能顾问的有效性和挑战
人工智能·神经网络·机器学习·语言模型·自然语言处理
云起无垠1 小时前
技术分享 | 大语言模型赋能软件测试:开启智能软件安全新时代
人工智能·安全·语言模型
老艾的AI世界2 小时前
新一代AI换脸更自然,DeepLiveCam下载介绍(可直播)
图像处理·人工智能·深度学习·神经网络·目标检测·机器学习·ai换脸·视频换脸·直播换脸·图片换脸
翔云API2 小时前
PHP静默活体识别API接口应用场景与集成方案
人工智能