vivo发布2023 年度科技创新;阿里全新AI代理,可模拟人类操作手机

vivo 发布 2023 年度十大产品技术创新

近日,vivo 发布了「2023 年度科技创新」十大产品技术创新榜单,并将这些技术分为了 4 个板块。

「四大蓝科技」为 vivo 在去年推出的全新技术品牌,涵盖蓝晶芯片技术栈、蓝海续航系统、蓝心大模型、蓝河操作系统等。其中的 AI 蓝心大模型矩阵,在多个相关榜单的排名都是第一梯队的水准,并且覆盖十亿、百亿、千亿三个参数量级。

影像算力方面,vivo 发布的了 6nm 影像芯片 V3,能效提升了 30%,并且用 AIGC 等新技术,赋能手机影像。

性能创新方面,vivo 发布了自研电竞芯片 Q1,通过芯片优化设计和自研算法提升,实现真正的低时延插帧。

阿里全新多模态 AI 代理,可模拟人类操作手机

Mobile-Agent 是阿里巴巴和北京交通大学开发的可以模拟人类操作手机的自主多模态 AI 代理。该项目利用人工智能技术,特别是在多模态大型语言模型(如 GPT-4V)的应用,以实现移动设备代理的自主决策和交互。

Mobile-Agent 首先利用视觉感知工具来准确识别和定位应用程序前端界面中的视觉和文本元素。基于感知到的视觉上下文,它会自主规划和分解复杂的操作任务,并逐步导航移动应用程序进行操作。

实验结果表明 Mobile-Agent 取得了显著的准确率和完成率。即使有挑战性的指令,例如多应用程序操作,Mobile-Agent 仍然可以完成要求。

Mobile-Agent 最大的特点为:

* 纯可视化解决方案,独立于 XML 和系统元数据。

* 操作范围不受限制,可进行多应用操作。

* 多种视觉感知工具,用于操作定位。

* 无需探索和培训,即插即用。

相关推荐
曦月逸霜1 小时前
啥是RAG 它能干什么?
人工智能·python·机器学习
AI医影跨模态组学1 小时前
Lancet Digit Health(IF=24.1)广东省人民医院刘再毅&南方医科大学南方医院梁莉等团队:基于可解释深度学习模型预测胶质瘤分子改变
人工智能·深度学习·论文·医学·医学影像·影像组学
应用市场1 小时前
AI 编程助手三强争霸(2026 版):Claude、Gemini、GPT 各自擅长什么?
人工智能·gpt
AC赳赳老秦2 小时前
供应链专员提效:OpenClaw自动跟踪物流信息、更新库存数据,异常自动提醒
java·大数据·服务器·数据库·人工智能·自动化·openclaw
脑极体2 小时前
从Token消耗到DAA增长,AI价值标尺正在重构
人工智能·重构
csdn小瓯2 小时前
LangGraph自适应工作流路由机制:从关键词匹配到智能决策的完整实现
人工智能·fastapi·langgraph
QYR-分析2 小时前
高功率飞秒激光器行业发展现状、市场机遇及未来趋势分析
大数据·人工智能
AI医影跨模态组学2 小时前
J Clin Oncol(IF=43.4)美国Cedars-Sinai医学中心等团队:基于计算组织学人工智能的晚期胰腺癌化疗选择预测性生物标志物的开发与验证
人工智能·机器学习·论文·医学·医学影像·影像组学
冬奇Lab3 小时前
RAG 系列(十六):Graph RAG——用知识图谱解决多跳关系问题
人工智能·llm
冬奇Lab3 小时前
一天一个开源项目(第101篇):OpenHuman - 真正懂你的本地优先个人 AI 超级助手
人工智能·开源·资讯