技术栈
多模态gui agent
一直会游泳的小猫
2 小时前
开源
·
字节跳动
·
bytedance
·
多模态gui agent
UI-TARS-desktop
UI-TARS(User Interface - Task Automation through Reasoning and Self-play,用户界面 - 通过推理与自博弈实现任务自动化)是字节跳动(ByteDance)研究团队开发的开源 GUI Agent(图形用户界面智能代理)应用栈。它基于原生多模态大语言模型(Native Multimodal LLM),能够通过自然语言指令自主控制计算机,实现桌面交互自动化。
我是有底线的