前言
上次体验了一款专注于AI推理的模型,感兴趣可以看往期:【初识Groq AI】,今天又了解到一个专注于AI推理的模型厂商,特此了解一番。
简介
SambaNova 是一家专注于人工智能(AI)工作负载的公司,致力于通过其创新的硬件和软件解决方案来彻底改变AI应用的性能。SambaNova 提供了世界上最快的AI推理平台,支持包括Llama 3.1、3.2和3.3在内的模型,并且对用户免费。公司的产品和技术旨在帮助开发者和企业快速部署和管理AI应用,特别是在需要高性能和高效率的场景下。
产品和服务
- SambaNova Cloud:利用SambaNova云服务,开发者可以构建他们之前无法实现的应用。例如,Blackbox.ai使用SambaNova云服务来支持代理工作流程,通过自主代理CyberCoder,开发者可以快速同时编辑多个文件,这在以前是一项复杂且耗时的任务。
- SambaNova Suite:这是一个完整的AI解决方案,包括精细调整、SambaStudio、基础模型和SN40L RDU。它提供了世界上最高效、准确和安全的AI平台,支持企业知识搜索、功能调用和代理RAG等功能。
- SN40L Reconfigurable Dataflow Unit (RDU):这是专为AI设计的创新硬件,具有数据流架构和三层内存设计,旨在支持最大的和最好的AI模型,推动代理AI的发展。SN40L RDU是全球最快的平台。
- DataScale:这是SambaNova的硬件系统,专为代理AI设计,能够快速部署生成式AI模型,满足任何规模组织的需求。DataScale系统在能源效率和小型化方面提供了卓越的性能。
优势
国内可正常访问
官网
官网地址:sambanova.ai
注册登录
使用SambaNova提供的服务需要进行注册登录,选择适合自己的方式注册登录
|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| |
|
Playground
官网地址:cloud.sambanova.ai
SambaNova提供的Chat服务需要登录,没有账号的可以参考上面的【注册登录】,登录成功后可进行正常的聊天操作
SambaNova Playground提供了 Meta、QWen 和 Llama 相关模型,按类型可分为 文本生成、视觉生成 和 音频生成 3类。
SambaNova Playground还提供了上下文代码接入,一键粘贴当前聊天上下文及代码
下面对这些模型进行一下简单测试,看看模型表现和响应时间方面的差异
文本聊天
第一个问题:模型信息
确实很快,瞬间完成了输出,总耗时 0.62s
第二个问题:将中文翻译为英文
不知道是不是提问方式的问题,AI一开始没理解我的意图,重新描述后得到了结果,转换和输出的过程依然很快。
代码生成
第一个问题:生成深度优先算法
不错,2.1s输出了,这么简单?,让AI写个单元测试验证一下
验证是成功的✅,这就有点强了👍🏻
第二个问题:使用html,css,js帮我写一个记账功能
总共耗时 4.12s,该平台不支持预览,将代码粘贴到本地查看,预览效果如下:
逻辑推理
以 Meta-Llama-3.3-70B 作为基础测试来测试大模型的表现
第一个问题:
鲁迅和周树人的关系
输出正确✅,看来这种问题已经难不倒现在的AI模型了
第二个问题:
小明妈妈7年前的年龄是小明的6倍,小明今天12岁,小明妈妈今天几岁?
回答正确✅
第三个问题:
Strawberry里有几个 r?
回答错误❌,这个问题牵扯到模型底层问题,让AI深度思考就会给出正确答案,这里不做深入。
第四个问题:
9.9和9.11哪个大?
换个模型,千问2.5回答的也有问题
文生图
没法直接根据提示词生成图片
长文本
模型输出限制,无法一次输出长文本
文件处理
文件处理,需要先切换到视觉模型,仅支持上传图片
首先让AI帮我们识别图片内容并以markdown格式输出
虽然它很快,但这输出的结果效果很差,完全不符合预期。那么再让他分析一下构图
API Key
妥善保管API Key,后续将不再展示
提示表示会禁用之前的API Key,点击【Confirm】确认
工具包
SambaNova提供了一个入门工具包,感兴趣的可以自行研究
产品定价
注册登录成功后,默认开启免费模式,可以免费使用UI开发和APIs调用,但是有一定的限制
社区
SambaNova有自己的社区平台,在社区平台可以查看最新信息、进行日常讨论以及提出自己的建议。
体验
SambaNova整体体验下来就一个感觉快,在文本处理、代码生成和逻辑推理方面表现很不错,不仅速度快,答案也比较准确,适合追求快速响应的场景。但也有遗憾的地方,SambaNova不支持长文本输出,不支持绘图,对文件处理方面还有待提高。
友情提示
见原文:世界上最快的AI推理?
本文同步自微信公众号 "程序员小溪" ,这里只是同步,想看及时消息请移步我的公众号,不定时更新我的学习经验。