初识Groq AI

简介

Groq 是一家专注于高性能人工智能(AI)推理的公司。其核心产品是 LPU™ 推理引擎,这是一个硬件和软件平台,旨在提供卓越的计算速度、质量和能效。Groq 提供云端和本地解决方案,支持大规模 AI 应用。

Groq 的技术使开发者能够快速切换到 Groq 平台,只需更改三行代码即可从其他提供商(如 OpenAI)无缝迁移。Groq 支持多种开源 AI 模型,如 Llama、Mixtral、Gemma 和 Whisper,并且其速度在独立基准测试中得到了验证。

限制

  • 需要科学上网
  • 免费版可以进行基本测试不支持多模态

优势

快、速度很快

官网

官网地址:groq.com

注册登录

Groq AI的Chat需要注册登录,可以使用邮箱或者Google邮箱一键登录,为了方便这里我使用Google邮箱登录

登录成功后就可以正常使用Chat功能了

Chat基本使用

Chat模式不支持保存聊天记录

官网Chat地址:chat.groq.com

模型列表

Groq提供了 DeepSeek、Google、Meta、Mistral 的模型接入

DeepSeek系列:

  • deepseek-r1-distill-llama-70b

Google系列:

  • gemma2-9b-it

Meta系列:

  • llama-3.3-70b-specdec
  • llama-3.3-70b-versatile
  • llama-3.2-3b-preview
  • llama-3.2-1b-preview
  • llama-3.1-8b-instant
  • llama3-70b-8192
  • llama3-8b-8192

Mistral系列:

  • mixtral-8x7b-32768

文本对话

使用 deepseek-r1-distill-llama-70b 模型进行试验,看下是否支持实时获取网络信息

当我们询问最新的天气信息时AI没有给我们提供天气信息,好像不支持联网功能,再次向AI确认后得到了肯定答案(不支持联网搜索)。

可以看到Groq AI响应速度确实快,此次问题仅用 0.09秒

代码能力

问题:领扣76.最小覆盖子串

javascript 复制代码
给你一个字符串 s 、一个字符串 t 。返回 s 中涵盖 t 所有字符的最小子串。如果 s 中不存在涵盖 t 所有字符的子串,则返回空字符串 "" 。
请补全下面函数:
===
/**
 * @param {string} s
 * @param {string} t
 * @return {string}
 */
const minWindow = (s, t) => {
}
===
请注意我的要求:不要输出思考过程,直接输出代码结果

为什么强调不要输出思考过程呢,因为DeepSeek R1模型会输出大量思考过程,导致触发Groq上下文调用限制

限制模型输出才有可能得到答案😂

回答正确✅,在领扣上也通过了测试用例

逻辑推理

第一个问题:简单年龄推理

复制代码
小明妈妈7年前的年龄是小明的6倍,小明今年12岁,问小明今年妈妈几岁?

第二个问题:比大小

复制代码
9.9和9.11哪个更大?

答案和大多数模型一样都是直观的进行比较数值,需要我们进一步引导

复制代码
分场景分析,如版本号,日期等,比较9.9和9.11哪个更大?

经过我们的引导提示,这次给出了合理的答案。

第三个问题:strawberry中有几个"r"?

这次问题DeepSeek R1 70b表现不错,没有引导的情况下回答正确了✅

绘图

不支持文生图

文件处理

不支持上传文件

Groq Cloud

官网地址:console.groq.com/playground

Playground

官网地址:console.groq.com/playground

Playground提供了 CHat 和 Studio 两种模式,比Groq的独立Chat多内置了OpenAI的 whisper-large-v3 和 whisper-large-v3-turbo 模型,支持系统提示词和模型参数配置

使用Chat功能

Groq部署的DeepSeek R1 70b居然没有更正这个问题😢

真是主打一个嘴硬😡,换成 gemma2-9b-it 回答正确

Studio

Studio在Chat的基础上提供了自定义助手消息及可以选择性的插入相应回答内容到上下文。

点击【Add】可以将助手提示词加入对话中

点击【View Code】导出提示词内容

申请API Key

切换到【API Keys】点击【Create API Key】创建一个新的API Key

输入API Key名称,点击真人验证,验证通过后点击【Submit】进行提交

点击【Copy】保存API Key,妥善保管后续将不再展示

在Continue中使用

在VS Code中配置Continue插件,新增一个模型,Provider选择【Groq】,Model随便选吧(Continue插件中的模型列表不正确),填入申请的【API Key】,点击【Connect】

在VS Code中使用需要科学上网,具体配置可参考之前的文章:【VS Code】VSCode设置代理模式

不出意外的话是会报错的

手动修改Continue模型名称为 llama-3.3-70b-versatile

同样可以新增 deepseek-r1-distill-llama-70b

产品定价

产品套餐

Groq提供了 Free、Developer、Enterprise 3种产品套餐,免费版可以进行基本测试不支持多模态,免费版不够用可以考虑升级到开发版(按使用量抵扣)

模型费用

模型限制

体感

使用Groq AI的第一印象就是快,非常快,直接刷新了我对AI回复速度的新认知,原来AI回复还可以这么快。不过Groq也有不足,如不支持多模态输入、不支持文生图等,模型回复速度快有时会丢失更多思考流程,无法获取到更多更准确的结果。对内容准确性和多模态没有严格要求的小伙伴来说,这是个非常不错的平台。

常见问题

404 Not Found

网络环境的问题,需要配置科学上网,在VS Code中使用参考:【VS Code】VSCode设置代理模式

友情链接

友情提示

见原文:初识Groq AI

本文同步自微信公众号 "程序员小溪" ,这里只是同步,想看及时消息请移步我的公众号,不定时更新我的学习经验。

相关推荐
小和尚同志44 分钟前
Cline | Cline + Grok3 免费 AI 编程新体验
人工智能·aigc
堆栈future2 小时前
manus终于开放啦
llm·aigc·agent
奇舞精选3 小时前
从零搭建企业级RAG知识库问答系统
aigc
陈敬雷-充电了么-CEO兼CTO4 小时前
大模型技术原理 - 基于Transformer的预训练语言模型
人工智能·深度学习·语言模型·自然语言处理·chatgpt·aigc·transformer
墨风如雪5 小时前
AI“读心术”进化:昆仑万维天工奖励模型V2,参数越小,能力越“怪”!
aigc
小溪彼岸7 小时前
GPT-4o的修图能力强的可怕?
chatgpt·aigc
redreamSo10 小时前
AI Daily | AI日报:马斯克Grok 4跑分泄露,有望改写LLM格局; 猫猫话术让大模型数学答错率翻3倍; 安克创新All in AI,代码采纳率破50%
程序员·aigc·资讯
后端小肥肠12 小时前
躺赚必备!RPA+Coze+豆包:公众号自动发文,AI率0%亲测有效(附AI率0%提示词)
人工智能·aigc·coze
墨风如雪1 天前
从一张图到一座城?Hitem3D 要用 1536³ 分辨率“炸”翻 3D 建模圈!
aigc
win4r1 天前
🚀 SuperClaude让Claude Code编程能力暴增300%!小白秒变顶尖程序员!19个专业命令+9大预定义角色,零编程经验也能开发复杂项目,完全碾
aigc·ai编程·claude