Groq

配置 MyDeskBot 使用 Groq 进行超快速 AI 推理。

概述

Groq 使用其定制的 LPU（语言处理单元）提供极其快速的 AI 推理。

支持的模型

Groq 托管了许多流行的开源模型：

Llama 3.1 - Meta 的最新模型
Mixtral 8x7B - 混合专家模型
Gemma 2 - Google 的开源模型
Whisper - 音频转录

获取 API 密钥

访问 console.groq.com
注册或登录
进入 API Keys 部分
创建新的 API 密钥
复制密钥

配置选项

模型选择

模型	适用场景	成本	速度
Llama 3.1 70B	复杂任务	低	非常快
Llama 3.1 8B	通用任务	低	非常快
Mixtral 8x7B	编程、复杂任务	低	非常快
Gemma 2 9B	通用任务	低	非常快

参数

Temperature (0-2) - 控制随机性
Max Tokens - 最大响应长度
Top P - 核采样

定价

Groq 提供非常有竞争力的价格。查看 Groq 定价了解当前费率。

为什么选择 Groq？

闪电般快速 - 定制 LPU 硬件实现速度
低成本 - 有竞争力的定价
开源模型 - 托管开源模型
低延迟 - 实时应用

故障排除

无效的 API 密钥

验证 API 密钥是否正确
检查账户状态

速率限制

Groq 有宽松的速率限制
在控制台中监控使用情况

相关链接

Groq 文档