NVIDIA

配置 MyDeskBot 使用 NVIDIA NIM（NVIDIA 推理微服务）。

概述

NVIDIA NIM 为 AI 模型提供优化的推理，具有企业级性能。

支持的模型

NVIDIA NIM 支持各种模型：

Llama 3.1 - Meta 的模型，NVIDIA 优化
Mixtral - 混合专家
Mistral - 高质量模型
Phi-3 - 小型、高效模型
以及更多...

获取访问权限

访问 build.nvidia.com
注册或登录
导航到 NIM 目录
选择要使用的模型
获取 API 访问权限

配置选项

模型选择

模型	适用场景	成本	速度
Llama 3.1 70B NIM	复杂任务	中	快
Llama 3.1 405B NIM	最强大	高	中
Mixtral 8x7B NIM	编程、复杂任务	低	非常快
Phi-3 NIM	快速任务	低	非常快

参数

Temperature (0-2) - 控制随机性
Max Tokens - 最大响应长度
Top P - 核采样

定价

NVIDIA NIM 提供各种定价选项。查看 build.nvidia.com 了解当前费率。

为什么选择 NVIDIA？

优化 - GPU 优化性能
企业级 - 企业级支持
部署 - 任何地方部署（云、本地、边缘）
性能 - 高吞吐量

部署选项

云 API - 使用 NVIDIA 托管的推理
本地部署 - 在自己的基础设施上部署 NIM
边缘部署 - 在边缘部署

故障排除

无效的 API 密钥

验证 API 密钥是否正确
检查 NIM 访问权限

性能问题

确保本地部署有足够的 GPU 资源
检查云 API 的网络连接

相关链接

NVIDIA NIM 文档