Skip to content

NVIDIA

配置 MyDeskBot 使用 NVIDIA NIM(NVIDIA 推理微服务)。

概述

NVIDIA NIM 为 AI 模型提供优化的推理,具有企业级性能。

支持的模型

NVIDIA NIM 支持各种模型:

  • Llama 3.1 - Meta 的模型,NVIDIA 优化
  • Mixtral - 混合专家
  • Mistral - 高质量模型
  • Phi-3 - 小型、高效模型
  • 以及更多...

获取访问权限

  1. 访问 build.nvidia.com
  2. 注册或登录
  3. 导航到 NIM 目录
  4. 选择要使用的模型
  5. 获取 API 访问权限

配置选项

模型选择

模型适用场景成本速度
Llama 3.1 70B NIM复杂任务
Llama 3.1 405B NIM最强大
Mixtral 8x7B NIM编程、复杂任务非常快
Phi-3 NIM快速任务非常快

参数

  • Temperature (0-2) - 控制随机性
  • Max Tokens - 最大响应长度
  • Top P - 核采样

定价

NVIDIA NIM 提供各种定价选项。查看 build.nvidia.com 了解当前费率。

为什么选择 NVIDIA?

  • 优化 - GPU 优化性能
  • 企业级 - 企业级支持
  • 部署 - 任何地方部署(云、本地、边缘)
  • 性能 - 高吞吐量

部署选项

  • 云 API - 使用 NVIDIA 托管的推理
  • 本地部署 - 在自己的基础设施上部署 NIM
  • 边缘部署 - 在边缘部署

故障排除

无效的 API 密钥

  • 验证 API 密钥是否正确
  • 检查 NIM 访问权限

性能问题

  • 确保本地部署有足够的 GPU 资源
  • 检查云 API 的网络连接

相关链接