DeepSeek:全球公有云DeepSeek-R1 API价格指南

96次阅读
没有评论

“服务器繁忙,请稍后再试”,有没有在激情四射地体验着 DeepSeek 的时候,突然被这么一句话浇灭了热情。

除了 DeepSeek 官方网站提供的服务之外,它的朋友圈也是越来越大,越来越多地云服务商针对 DeepSeek 提供硬件部署、API 接口等服务。本文基于全球各大公有云提供地服务,汇总整理各家 DeepSeek 产品价格指南。

1、GPU 资源需求

此 GPU 资源需求来自腾讯云 TI 平台最佳实践。

模型版本 GPU 资源需求
DeepSeek-V3 多机分布式部署,2 节点,单节点配置:HCCPNV6 机型
DeepSeek-R1 多机分布式部署,2 节点,单节点配置:HCCPNV6 机型
DeepSeek-R1-Distill-Qwen-1.5B 12C44GB 1 卡 A10
DeepSeek-R1-Distill-Qwen-7B 12C44GB 1 卡 A10
DeepSeek-R1-Distill-Llama-8B 12C44GB 1 卡 A10
DeepSeek-R1-Distill-Qwen-14B 16C96G 1 卡 A100
DeepSeek-R1-Distill-Qwen-32B 32C192G 2 卡 A100
DeepSeek-R1-Distill-Llama-70B 164C948G 8 卡 A100

参考链接:大模型推理所需资源指南

2、DeepSeek

DeepSeek 官方提供,由于服务器资源紧张,目前已经关闭了 API 接口充值。

价格提示:

  1. deepseek-chat 模型优惠期至北京时间 2025 年 2 月 8 日 24:00,期间 API 调用享历史价格,优惠结束后将按每百万输入 tokens 2 元,每百万输出 tokens 8 元计费。
  2. deepseek-reasoner 模型上线即按每百万输入 tokens 4 元,每百万输出 tokens 16 元计费。

DeepSeek:全球公有云 DeepSeek-R1 API 价格指南

价格参考 模型 & 价格 | DeepSeek API Docs

模型版本:DeepSeek R1 671B

WebUIhttps://chat.deepseek.com/

API 接口文档https://api-docs.deepseek.com/zh-cn/

API 接口地址:https://api.deepseek.com

3、硅基流动 SiliconFlow

SiliconFlow 提供 DeepSeek 系列模型的体验与购买服务,包括 DeepSeek-R1 和 DeepSeek-V3。注册免费赠送 2000 万 Tokens,邀请好友赠 2000 万 Tokens。

DeepSeek-R1

输入:¥4/M Tokens;输出:¥16/M Tokens

DeepSeek-V3

输入:¥1/M Tokens(原价 ¥2);输出:¥2/M Tokens(原价 ¥8)

模型版本:DeepSeek R1 671B

WebUIhttps://cloud.siliconflow.cn/playground/chat

API 接口文档:https://docs.siliconflow.cn/api-reference/chat-completions/chat-completions

API 接口地址:https://api.siliconflow.cn/v1/chat/completions

4、腾讯云

腾讯云 HAI、Ti-One、LKE 三个平台都提供 DeepSeek 服务。

腾讯云 HAI

网站地址:高性能应用服务 HAI

腾讯云 HAI 提供自部署模型的算力支持。默认支持 DeepSeek-R1:1.5B 和 DeepSeek-R1:7B 模型,价格实惠,以下配置仅 7.2 元 / 小时(从测试结果来看,此配置跑 DeepSeek-R1:70B 没有压力,响应速度较快)。

  • 显存:2 x 32GB+(显卡型号:Tesla V100-SXM2-32GB)
  • 算力:30+TFlops SP
  • CPU:18~20 核
  • 内存:80GB

基本信息:

(base) root@VM-0-80-ubuntu:~# nvidia-smi
Thu Feb  6 11:32:43 2025       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 525.105.17   Driver Version: 525.105.17   CUDA Version: 12.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  Tesla V100-SXM2...  On   | 00000000:00:09.0 Off |                    0 |
| N/A   37C    P0    27W / 300W |      3MiB / 32768MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
|   1  Tesla V100-SXM2...  On   | 00000000:00:0A.0 Off |                    0 |
| N/A   37C    P0    27W / 300W |      3MiB / 32768MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
 
+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

API 接口文档:https://github.com/ollama/ollama/blob/main/docs/api.md(Ollama 官方标准接口)

WebUI:http://IP:6889/zh

API 接口地址:http://IP:6399/api/generate

腾讯云 Ti-One

网站地址:腾讯云 Ti-One 平台

如果需要通过腾讯云 Ti-One 平台部署专属 DeepSeek 服务,请参考以下文档:

最佳实践:快速部署和体验 DeepSeek

大模型知识引擎 LKE

DeepSeek-R1

输入:¥4/M Tokens;输出:¥16/M Tokens

部署文档DeepSeek 联网应用创建

模型版本:DeepSeek R1 671B

API 接口文档:https://cloud.tencent.com/document/api/1772/115963

API 接口地址:https://api.lkeap.cloud.tencent.com/v1

三种产品服务有何区别?

(1)API 直接调用的方式(知识引擎)

参考:知识引擎原子能力

优势:支持 V3 和 R1,通过 API 方式调用,也无需购买资源部署,适合无需精调即可直接做推理的客户和场景。

(2)基于 Ti-One 的算力推理 / 训练方式(精调或推理)

参考:快速部署和体验 DeepSeek 系列模型

优势:支持 V3 和 R1,可根据业务对性能和参数规模的要求,选择不同的算力资源,支持后续按需精调;参数规模支持 1.5B、7B、8B、14B、32B、70B、671B。

(3)面向开发者开箱即用的 HAI 方式(个人)

参考:一键部署,3 分钟调用!DeepSeek-R1 登陆腾讯云

优势:支持 R1,免除购买资源部署的过程,直接开箱使用;参数规模支持 1.5B、7B、8B、14B、32B、70B。

5、华为云 ModelArts Studio

网站地址 华为云 ModelArts Studio(MaaS)

支持昇腾适配版的 DeepSeek-R1 蒸馏模型,包含:

DeepSeek-R1-Distill-Llama-8B

DeepSeek-R1-Distill-Qwen-14B

DeepSeek-R1-Distill-Qwen-32B

此外,ModelArts Studio 还提供免费体验,赠送 200 万体验 Tokens。

6、百度智能云

网站地址 千帆 ModelBuilder

提供两周的免费使用(至 2 月 18 日 24:00),包括 DeepSeek-R1 和 DeepSeek-V3。

DeepSeek-R1

输入:¥2/M Tokens;输出:¥8/M Tokens

DeepSeek-V3

输入:¥0.8/M Tokens;输出:¥1.6/M Tokens

模型版本:DeepSeek R1 671B

API 接口文档:https://ai.baidu.com/ai-doc/WENXINWORKSHOP/qm6oyumhw

API 接口地址:https://qianfan.baidubce.com/v2/chat/completions

7、阿里云

阿里云在 Model Gallery 上线 DeepSeek-R1,提供自部署算力支持,硬件要求 ml.gu8v.c192m1024.8-gu120 (190 vCPU, 970 GiB, GU120 * 8),单价 316.25 元 / 小时。

模型版本:DeepSeek R1 671B

发布说明:自建(316.25 元 / 小时)

WebUI:无

API 接口文档PAI Python SDK_人工智能平台 PAI(PAI)- 阿里云帮助中心

8、Gitee

网站地址Gitee AI

Gitee 在 Gitee AI 平台上线 DeepSeek R1 从 1.5B 至 671B 满血版,每日免费调用次数 100,商业版 0.1 元 / 次调用。

模型版本:DeepSeek R1 671B

产品价格 全模型资源包

WebUI:https://ai.gitee.com/hf-models/deepseek-ai/DeepSeek-R1/api

API 接口文档:https://ai.gitee.com/docs/openapi/v1

API 接口地址:https://ai.gitee.com/v1

9、火山引擎

网站地址 火山方舟

火山引擎在旗下火山方舟中,提供了满盘版的 DeepSeek R1 和 DeepSeek V3。

DeepSeek-R1

输入:¥2/M Tokens;输出:¥8/M Tokens

DeepSeek-V3

输入:¥1/M Tokens;输出:¥4/M Tokens

模型版本:DeepSeek R1 671B

产品价格 DeepSeek-R1

WebUI:https://console.volcengine.com/ark/region:ark+cn-beijing/experience/chat

API 接口文档:https://www.volcengine.com/docs/82379/1449737

API 接口地址:https://ark.cn-beijing.volces.com/api/v3/chat/completions

10、Azure

网站地址Azure AI Foundry

微软旗下的 Azure 在 Azure AI Foundry 上提供免费试用 DeepSeek-R1。由于未发布正式生产环境,后端资源池控制比较严格,所以响应速度较慢。预计不久将上线价格计算器,方便用户进行价格估算。

模型版本:DeepSeek R1 671B

API 接口文档Build a basic chat app in Python using Azure AI Foundry SDK

API 接口地址:https://xxx.eastus2.models.ai.azure.com

11、AWS

AWS 在 Amazon Bedrock 和 SageMaker AI 上线 DeepSeek-R1。

12、IBM Cloud

网站地址IBM watsonx

IBM 旗下 watsonx.ai 提供以下两个 DeepSeek 版本:

DeepSeek-R1-Distill-Llama-8B 5.22 美元 / 小时

DeepSeek-R1-Distill-Llama-70B 20.85 美元 / 小时

12、NVIDIA

网站地址NVIDIA NIM

英伟达旗下 NVIDIA NIM 上线 DeepSeek-R1。

13、OpenRouter

网站地址OpenRouter

OpenRouter 提供免费版本的 DeepSeek-R1(Free),但响应速度一般。

除了免费版,OpenRouter 还提供收费版,支持银联信用卡充值。

14、自建 Ollama + DeepSeek

NVIDIA GeForce GTX 1080 Ti 可以跑 deepseek-r1:7b、deepseek-r1:8b 无压力,思考大概几秒钟(需要考虑上下文长度、Max Token 等参数)。

Apple M4 Pro 48GB 跑 deepseek-r1:32b 无压力。

B 站有很多 UP 主发布了本地部署的搭建和测试视频,可以搜索参考。

参考阅读

DeepSeek:官网及第三方云服务平台使用操作手册

DeepSeek:中国电信、中国移动、中国联通使用操作手册

AI 客户端:Chatbox AI、Cherry Studio 等汇总推荐

Rocky Linux – 全球公有云 DeepSeek R1 购买指南

正文完
 1
主机大巴
版权声明:本站原创文章,由 主机大巴 于2025-02-16发表,共计5614字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。