“服务器繁忙,请稍后再试”,有没有在激情四射地体验着 DeepSeek 的时候,突然被这么一句话浇灭了热情。
除了 DeepSeek 官方网站提供的服务之外,它的朋友圈也是越来越大,越来越多地云服务商针对 DeepSeek 提供硬件部署、API 接口等服务。本文基于全球各大公有云提供地服务,汇总整理各家 DeepSeek 产品价格指南。
1、GPU 资源需求
此 GPU 资源需求来自腾讯云 TI 平台最佳实践。
模型版本 | GPU 资源需求 |
---|---|
DeepSeek-V3 | 多机分布式部署,2 节点,单节点配置:HCCPNV6 机型 |
DeepSeek-R1 | 多机分布式部署,2 节点,单节点配置:HCCPNV6 机型 |
DeepSeek-R1-Distill-Qwen-1.5B | 12C44GB 1 卡 A10 |
DeepSeek-R1-Distill-Qwen-7B | 12C44GB 1 卡 A10 |
DeepSeek-R1-Distill-Llama-8B | 12C44GB 1 卡 A10 |
DeepSeek-R1-Distill-Qwen-14B | 16C96G 1 卡 A100 |
DeepSeek-R1-Distill-Qwen-32B | 32C192G 2 卡 A100 |
DeepSeek-R1-Distill-Llama-70B | 164C948G 8 卡 A100 |
参考链接:大模型推理所需资源指南
2、DeepSeek
DeepSeek 官方提供,由于服务器资源紧张,目前已经关闭了 API 接口充值。
价格提示:
- deepseek-chat 模型优惠期至北京时间 2025 年 2 月 8 日 24:00,期间 API 调用享历史价格,优惠结束后将按每百万输入 tokens 2 元,每百万输出 tokens 8 元计费。
- deepseek-reasoner 模型上线即按每百万输入 tokens 4 元,每百万输出 tokens 16 元计费。
价格参考 : 模型 & 价格 | DeepSeek API Docs
模型版本:DeepSeek R1 671B
WebUI:https://chat.deepseek.com/
API 接口文档:https://api-docs.deepseek.com/zh-cn/
API 接口地址:https://api.deepseek.com
3、硅基流动 SiliconFlow
SiliconFlow 提供 DeepSeek 系列模型的体验与购买服务,包括 DeepSeek-R1 和 DeepSeek-V3。注册免费赠送 2000 万 Tokens,邀请好友赠 2000 万 Tokens。
DeepSeek-R1
输入:¥4/M Tokens;输出:¥16/M Tokens
DeepSeek-V3
输入:¥1/M Tokens(原价 ¥2);输出:¥2/M Tokens(原价 ¥8)
模型版本:DeepSeek R1 671B
WebUI:https://cloud.siliconflow.cn/playground/chat
API 接口文档:https://docs.siliconflow.cn/api-reference/chat-completions/chat-completions
API 接口地址:https://api.siliconflow.cn/v1/chat/completions
4、腾讯云
腾讯云 HAI、Ti-One、LKE 三个平台都提供 DeepSeek 服务。
腾讯云 HAI
网站地址:高性能应用服务 HAI
腾讯云 HAI 提供自部署模型的算力支持。默认支持 DeepSeek-R1:1.5B 和 DeepSeek-R1:7B 模型,价格实惠,以下配置仅 7.2 元 / 小时(从测试结果来看,此配置跑 DeepSeek-R1:70B 没有压力,响应速度较快)。
- 显存:2 x 32GB+(显卡型号:Tesla V100-SXM2-32GB)
- 算力:30+TFlops SP
- CPU:18~20 核
- 内存:80GB
基本信息:
(base) root@VM-0-80-ubuntu:~# nvidia-smi
Thu Feb 6 11:32:43 2025
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 525.105.17 Driver Version: 525.105.17 CUDA Version: 12.0 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 Tesla V100-SXM2... On | 00000000:00:09.0 Off | 0 |
| N/A 37C P0 27W / 300W | 3MiB / 32768MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
| 1 Tesla V100-SXM2... On | 00000000:00:0A.0 Off | 0 |
| N/A 37C P0 27W / 300W | 3MiB / 32768MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
API 接口文档:https://github.com/ollama/ollama/blob/main/docs/api.md(Ollama 官方标准接口)
WebUI:http://IP:6889/zh
API 接口地址:http://IP:6399/api/generate
腾讯云 Ti-One
网站地址:腾讯云 Ti-One 平台
如果需要通过腾讯云 Ti-One 平台部署专属 DeepSeek 服务,请参考以下文档:
最佳实践:快速部署和体验 DeepSeek
大模型知识引擎 LKE
DeepSeek-R1
输入:¥4/M Tokens;输出:¥16/M Tokens
部署文档:DeepSeek 联网应用创建
模型版本:DeepSeek R1 671B
API 接口文档:https://cloud.tencent.com/document/api/1772/115963
API 接口地址:https://api.lkeap.cloud.tencent.com/v1
三种产品服务有何区别?
(1)API 直接调用的方式(知识引擎)
参考:知识引擎原子能力
优势:支持 V3 和 R1,通过 API 方式调用,也无需购买资源部署,适合无需精调即可直接做推理的客户和场景。
(2)基于 Ti-One 的算力推理 / 训练方式(精调或推理)
优势:支持 V3 和 R1,可根据业务对性能和参数规模的要求,选择不同的算力资源,支持后续按需精调;参数规模支持 1.5B、7B、8B、14B、32B、70B、671B。
(3)面向开发者开箱即用的 HAI 方式(个人)
参考:一键部署,3 分钟调用!DeepSeek-R1 登陆腾讯云
优势:支持 R1,免除购买资源部署的过程,直接开箱使用;参数规模支持 1.5B、7B、8B、14B、32B、70B。
5、华为云 ModelArts Studio
网站地址 : 华为云 ModelArts Studio(MaaS)
支持昇腾适配版的 DeepSeek-R1 蒸馏模型,包含:
DeepSeek-R1-Distill-Llama-8B
DeepSeek-R1-Distill-Qwen-14B
DeepSeek-R1-Distill-Qwen-32B
此外,ModelArts Studio 还提供免费体验,赠送 200 万体验 Tokens。
6、百度智能云
网站地址 : 千帆 ModelBuilder
提供两周的免费使用(至 2 月 18 日 24:00),包括 DeepSeek-R1 和 DeepSeek-V3。
DeepSeek-R1
输入:¥2/M Tokens;输出:¥8/M Tokens
DeepSeek-V3
输入:¥0.8/M Tokens;输出:¥1.6/M Tokens
模型版本:DeepSeek R1 671B
API 接口文档:https://ai.baidu.com/ai-doc/WENXINWORKSHOP/qm6oyumhw
API 接口地址:https://qianfan.baidubce.com/v2/chat/completions
7、阿里云
阿里云在 Model Gallery 上线 DeepSeek-R1,提供自部署算力支持,硬件要求 ml.gu8v.c192m1024.8-gu120 (190 vCPU, 970 GiB, GU120 * 8),单价 316.25 元 / 小时。
模型版本:DeepSeek R1 671B
发布说明:自建(316.25 元 / 小时)
WebUI:无
API 接口文档:PAI Python SDK_人工智能平台 PAI(PAI)- 阿里云帮助中心
8、Gitee
网站地址:Gitee AI
Gitee 在 Gitee AI 平台上线 DeepSeek R1 从 1.5B 至 671B 满血版,每日免费调用次数 100,商业版 0.1 元 / 次调用。
模型版本:DeepSeek R1 671B
产品价格 : 全模型资源包
WebUI:https://ai.gitee.com/hf-models/deepseek-ai/DeepSeek-R1/api
API 接口文档:https://ai.gitee.com/docs/openapi/v1
API 接口地址:https://ai.gitee.com/v1
9、火山引擎
网站地址 : 火山方舟
火山引擎在旗下火山方舟中,提供了满盘版的 DeepSeek R1 和 DeepSeek V3。
DeepSeek-R1
输入:¥2/M Tokens;输出:¥8/M Tokens
DeepSeek-V3
输入:¥1/M Tokens;输出:¥4/M Tokens
模型版本:DeepSeek R1 671B
产品价格: DeepSeek-R1
WebUI:https://console.volcengine.com/ark/region:ark+cn-beijing/experience/chat
API 接口文档:https://www.volcengine.com/docs/82379/1449737
API 接口地址:https://ark.cn-beijing.volces.com/api/v3/chat/completions
10、Azure
网站地址:Azure AI Foundry
微软旗下的 Azure 在 Azure AI Foundry 上提供免费试用 DeepSeek-R1。由于未发布正式生产环境,后端资源池控制比较严格,所以响应速度较慢。预计不久将上线价格计算器,方便用户进行价格估算。
模型版本:DeepSeek R1 671B
API 接口文档:Build a basic chat app in Python using Azure AI Foundry SDK
API 接口地址:https://xxx.eastus2.models.ai.azure.com
11、AWS
AWS 在 Amazon Bedrock 和 SageMaker AI 上线 DeepSeek-R1。
12、IBM Cloud
网站地址:IBM watsonx
IBM 旗下 watsonx.ai 提供以下两个 DeepSeek 版本:
DeepSeek-R1-Distill-Llama-8B 5.22 美元 / 小时
DeepSeek-R1-Distill-Llama-70B 20.85 美元 / 小时
12、NVIDIA
网站地址:NVIDIA NIM
英伟达旗下 NVIDIA NIM 上线 DeepSeek-R1。
13、OpenRouter
网站地址:OpenRouter
OpenRouter 提供免费版本的 DeepSeek-R1(Free),但响应速度一般。
除了免费版,OpenRouter 还提供收费版,支持银联信用卡充值。
14、自建 Ollama + DeepSeek
NVIDIA GeForce GTX 1080 Ti 可以跑 deepseek-r1:7b、deepseek-r1:8b 无压力,思考大概几秒钟(需要考虑上下文长度、Max Token 等参数)。
Apple M4 Pro 48GB 跑 deepseek-r1:32b 无压力。
B 站有很多 UP 主发布了本地部署的搭建和测试视频,可以搜索参考。
参考阅读
AI 客户端:Chatbox AI、Cherry Studio 等汇总推荐
Rocky Linux – 全球公有云 DeepSeek R1 购买指南