DeepSeekactiveOpen Source

DeepSeek-R1-Distill-Llama-70B

deepseek-r1-distill-llama-70b

R1 reasoning distilled into Llama 3.3 70B.

Context Window

131.1K

tokens

Max Output

8.2K

tokens

Input Price

—

per 1M tokens

Output Price

—

per 1M tokens

Details

Familydeepseek-r1

Parameters70B

Training Cutoff2024-12-01

ReleasedJanuary 20, 2025

Capabilities

StreamingCodeReasoning

Documentation

Evaluation Scores(5 benchmarks)

MATH-500Competition-style math

84%

HumanEvalFunction-level Python code generation

75%

MMLU-ProHarder successor to MMLU

66.2%

GPQA DiamondPhD-level science questions

52.3%

Quick Access

curl pikaainews.com/api/models/deepseek-r1-distill-llama-70b

npx pika-models info deepseek-r1-distill-llama-70b

Get API Access

Official

DeepSeek API

Official DeepSeek API. Cheapest frontier model access.

Third-Party Providers & Aggregators

Cerebras

Wafer-scale inference. 1000+ tokens/sec for select models.

DeepInfra

Lowest per-token rates for open-source models.

Fireworks AI

Fastest inference engine. Multimodal support, HIPAA/SOC2.

Groq

Ultra-fast LPU inference. Best latency for real-time apps.

OpenRouter

500+ models, one API key. Pay-per-token, no minimums.

SiliconFlow

China-optimized inference. Strong Qwen/DeepSeek support.

Together AI

Fast open-source model inference. Sub-100ms latency.

Other deepseek-r1 models

DeepSeek

DeepSeek-R1-Distill-Qwen-14B

deepseek-r1-distill-qwen-14b

131.1K ctx

DeepSeek

DeepSeek-R1-Distill-Qwen-7B

deepseek-r1-distill-qwen-7b

131.1K ctx

DeepSeek

DeepSeek-R1

deepseek-r1

131.1K ctx$0.55/1M

DeepSeek

DeepSeek-R1-Distill-Qwen-32B

deepseek-r1-distill-qwen-32b

131.1K ctx