update: DeepInfra model data refresh [2025-09-12] #14492

Toy-97 · 2025-09-12T11:23:30Z

Relevant issues

This PR updates DeepInfra model data
Addresses model availability - new models added
Addresses model parameter updates - pricing/metadata changes

Pre-Submission checklist

Please complete all items before asking a LiteLLM maintainer to review your PR

I have Added testing in the tests/litellm/ directory, Adding at least 1 test is a hard requirement - see details
I have added a screenshot of my new test passing locally
My PR passes all unit tests on make test-unit
My PR's scope is as isolated as possible, it only solves 1 specific problem.

Type

📖 Documentation

Changes

Added Models:
deepinfra/Qwen/Qwen3-Next-80B-A3B-Instruct
deepinfra/Qwen/Qwen3-Next-80B-A3B-Thinking
deepinfra/moonshotai/Kimi-K2-Instruct-0905
deepinfra/nvidia/Llama-3.3-Nemotron-Super-49B-v1.5
deepinfra/nvidia/NVIDIA-Nemotron-Nano-9B-v2

Modified Models:
deepinfra/NousResearch/Hermes-3-Llama-3.1-70B:

input_cost_per_token: 1e-07 → 1.2e-07
output_cost_per_token: 2.8e-07 → 3e-07

deepinfra/deepseek-ai/DeepSeek-R1-Distill-Qwen-32B:

input_cost_per_token: 7.5e-08 → 2.7e-07
output_cost_per_token: 1.5e-07 → 2.7e-07

deepinfra/Gryphe/MythoMax-L2-13b:

input_cost_per_token: 7.2e-08 → 8e-08
output_cost_per_token: 7.2e-08 → 9e-08

deepinfra/Qwen/Qwen3-Coder-480B-A35B-Instruct-Turbo:

cache_read_input_token_cost: 2.4e-07 → None
input_cost_per_token: 3e-07 → 2.9e-07

deepinfra/deepseek-ai/DeepSeek-R1-Distill-Llama-70B:

input_cost_per_token: 1e-07 → 2e-07
output_cost_per_token: 4e-07 → 6e-07

Added models: deepinfra/Qwen/Qwen3-Next-80B-A3B-Instruct deepinfra/Qwen/Qwen3-Next-80B-A3B-Thinking deepinfra/moonshotai/Kimi-K2-Instruct-0905 deepinfra/nvidia/Llama-3.3-Nemotron-Super-49B-v1.5 deepinfra/nvidia/NVIDIA-Nemotron-Nano-9B-v2 Modified models: deepinfra/NousResearch/Hermes-3-Llama-3.1-70B: - input_cost_per_token: 1e-07 → 1.2e-07 - output_cost_per_token: 2.8e-07 → 3e-07 deepinfra/deepseek-ai/DeepSeek-R1-Distill-Qwen-32B: - input_cost_per_token: 7.5e-08 → 2.7e-07 - output_cost_per_token: 1.5e-07 → 2.7e-07 deepinfra/Gryphe/MythoMax-L2-13b: - input_cost_per_token: 7.2e-08 → 8e-08 - output_cost_per_token: 7.2e-08 → 9e-08 deepinfra/Qwen/Qwen3-Coder-480B-A35B-Instruct-Turbo: - cache_read_input_token_cost: 2.4e-07 → None - input_cost_per_token: 3e-07 → 2.9e-07 deepinfra/deepseek-ai/DeepSeek-R1-Distill-Llama-70B: - input_cost_per_token: 1e-07 → 2e-07 - output_cost_per_token: 4e-07 → 6e-07

vercel · 2025-09-12T11:23:34Z

The latest updates on your projects. Learn more about Vercel for GitHub.

Project	Deployment	Preview	Comments	Updated (UTC)
litellm	Ready	Preview	Comment	Sep 12, 2025 11:24am

vercel bot deployed to Preview September 12, 2025 11:24 View deployment

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Uh oh!

update: DeepInfra model data refresh [2025-09-12] #14492

update: DeepInfra model data refresh [2025-09-12] #14492

Toy-97 commented Sep 12, 2025

Uh oh!

vercel bot commented Sep 12, 2025 •

edited

Loading

Uh oh!

Uh oh!

Uh oh!

update: DeepInfra model data refresh [2025-09-12] #14492

Are you sure you want to change the base?

update: DeepInfra model data refresh [2025-09-12] #14492

Conversation

Toy-97 commented Sep 12, 2025

Relevant issues

Pre-Submission checklist

Type

Changes

Uh oh!

vercel bot commented Sep 12, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Uh oh!

vercel bot commented Sep 12, 2025 •

edited

Loading