Name: Qwen3 30B A3B FP8
Brand: Alibaba

Qwen3 30B A3B FP8 is

Alibaba's language model with a 41K context window and up to 20K output tokens, starting at $0.090 / 1M input and $0.450 / 1M output. An FP8-quantized Qwen3 MoE model with 30B total and 3B active parameters, enabling seamless switching between thinking and non-thinking modes with QwQ-32B-level reasoning at lower cost.

Spec
Canonical ID	`alibaba-qwen3-30b-a3b-fp8`
Type	Language
Status	Active
Creator	Alibaba
Providers	Novita AI
Context Window	41K tokens
Max Output	20K tokens
Input Modalities	Text
Output Modalities	Text
Reasoning Efforts	default
Parameters	30B

Capabilities

Input1/5

Text✓

Image·

Audio·

Video·

PDF·

Output1/5

Text✓

Image·

Audio·

Video·

Embedding·

Capabilities1/13

Reasoning✓

Adaptive Reasoning·

Function Calling·

Parallel Function Calling·

Structured Outputs·

Native JSON Schema·

Web Search·

URL Context·

Computer Use·

Code Execution·

File Search·

Prompt Caching·

Assistant Prefill·

Pricing by Provider

Provider	Standard
Provider	Input $ / 1M	Output $ / 1M
Novita qwen/qwen3-30b-a3b-fp8	$0.090	$0.450

Cost Calculator

Preset:

Input tokens

Output tokens

Reasoning tokens

Number of calls

Compares every provider & tier in USD

Versions

Version	Released	Context	Input / 1M	Output / 1M	Status
DeepSeek R1 0528 Qwen3 8B	—	128K	$0.060	$0.090	Available
Qwen3 9.23 Max	—	—	—	—	Available
Qwen 7 28 Flash	—	998K	—	—	Available
Qwen 4 28 Plus	—	129K	—	—	Available
Qwen 3 32B	2025-04-01	128K	—	—	Available
Qwen3.5-Flash	2026-02-25	1.0M	$0.065	$0.260	Available
Qwen3.5 Plus 2026-02-15	2026-02-16	1.0M	$0.260	$1.56	Available
Qwen 1 25 Plus	—	129K	—	—	Available
Qwen3.5 Max	—	258K	—	—	Available
Qwen3.6 Plus	2026-04-02	1.0M	$0.325	$1.95	Available
Qwen3 30B A3B FP8	—	41K	$0.090	$0.450	Current

Qwen3 30B A3B FP8

Capabilities

Pricing by Provider

Cost Calculator

Versions

Model IDs