Name: Soniox STT 4 Async
Brand: Soniox

Soniox STT 4 Async is Soniox's speech to text model and up to 8K output tokens. Soniox's fourth-generation asynchronous speech-to-text model, built for high-accuracy transcription of pre-recorded audio at scale.

Specifications
Canonical ID	`soniox-stt-4-async`
Type	Speech to Text
Status	Active
Creator	Soniox
Providers	Soniox
Max Output	8K tokens
Input Modalities	Audio
Output Modalities	Text

Capabilities

Input1/5

Text·

Image·

Audio✓

Video·

PDF·

Output1/5

Text✓

Image·

Audio·

Video·

Embedding·

Capabilities0/13

Reasoning·

Adaptive Reasoning·

Function Calling·

Parallel Function Calling·

Structured Outputs·

Native JSON Schema·

Web Search·

URL Context·

Computer Use·

Code Execution·

File Search·

Prompt Caching·

Assistant Prefill·

Pricing by Provider

US Dollar ($)

Per 1M tokens

Provider	Standard
Provider	Audio Out $ / sec
Soniox `soniox/stt-async-v4`	$0.000028

Cost Calculator

US Dollar ($)

Preset:

Input tokens

Output tokens

Number of calls

Versions

Version	Released	Context	Input / 1M	Output / 1M	Status
Soniox STT 5 Async	—	—	—	—	Available
Soniox STT 4 Async	—	—	—	—	Current

Model IDs

soniox-stt-4-async

soniox/stt-async-v4

Soniox STT 4 Async

CapabilitiesAPIGET/api/v1/models/soniox-stt-4-async

Pricing by ProviderAPIGET/api/v1/models/soniox-stt-4-async/pricing

Cost CalculatorAPIGET/api/v1/models/soniox-stt-4-async/pricing/calculate?input_tokens=1000000&output_tokens=500000

VersionsAPIGET/api/v1/models?family=stt

Model IDsAPIGET/api/v1/models/soniox-stt-4-async

Capabilities

Pricing by Provider

Cost Calculator

Versions

Model IDs