Name: Whisper Medium
Brand: OpenAI

Whisper Medium is OpenAI's speech to text model. A mid-size Whisper ASR model balancing transcription accuracy and computational efficiency for multilingual speech recognition.

Specifications
Canonical ID	`openai-whisper-medium`
Type	Speech to Text
Status	Active
Creator	OpenAI
Providers	Deepgram
Input Modalities	Audio
Output Modalities	Text

Capabilities

Input1/5

Text·

Image·

Audio✓

Video·

PDF·

Output1/5

Text✓

Image·

Audio·

Video·

Embedding·

Capabilities0/13

Reasoning·

Adaptive Reasoning·

Function Calling·

Parallel Function Calling·

Structured Outputs·

Native JSON Schema·

Web Search·

URL Context·

Computer Use·

Code Execution·

File Search·

Prompt Caching·

Assistant Prefill·

Pricing by Provider

US Dollar ($)

Per 1M tokens

Provider	Standard
Provider	Audio In $ / sec
Deepgram `deepgram/whisper-medium`	$0.000100

Cost Calculator

US Dollar ($)

Preset:

Input tokens

Output tokens

Number of calls

Versions

Version	Released	Context	Input / 1M	Output / 1M	Status
Whisper 3	—	4K	—	—	Available
Whisper 3 Large	—	—	—	—	Available
Whisper 3 Large Turbo	—	—	—	—	Available
Whisper 3 Turbo	—	4K	—	—	Available
Whisper 2 Large	—	—	—	—	Available
Whisper	2022-09-21	—	$0.000	—	Available
Whisper Medium	—	—	—	—	Current
Whisper Base	—	—	—	—	Available
Whisper Large	—	—	—	—	Available
Whisper Small	—	—	—	—	Available
Whisper Tiny	—	—	—	—	Available

Model IDs

deepgram/whisper-medium

huggingface-asr-whisper-medium

openai-whisper-medium

Whisper Medium

CapabilitiesAPIGET/api/v1/models/openai-whisper-medium

Pricing by ProviderAPIGET/api/v1/models/openai-whisper-medium/pricing

Cost CalculatorAPIGET/api/v1/models/openai-whisper-medium/pricing/calculate?input_tokens=1000000&output_tokens=500000

VersionsAPIGET/api/v1/models?family=whisper

Model IDsAPIGET/api/v1/models/openai-whisper-medium

Capabilities

Pricing by Provider

Cost Calculator

Versions

Model IDs