Name: GPT Audio Mini
Brand: OpenAI

GPT Audio Mini is OpenAI's language model with a 128K context window and up to 16K output tokens, available from 3 providers, starting at $0.600 / 1M input and $2.40 / 1M output. A cost-efficient, smaller variant of GPT Audio that accepts and produces audio inputs and outputs for high-volume voice applications.

Specifications
Canonical ID	`openai-gpt-audio-mini`
Type	Language
Status	Active
Creator	OpenAI
Providers	Microsoft Azure AI Foundry OpenAI OpenRouter
Context Window	128K tokens
Max Output	16K tokens
Input Modalities	AudioText
Output Modalities	AudioText
Release Date	2025-10-06 · 8 months ago
Knowledge Cutoff	2023-10

Capabilities

Input2/5

Text✓

Image·

Audio✓

Video·

PDF·

Output2/5

Text✓

Image·

Audio✓

Video·

Embedding·

Capabilities4/13

Reasoning·

Adaptive Reasoning·

Function Calling✓

Parallel Function Calling✓

Structured Outputs✓

Native JSON Schema✓

Web Search·

URL Context·

Computer Use·

Code Execution·

File Search·

Prompt Caching·

Assistant Prefill·

Pricing by Provider

Provider	Standard
Provider	Input $ / 1M	Output $ / 1M	Audio In $ / 1M	Audio Out $ / 1M
Azure AI Foundry azure/gpt-audio-mini-2025-10-06	$0.600	$2.40	$10.00	$20.00
OpenAI gpt-audio-mini-2025-12-15	$0.600	$2.40	$10.00	$20.00
OpenRouter openai/gpt-audio-mini	$0.600	$2.40	$0.600	N/A

Cost Calculator

Preset:

Input tokens

Output tokens

Number of calls

Other models

Model	Tier	Released	Context	Input / 1M	Output / 1M
GPT Audio 1.5	—	—	128K	$2.50	$10.00
GPT Audio	—	2025-08-28	128K	$2.50	$10.00
GPT Realtime 2 Image	—	—	—	—	—
GPT Realtime 2 Text	—	—	—	—	—

GPT Audio Mini

Capabilities

Pricing by Provider

Cost Calculator

Other models

Model IDs