Name: GPT-4o Audio
Brand: OpenAI

GPT-4o Audio is OpenAI's language model. A GPT-4o variant that accepts and produces audio inputs and outputs alongside text for voice-enabled applications.

Specifications
Canonical ID	`openai-gpt-4o-audio`
Type	Language
Status	Active
Creator	OpenAI
Providers	Azure AI Foundry
Input Modalities	Text
Output Modalities	Text

Capabilities

Input1/5

Text✓

Image·

Audio·

Video·

PDF·

Output1/5

Text✓

Image·

Audio·

Video·

Embedding·

Capabilities0/13

Reasoning·

Adaptive Reasoning·

Function Calling·

Parallel Function Calling·

Structured Outputs·

Native JSON Schema·

Web Search·

URL Context·

Computer Use·

Code Execution·

File Search·

Prompt Caching·

Assistant Prefill·

Pricing by Provider

US Dollar ($)

Per 1M tokens

Provider	Standard
Provider	Audio In $ / 1M	Audio Out $ / 1M
Azure AI Foundry `openai:gpt4oaud`	$2.50	$80.00

Cost Calculator

US Dollar ($)

Preset:

Input tokens

Output tokens

Number of calls

Versions

Version	Released	Context	Input / 1M	Output / 1M	Status
GPT-5.6 Sol	2026-07-09	1.1M	$5.00	$30.00	Available
GPT-5.6 Terra	2026-07-09	1.1M	$2.50	$15.00	Available
GPT-5.6 Luna	2026-07-09	1.1M	$1.00	$6.00	Available
GPT-5.5	2026-04-24	1.1M	$5.00	$30.00	Available
GPT-5.4 Mini	2026-03-17	1.1M	$0.750	$4.50	Available
GPT-5.4 Nano	2026-03-17	1.1M	$0.200	$1.25	Available
GPT-5.4	2026-03-05	1.1M	$2.50	$15.00	Available
GPT-5.3 Codex	2026-02-24	400K	$1.75	$14.00	Available
GPT-5.2 Codex	2026-01-14	400K	$1.75	$14.00	Available
GPT-5.2	2025-12-11	410K	$1.75	$14.00	Available
GPT-4o Audio	—	—	—	—	Current

Model IDs

openai-gpt-4o-audio

GPT-4o Audio

CapabilitiesAPIGET/api/v1/models/openai-gpt-4o-audio

Pricing by ProviderAPIGET/api/v1/models/openai-gpt-4o-audio/pricing

Cost CalculatorAPIGET/api/v1/models/openai-gpt-4o-audio/pricing/calculate?input_tokens=1000000&output_tokens=500000

VersionsAPIGET/api/v1/models?family=gpt

Model IDsAPIGET/api/v1/models/openai-gpt-4o-audio

Capabilities

Pricing by Provider

Cost Calculator

Versions

Model IDs