Name: GPT Audio 1.5
Brand: OpenAI

GPT Audio 1.5 is OpenAI's language model with a 128K context window and up to 16K output tokens, available from 2 providers, starting at $2.50 / 1M input and $10.00 / 1M output. A versioned release of OpenAI's GPT Audio model supporting audio input and output for conversational and voice-interface applications.

Specifications
Canonical ID	`openai-gpt-audio-1-5`
Type	Language
Status	Active
Creator	OpenAI
Providers	Microsoft Azure AI Foundry OpenAI
Context Window	128K tokens
Max Output	16K tokens
Input Modalities	AudioText
Output Modalities	AudioText
Knowledge Cutoff	2024-09

Capabilities

Input2/5

Text✓

Image·

Audio✓

Video·

PDF·

Output2/5

Text✓

Image·

Audio✓

Video·

Embedding·

Capabilities2/13

Reasoning·

Adaptive Reasoning·

Function Calling✓

Parallel Function Calling✓

Structured Outputs·

Native JSON Schema·

Web Search·

URL Context·

Computer Use·

Code Execution·

File Search·

Prompt Caching·

Assistant Prefill·

Pricing by Provider

Provider	Standard
Provider	Input $ / 1M	Output $ / 1M	Audio In $ / 1M	Audio Out $ / 1M
Azure AI Foundry azure/gpt-audio-1.5-2026-02-23	$2.50	$10.00	$40.00	$80.00
OpenAI gpt-audio-1.5	$2.50	$10.00	$32.00	$64.00

Cost Calculator

Preset:

Input tokens

Output tokens

Number of calls

Versions

Version	Released	Context	Input / 1M	Output / 1M	Status
GPT Audio 1.5	—	128K	$2.50	$10.00	Current
GPT Audio Mini	2025-10-06	128K	$0.600	$2.40	Available
GPT Audio	2025-08-28	128K	$2.50	$10.00	Available
GPT Realtime 2 Image	—	—	—	—	Available
GPT Realtime 2 Text	—	—	—	—	Available

GPT Audio 1.5

Capabilities

Pricing by Provider

Cost Calculator

Versions

Model IDs