Name: AssemblyAI
Brand: AssemblyAI

AssemblyAI is AssemblyAI's speech to text model. AssemblyAI's core audio transcription model offering accurate speech-to-text conversion for a wide range of audio content.

Specifications
Canonical ID	`assemblyai`
Type	Speech to Text
Status	Active
Creator	AssemblyAI
Providers	AssemblyAI
Input Modalities	Audio
Output Modalities	Text

Capabilities

Input1/5

Text·

Image·

Audio✓

Video·

PDF·

Output1/5

Text✓

Image·

Audio·

Video·

Embedding·

Capabilities0/13

Reasoning·

Adaptive Reasoning·

Function Calling·

Parallel Function Calling·

Structured Outputs·

Native JSON Schema·

Web Search·

URL Context·

Computer Use·

Code Execution·

File Search·

Prompt Caching·

Assistant Prefill·

Pricing by Provider

US Dollar ($)

Per 1M tokens

Provider	Standard
Provider	Audio In $ / sec
AssemblyAI `assemblyai/nano`	$0.000103

Cost Calculator

US Dollar ($)

Preset:

Input tokens

Output tokens

Number of calls

Versions

Version	Released	Context	Input / 1M	Output / 1M	Status
AssemblyAI	—	—	—	—	Current
AssemblyAI Best	—	—	—	—	Available

Model IDs

assemblyai

assemblyai/nano

AssemblyAI

CapabilitiesAPIGET/api/v1/models/assemblyai

Pricing by ProviderAPIGET/api/v1/models/assemblyai/pricing

Cost CalculatorAPIGET/api/v1/models/assemblyai/pricing/calculate?input_tokens=1000000&output_tokens=500000

VersionsAPIGET/api/v1/models?family=assemblyai

Model IDsAPIGET/api/v1/models/assemblyai

Capabilities

Pricing by Provider

Cost Calculator

Versions

Model IDs