Name: Long Form
Brand: Amazon

Long Form is Amazon's text to speech model. Amazon's TTS audio speech model optimized for generating long-form spoken audio content.

Specifications
Canonical ID	`amazon-long-form`
Type	Text to Speech
Status	Active
Creator	Amazon
Providers	AWS Polly
Input Modalities	Text
Output Modalities	Audio

Capabilities

Input1/5

Text✓

Image·

Audio·

Video·

PDF·

Output1/5

Text·

Image·

Audio✓

Video·

Embedding·

Capabilities0/13

Reasoning·

Adaptive Reasoning·

Function Calling·

Parallel Function Calling·

Structured Outputs·

Native JSON Schema·

Web Search·

URL Context·

Computer Use·

Code Execution·

File Search·

Prompt Caching·

Assistant Prefill·

Pricing by Provider

US Dollar ($)

Per 1M tokens

Provider	Standard
Provider	Audio In $ / 1K chars
AWS Polly `aws_polly/long-form`	$0.100

Cost Calculator

US Dollar ($)

Preset:

Input tokens

Output tokens

Number of calls

Versions

Version	Released	Context	Input / 1M	Output / 1M	Status
Long Form	—	—	—	—	Current
Generative	—	—	—	—	Available
Instance Segmentation	—	—	—	—	Available
Neural	—	—	—	—	Available
Standard	—	—	—	—	Available
TabTransformer Classification	—	—	—	—	Available
TabTransformer Regression	—	—	—	—	Available
XGBoost Classification	—	—	—	—	Available
XGBoost Regression	—	—	—	—	Available

Model IDs

amazon-long-form

aws_polly/long-form

Long Form

CapabilitiesAPIGET/api/v1/models/amazon-long-form

Pricing by ProviderAPIGET/api/v1/models/amazon-long-form/pricing

Cost CalculatorAPIGET/api/v1/models/amazon-long-form/pricing/calculate?input_tokens=1000000&output_tokens=500000

VersionsAPIGET/api/v1/models?family=amazon

Model IDsAPIGET/api/v1/models/amazon-long-form

Capabilities

Pricing by Provider

Cost Calculator

Versions

Model IDs