Name: XTTS V2
Brand: Coqui

XTTS V2 is Coqui's text to speech model. Coqui's second-generation cross-lingual text-to-speech model supporting voice cloning and multilingual synthesis.

Specifications
Canonical ID	`coqui-xtts-2`
Type	Text to Speech
Status	Active
Creator	Coqui
Input Modalities	Text
Output Modalities	Audio

Benchmarks
Elo Rating	894 #288

Capabilities

Input1/5

Text✓

Image·

Audio·

Video·

PDF·

Output1/5

Text·

Image·

Audio✓

Video·

Embedding·

Capabilities0/13

Reasoning·

Adaptive Reasoning·

Function Calling·

Parallel Function Calling·

Structured Outputs·

Native JSON Schema·

Web Search·

URL Context·

Computer Use·

Code Execution·

File Search·

Prompt Caching·

Assistant Prefill·

Model IDs

artificialanalysis/xtts-v2
coqui-xtts-2
xtts-v2