Name: Tongyi Flash Embedding Vision
Brand: Alibaba

Tongyi Flash Embedding Vision is Alibaba's embedding model, starting at $0.03 / 1M input. A fast-tier Tongyi multimodal embedding model supporting vision and text for cross-modal retrieval.

Specifications
Canonical ID	`alibaba-tongyi-flash-embedding-vision`
Type	Embedding
Status	Active
Creator	Alibaba
Providers	Alibaba Qwen
Input Modalities	Text
Output Modalities	Embedding

Capabilities

Input1/5

Text✓

Image·

Audio·

Video·

PDF·

Output1/5

Text·

Image·

Audio·

Video·

Embedding✓

Capabilities0/13

Reasoning·

Adaptive Reasoning·

Function Calling·

Parallel Function Calling·

Structured Outputs·

Native JSON Schema·

Web Search·

URL Context·

Computer Use·

Code Execution·

File Search·

Prompt Caching·

Assistant Prefill·

Pricing by Provider

US Dollar ($)

Per 1M tokens

Provider	Standard	Batch
Provider	Input $ / 1M	Input $ / 1M
Alibaba Qwen `tongyi-embedding-vision-flash`	$0.03	$0.015

Cost Calculator

US Dollar ($)

Preset:

Input tokens

Output tokens

Number of calls

Other Models

Model	Tier	Released	Context	Input / 1M	Output / 1M
Tongyi Intent Detect 3	—	—	8K	$0.058	$0.144
Tongyi DeepResearch 30B A3B	—	2025-09-18	131K	—	—
Tongyi Plus Embedding Vision	Plus	—	—	$0.090	—

Model IDs

alibaba-tongyi-flash-embedding-vision

tongyi-embedding-vision-flash

Tongyi Flash Embedding Vision

CapabilitiesAPIGET/api/v1/models/alibaba-tongyi-flash-embedding-vision

Pricing by ProviderAPIGET/api/v1/models/alibaba-tongyi-flash-embedding-vision/pricing

Cost CalculatorAPIGET/api/v1/models/alibaba-tongyi-flash-embedding-vision/pricing/calculate?input_tokens=1000000&output_tokens=500000

Other ModelsAPIGET/api/v1/models/alibaba-tongyi-flash-embedding-vision/similar

Model IDsAPIGET/api/v1/models/alibaba-tongyi-flash-embedding-vision

Capabilities

Pricing by Provider

Cost Calculator

Other Models

Model IDs