Name: Qwen3.7 Plus VL Instruct
Brand: Alibaba

Qwen3.7 Plus VL Instruct is Alibaba's language model. A Qwen3 mixture-of-experts vision-language model designed for multimodal instruction-following, combining image understanding with strong language capabilities.

Specifications
Canonical ID	`alibaba-qwen3-7-plus-vl-instruct`
Type	Language
Status	Active
Creator	Alibaba
Input Modalities	Text
Output Modalities	Text

Capabilities

Input1/5

Text✓

Image·

Audio·

Video·

PDF·

Output1/5

Text✓

Image·

Audio·

Video·

Embedding·

Capabilities0/13

Reasoning·

Adaptive Reasoning·

Function Calling·

Parallel Function Calling·

Structured Outputs·

Native JSON Schema·

Web Search·

URL Context·

Computer Use·

Code Execution·

File Search·

Prompt Caching·

Assistant Prefill·

Other Models

Model	Tier	Released	Context	Input / 1M	Output / 1M
Qwen3.5 122B A10B	—	2026-02-25	262K	$0.250	$1.75
Qwen3.5 35B A3B	—	2026-02-25	262K	$0.140	$1.00
Qwen3.5 397B A17B	—	2026-02-16	262K	$0.390	$2.34

Model IDs

accounts/fireworks/models/qwen3p7-plus-vl-instruct

alibaba-qwen3-7-plus-vl-instruct

Qwen3.7 Plus VL Instruct

CapabilitiesAPIGET/api/v1/models/alibaba-qwen3-7-plus-vl-instruct

Other ModelsAPIGET/api/v1/models/alibaba-qwen3-7-plus-vl-instruct/similar

Model IDsAPIGET/api/v1/models/alibaba-qwen3-7-plus-vl-instruct

Capabilities

Other Models

Model IDs