Name: Step 3.7 Flash NVFP4
Brand: StepFun

Step 3.7 Flash NVFP4 is StepFun's language model. A 198B-parameter sparse MoE vision-language model optimized with NVFP4 quantization, combining a large language backbone with a vision encoder for efficient multimodal inference.

Specifications
Canonical ID	`step-3-7-flash-nvfp4`
Type	Language
Status	Active
Creator	StepFun
Input Modalities	Text
Output Modalities	Text

Capabilities

Input1/5

Text✓

Image·

Audio·

Video·

PDF·

Output1/5

Text✓

Image·

Audio·

Video·

Embedding·

Capabilities0/13

Reasoning·

Adaptive Reasoning·

Function Calling·

Parallel Function Calling·

Structured Outputs·

Native JSON Schema·

Web Search·

URL Context·

Computer Use·

Code Execution·

File Search·

Prompt Caching·

Assistant Prefill·

Model IDs

accounts/fireworks/models/step-3p7-flash-nvfp4

step-3-7-flash-nvfp4

Step 3.7 Flash NVFP4

CapabilitiesAPIGET/api/v1/models/step-3-7-flash-nvfp4

Model IDsAPIGET/api/v1/models/step-3-7-flash-nvfp4

Capabilities

Model IDs