Name: PaddleOCR 0.9B VL
Brand: PaddlePaddle (Baidu)

PaddleOCR 0.9B VL is PaddlePaddle (Baidu)'s language model. A compact 0.9B vision-language model optimized for document parsing and OCR tasks, balancing resource efficiency with strong multimodal document understanding.

Specifications
Canonical ID	`paddlepaddle-paddleocr-0-9b-vl`
Type	Language
Status	Active
Creator	PaddlePaddle (Baidu)
Input Modalities	Text
Output Modalities	Text
Parameters	0.9B

Capabilities

Input1/5

Text✓

Image·

Audio·

Video·

PDF·

Output1/5

Text✓

Image·

Audio·

Video·

Embedding·

Capabilities0/13

Reasoning·

Adaptive Reasoning·

Function Calling·

Parallel Function Calling·

Structured Outputs·

Native JSON Schema·

Web Search·

URL Context·

Computer Use·

Code Execution·

File Search·

Prompt Caching·

Assistant Prefill·

Versions

Version	Released	Context	Input / 1M	Output / 1M	Status
PaddleOCR 0.9B VL	—	—	—	—	Current
PaddleOCR VL	—	16K	$0.020	$0.020	Available

Model IDs

deepinfra/PaddlePaddle/PaddleOCR-VL-0.9B
paddlepaddle-paddleocr-0-9b-vl