Name: GLM-OCR
Brand: Zhipu AI

GLM-OCR is Zhipu AI's image to text model. A lightweight 0.9B-parameter OCR model from Z.AI achieving top-tier document recognition performance on OmniDocBench, optimized for real-world business document processing scenarios.

Specifications
Canonical ID	`zhipu-glm-ocr`
Type	Image to Text
Status	Active
Creator	Zhipu AI
Input Modalities	Text
Output Modalities	Text
Parameters	1.32B
HuggingFace Likes	1,806
HuggingFace Downloads (30d)	4,468,881
HuggingFace Downloads (all-time)	20,912,030

Capabilities

Input1/5

Text✓

Image·

Audio·

Video·

PDF·

Output1/5

Text✓

Image·

Audio·

Video·

Embedding·

Capabilities0/13

Reasoning·

Adaptive Reasoning·

Function Calling·

Parallel Function Calling·

Structured Outputs·

Native JSON Schema·

Web Search·

URL Context·

Computer Use·

Code Execution·

File Search·

Prompt Caching·

Assistant Prefill·

Versions

Version	Released	Context	Input / 1M	Output / 1M	Status
GLM-5V Turbo	2026-04-01	200K	$1.20	$4.00	Available
GLM-5 Turbo	2026-03-15	262K	$1.20	$4.00	Available
GLM-5.1 Non-Reasoning	—	—	—	—	Available
GLM-5 Non-Reasoning	—	—	—	—	Available
GLM-5 Code	—	200K	$1.20	$5.00	Available
GLM-4.6V Flash	2025-09-30	128K	—	—	Available
GLM-4 32B	2025-07-24	128K	$0.100	$0.100	Available
GLM-4.7 FlashX	2025-01-01	200K	$0.060	$0.400	Available
GLM-4.7 Non-Reasoning	—	—	—	—	Available
GLM-4.6 Reasoning	—	—	—	—	Available
GLM-OCR	—	—	—	—	Current

Model IDs

zai-org/glm-ocr

zhipu-glm-ocr

GLM-OCR

CapabilitiesAPIGET/api/v1/models/zhipu-glm-ocr

VersionsAPIGET/api/v1/models?family=glm

Model IDsAPIGET/api/v1/models/zhipu-glm-ocr

Capabilities

Versions

Model IDs