Name: CenterNet ResNet-v1-101
Brand: Google

CenterNet ResNet-v1-101 is Google's image to text model. CenterNet object detection model using a ResNet-v1-101 backbone, detecting objects as keypoints for efficient bounding box prediction.

Specifications
Canonical ID	`google-centernet-resnet101`
Type	Image to Text
Status	Active
Creator	Google
Input Modalities	Image
Output Modalities	Text

Capabilities

Input1/5

Text·

Image✓

Audio·

Video·

PDF·

Output1/5

Text✓

Image·

Audio·

Video·

Embedding·

Capabilities0/13

Reasoning·

Adaptive Reasoning·

Function Calling·

Parallel Function Calling·

Structured Outputs·

Native JSON Schema·

Web Search·

URL Context·

Computer Use·

Code Execution·

File Search·

Prompt Caching·

Assistant Prefill·

Versions

Version	Released	Context	Input / 1M	Output / 1M	Status
CenterNet ResNet-v1-101	—	—	—	—	Current
CenterNet Hourglass	—	—	—	—	Available
CenterNet Hourglass Keypoints	—	—	—	—	Available
CenterNet ResNet-v1-50	—	—	—	—	Available
CenterNet ResNet-v1-50 Keypoints	—	—	—	—	Available
CenterNet ResNet-v2-50	—	—	—	—	Available
CenterNet ResNet-v2-50 Keypoints	—	—	—	—	Available

Model IDs

google-centernet-resnet101

tensorflow-od-centernet-resnet101v1-fpn-512x512-1

CenterNet ResNet-v1-101

CapabilitiesAPIGET/api/v1/models/google-centernet-resnet101

VersionsAPIGET/api/v1/models?family=centernet

Model IDsAPIGET/api/v1/models/google-centernet-resnet101

Capabilities

Versions

Model IDs