Name: BiT-M R50x3 ImageNet-21k
Brand: Google

BiT-M R50x3 ImageNet-21k is Google's image to text model. A Big Transfer (BiT-M) vision model with a ResNet-50x3 backbone pretrained on the large-scale ImageNet-21k dataset, providing rich feature representations for image classification.

Specifications
Canonical ID	`google-bit-m-r50x3-imagenet21k`
Type	Image to Text
Status	Active
Creator	Google
Input Modalities	Image
Output Modalities	Text

Capabilities

Input1/5

Text·

Image✓

Audio·

Video·

PDF·

Output1/5

Text✓

Image·

Audio·

Video·

Embedding·

Capabilities0/13

Reasoning·

Adaptive Reasoning·

Function Calling·

Parallel Function Calling·

Structured Outputs·

Native JSON Schema·

Web Search·

URL Context·

Computer Use·

Code Execution·

File Search·

Prompt Caching·

Assistant Prefill·

Versions

Version	Released	Context	Input / 1M	Output / 1M	Status
BiT-M R50x3 ImageNet-21k	—	—	—	—	Current
BiT-M Classification	—	—	—	—	Available
BiT-M Feature Vector	—	—	—	—	Available
BiT-M R50x3	—	—	—	—	Available
BiT-M R50x3 ImageNet-21k	—	—	—	—	Available
BiT-S R101x1	—	—	—	—	Available
BiT-S R101x1 Feature Vector	—	—	—	—	Available
BiT-S R101x3	—	—	—	—	Available
BiT-S R101x3 Feature Vector	—	—	—	—	Available
BiT-S R152x4	—	—	—	—	Available
BiT-S R50x1	—	—	—	—	Available

Model IDs

google-bit-m-r50x3-imagenet21k

tensorflow-icembedding-bit-m-r50x3-imagenet21k-featurevector-1

BiT-M R50x3 ImageNet-21k

CapabilitiesAPIGET/api/v1/models/google-bit-m-r50x3-imagenet21k

VersionsAPIGET/api/v1/models?family=bit

Model IDsAPIGET/api/v1/models/google-bit-m-r50x3-imagenet21k

Capabilities

Versions

Model IDs