Name: MobileNet 3
Brand: Google

MobileNet 3 is Google's image to text model. A MobileNetV3 image classification model offering improved accuracy-efficiency trade-offs in small and large variants.

Specifications
Canonical ID	`google-mobilenet-3`
Type	Image to Text
Status	Active
Creator	Google
Input Modalities	Image
Output Modalities	Text

Capabilities

Input1/5

Text·

Image✓

Audio·

Video·

PDF·

Output1/5

Text✓

Image·

Audio·

Video·

Embedding·

Capabilities0/13

Reasoning·

Adaptive Reasoning·

Function Calling·

Parallel Function Calling·

Structured Outputs·

Native JSON Schema·

Web Search·

URL Context·

Computer Use·

Code Execution·

File Search·

Prompt Caching·

Assistant Prefill·

Versions

Version	Released	Context	Input / 1M	Output / 1M	Status
MobileNet 3	—	—	—	—	Current
MobileNet V3 Large	—	—	—	—	Available
MobileNet 2	—	—	—	—	Available
MobileNet 2 Classification	—	—	—	—	Available
MobileNet 2 Featurevector	—	—	—	—	Available
MobileNet V2 0.35 224 Feature Vector	—	—	—	—	Available
MobileNet V2 0.75 224	—	—	—	—	Available
MobileNet V2 1.30 224 Feature Vector	—	—	—	—	Available
MobileNet V2 1.40 224 Feature Vector	—	—	—	—	Available
MobileNet V1 0.25 128	—	—	—	—	Available
MobileNet V1 0.25 128 Feature Vector	—	—	—	—	Available

Model IDs

google-mobilenet-3

tensorflow-ic-imagenet-mobilenet-v3-large-100-224

tensorflow-ic-imagenet-mobilenet-v3-small-075-224

tensorflow-ic-imagenet-mobilenet-v3-small-100-224

MobileNet 3

CapabilitiesAPIGET/api/v1/models/google-mobilenet-3

VersionsAPIGET/api/v1/models?family=mobilenet

Model IDsAPIGET/api/v1/models/google-mobilenet-3

Capabilities

Versions

Model IDs