Name: BiomedCLIP
Brand: Microsoft

BiomedCLIP is Microsoft's language model. A biomedical vision-language model trained on large-scale medical image-text pairs for cross-modal retrieval and classification in clinical domains.

Specifications
Canonical ID	`microsoft-biomedclip`
Type	Language
Status	Active
Creator	Microsoft
Input Modalities	Text
Output Modalities	Text

Capabilities

Input1/5

Text✓

Image·

Audio·

Video·

PDF·

Output1/5

Text✓

Image·

Audio·

Video·

Embedding·

Capabilities0/13

Reasoning·

Adaptive Reasoning·

Function Calling·

Parallel Function Calling·

Structured Outputs·

Native JSON Schema·

Web Search·

URL Context·

Computer Use·

Code Execution·

File Search·

Prompt Caching·

Assistant Prefill·

Model IDs

google_vertex_microsoft/publishers/microsoft/models/microsoft-biomedclip
microsoft-biomedclip