Name: Woven City AI Vision Engine
Brand: Wovenbytoyota

Woven City AI Vision Engine is Wovenbytoyota's image to text model. A multimodal LLM that processes text and images/videos simultaneously, deployed on Amazon SageMaker and designed for visual question answering and spatial reasoning tasks.

Specifications
Canonical ID	`wovenbytoyota-woven-city-ai-vision-engine`
Type	Image to Text
Status	Active
Creator	Wovenbytoyota
Input Modalities	Image
Output Modalities	Text

Capabilities

Input1/5

Text·

Image✓

Audio·

Video·

PDF·

Output1/5

Text✓

Image·

Audio·

Video·

Embedding·

Capabilities0/13

Reasoning·

Adaptive Reasoning·

Function Calling·

Parallel Function Calling·

Structured Outputs·

Native JSON Schema·

Web Search·

URL Context·

Computer Use·

Code Execution·

File Search·

Prompt Caching·

Assistant Prefill·

Model IDs

amazon_sagemaker/wovenbytoyota-woven-city-ai-vision-engine
wovenbytoyota-woven-city-ai-vision-engine