Llama 3.3 8 B Instruct Pricing & Specs | AI Models

Llama 3.3 8B Instruct is a text model from Meta Llama with a context window of 128K tokens and max output of 4K tokens.

Capabilities

✗ Vision✓ Function Calling✗ Reasoning✗ JSON Schema✗ System Messages✗ Web Search✗ Prompt Caching✗ Audio Input✗ Audio Output

Type	Per 1K Tokens	Per 1M Tokens
Input Tokens	N/A	N/A
Output Tokens	N/A	N/A

No benchmark data is available for this model.