Benchmarks

Top models across a combined benchmark plus Artificial Analysis, LMArena, LiveBench, FrontierCode, Epoch AI, ARC Prize, EQ-Bench, Design Arena, and NanoGPT benchmark categories.

Text Image Video

Combined

Artificial Analysis

LMArena

LiveBench

FrontierCode

Epoch AI

ARC Prize

EQ-Bench

Design Arena

NanoGPT

Combined

Equal-weight blend of Artificial Analysis Intelligence Index, LMArena Overall, LiveBench Overall, NanoGPT Usage Share. Each source is min-max normalized to 0-100 across its current leaderboard and weighted at 25%. Missing or unavailable source entries contribute 0.

Top 20 price vs performance

Best value frontier

X-axis: $/M blended tokens

Best value frontier: No cheaper model has a better benchmark result.

1.

Claude Fable 5