Are AI models getting better over time?

We plotted every model we've tested by its release date and how it scores on real business tasks. Newest releases sit on the right.

Models dated

Kimi K2.7 Code

Newest · 17 days ago

GPT-4o

Oldest · 2.1 years ago

Every model, by age

Model	Released ▾	Our standing	Price /1M
Kimi K2.7 CodeMoonshotAI	17 days ago(2026-06-12)	61	$4.24
Claude Opus 4.8Anthropic	1 month ago(2026-05-27)	79	$30.0
Qwen3.7 MaxQwen	1 month ago(2026-05-21)	82	$5.0
Gemini 3.5 FlashGoogle	1 month ago(2026-05-19)	68	$10.5
Gemini 3.1 Flash LiteGoogle	2 months ago(2026-05-07)	48	$1.75
GPT-5.5OpenAI	2 months ago(2026-04-24)	85	$35.0
GPT-5.5 ProOpenAI	2 months ago(2026-04-24)	44	$210.0
Claude Opus 4.7Anthropic	2 months ago(2026-04-16)	75	$30.0
GLM 5.1Z.ai	3 months ago(2026-04-07)	33	$4.06
Grok 4.20xAI	3 months ago(2026-03-31)	35	$3.75
MiniMax M2.7MiniMax	3 months ago(2026-03-18)	18	$0.9
GPT-5.4 MiniOpenAI	3 months ago(2026-03-17)	50	$5.25
GPT-5.4 NanoOpenAI	3 months ago(2026-03-17)	29	$1.45
GPT-5.4OpenAI	4 months ago(2026-03-05)	79	$17.5
Gemini 3.1 Flash Lite PreviewGoogle	4 months ago(2026-03-03)	51	$1.75
Gemini 3.1 Pro PreviewGoogle	4 months ago(2026-02-19)	84	$14.0
Claude Sonnet 4.6Anthropic	4 months ago(2026-02-17)	60	$18.0
Qwen3.5 Plus 2026-02-15Qwen	4 months ago(2026-02-16)	64	$1.82
GLM 5Z.ai	5 months ago(2026-02-11)	52	$2.52
Claude Opus 4.6Anthropic	5 months ago(2026-02-04)	67	$30.0
Kimi K2.5MoonshotAI	5 months ago(2026-01-27)	49	$2.4
Gemini 3 Flash PreviewGoogle	6 months ago(2025-12-17)	54	$3.5
DeepSeek V3.2DeepSeek	7 months ago(2025-12-01)	48	$0.572
Claude Opus 4.5Anthropic	7 months ago(2025-11-24)	78	$30.0
Claude Haiku 4.5Anthropic	8 months ago(2025-10-15)	25	$6.0
Claude Sonnet 4.5Anthropic	9 months ago(2025-09-29)	64	$18.0
DeepSeek V3.1 TerminusDeepSeek	9 months ago(2025-09-22)	40	$1.22
Qwen3 Coder FlashQwen	9 months ago(2025-09-17)	6	$1.17
Mistral Medium 3.1Mistral	11 months ago(2025-08-13)	27	$2.4
GPT-5 MiniOpenAI	11 months ago(2025-08-07)	35	$2.25
Gemini 2.5 ProGoogle	1.0 years ago(2025-06-17)	44	$11.25
Gemini 2.5 FlashGoogle	1.0 years ago(2025-06-17)	13	$0.75
o1OpenAI	1.5 years ago(2024-12-17)	9	$75.0
GPT-4o MiniOpenAI	1.9 years ago(2024-07-18)	2	$0.75
GPT-4oOpenAI	2.1 years ago(2024-05-13)	4	$12.5
Grok 4.20 BetaxAI	—	33	$8.0

Release dates via OpenRouter (model availability date). “Our standing” is each model's average percentile across the task areas we test.