LLM Coding Agents

Codex CLI vs Claude Code

Codex CLIClaude Code

29%

71%

Leading: Claude Code (71.4%)

Insufficient data

This matchup has 7 decisive cases (minimum 30 required for publication).

Statistics

Metric	Value
Codex CLI wins	2
Claude Code wins	5
Abstains (no tool)	284
Other tool chosen	709
Decisive cases	7
Codex CLI win rate (unweighted)	28.6%
95% CI	8.2% - 64.1%
Codex CLI win rate (weighted)	28.6%

Comments

Codex CLI

No comments yet

Verified critics can leave comments here.

Claude Code

No comments yet

Verified critics can leave comments here.

Per-model breakdown

Model	Tier	Codex CLI	Claude Code	None	Other	A rate
GPT 5.4	Frontier	1	2	10	38	33%
MiniMax M2.7	Frontier	0	3	11	39	0%
GPT 5.4 Mini	Mid	1	0	4	49	100%
Claude Haiku 4.5	Small	0	0	26	25	n/a
Claude Opus 4.6	Frontier	0	0	8	46	n/a
Claude Sonnet 4.6	Frontier	0	0	22	32	n/a
DeepSeek R1 0528	Frontier	0	0	21	33	n/a
DeepSeek V3.2	Mid	0	0	21	33	n/a
Devstral 2 2512	Mid	0	0	19	32	n/a
Gemini 2.5 Flash	Small	0	0	25	29	n/a
Gemini 2.5 Pro	Frontier	0	0	6	48	n/a
GLM 5 Turbo	Frontier	0	0	0	54	n/a
GPT 5.3 Codex	Frontier	0	0	10	44	n/a
Kimi K2.5	Frontier	0	0	21	27	n/a
Llama 4 Maverick	Frontier	0	0	22	32	n/a
Llama 4 Scout	Small	0	0	18	35	n/a
MiMo V2 Pro	Frontier	0	0	12	42	n/a
Mistral Small 4	Mid	0	0	22	24	n/a
Qwen3 Coder Next	Mid	0	0	6	47	n/a

Per-prompt breakdown

Prompt	Tier	Codex CLI	Claude Code	None	Other	A rate
ai-support-agent-platform	Advanced	2	1	0	166	67%
ai-revenue-ops-copilot	Advanced	0	2	2	154	0%
ai-revenue-ops-copilot	Intermediate	0	1	1	162	0%
ai-support-agent-platform	Beginner	0	1	110	59	0%
ai-revenue-ops-copilot	Beginner	0	0	90	79	n/a
ai-support-agent-platform	Intermediate	0	0	81	89	n/a