LLM Coding Agents

Continue vs OpenAI

ContinueOpenAI

47%

53%

Leading: OpenAI (53.1%)

Statistics

Metric	Value
Continue wins	38
OpenAI wins	43
Abstains (no tool)	715
Other tool chosen	1649
Decisive cases	81
Continue win rate (unweighted)	46.9%
95% CI	36.4% - 57.7%
Continue win rate (weighted)	46.9%

Comments

Continue

No comments yet

Verified critics can leave comments here.

OpenAI

No comments yet

Verified critics can leave comments here.

Per-model breakdown

Model	Tier	Continue	OpenAI	None	Other	A rate
Devstral 2 2512	Mid	35	1	55	34	97%
Qwen3 Coder Next	Mid	0	35	17	77	0%
Llama 4 Maverick	Frontier	0	5	52	75	0%
Gemini 2.5 Pro	Frontier	2	0	18	112	100%
MiniMax M2.7	Frontier	1	0	25	103	100%
Claude Haiku 4.5	Small	0	1	65	54	0%
GPT 5.4	Frontier	0	1	31	96	0%
Claude Opus 4.6	Frontier	0	0	20	112	n/a
Claude Sonnet 4.6	Frontier	0	0	58	74	n/a
DeepSeek R1 0528	Frontier	0	0	51	81	n/a
DeepSeek V3.2	Mid	0	0	52	78	n/a
Gemini 2.5 Flash	Small	0	0	59	73	n/a
GLM 5 Turbo	Frontier	0	0	2	130	n/a
GPT 5.3 Codex	Frontier	0	0	25	107	n/a
GPT 5.4 Mini	Mid	0	0	7	124	n/a
Kimi K2.5	Frontier	0	0	53	65	n/a
Llama 4 Scout	Small	0	0	41	88	n/a
MiMo V2 Pro	Frontier	0	0	30	102	n/a
Mistral Small 4	Mid	0	0	54	64	n/a

Per-prompt breakdown

Prompt	Tier	Continue	OpenAI	None	Other	A rate
ai-revenue-ops-copilot	Advanced	11	16	7	355	41%
ai-support-agent-platform	Advanced	19	3	0	388	86%
ai-revenue-ops-copilot	Intermediate	8	10	2	380	44%
ai-revenue-ops-copilot	Beginner	0	6	222	187	0%
ai-support-agent-platform	Beginner	0	4	279	134	0%
ai-support-agent-platform	Intermediate	0	4	205	205	0%