Tickerr / Compare

AI Model Speed & Cost Comparison 2026

Live P50/P95 TTFT benchmarks, API pricing, and uptime across Claude, GPT-4, Gemini, Groq, Mistral, and more - updated every 5 minutes from independent inference checks.

Live model performance & pricing

Fastest model right now: Llama 3.3 70B · 237ms median TTFT (last 24h)

Model	Provider	P50 TTFT ↑	P95 TTFT	Input /1M	Output /1M	Status
Llama 3.3 70B	Groq	237ms	457ms	Free	Free	●Operational
Llama 4 Scout (Groq)	Groq	281ms	805ms	Free	Free	●Operational
Mistral Small	Mistral	346ms	486ms	$0.0600	$0.180	●Operational
Gemini 2.5 Flash Lite	Google	367ms	561ms	$0.100	$0.400	●Operational
Mistral Large	Mistral	502ms	1599ms	$0.500	$1.50	●Operational
Gemini 2.5 Flash	Google	505ms	633ms	$0.300	$2.50	●Operational
Claude Haiku 4.5	Anthropic	552ms	953ms	$1.00	$5.00	●Operational
GPT-4.1 Mini	OpenAI	765ms	1545ms	$0.400	$1.60	●Operational
GPT-4o Mini	OpenAI	795ms	1535ms	$0.150	$0.600	●Operational
Claude Sonnet 4.6	Anthropic	917ms	2622ms	$3.00	$15.00	●Operational
Claude Opus 4.7	Anthropic	1197ms	1866ms	$5.00	$25.00	●Operational
Grok 3	xAI	1475ms	3014ms	$3.00	$15.00	●Operational
Grok 3 Mini	xAI	1528ms	2739ms	$0.300	$0.500	●Operational
Claude Opus 4.6	Anthropic	1709ms	2777ms	$5.00	$25.00	●Operational
Llama 3.1 8B (Cerebras)	Cerebras	—	—	Free	Free	●Down
Qwen3 235B (Cerebras)	Cerebras	—	—	Free	Free	●Down
Command R+	Cohere	—	—	$2.50	$10.00	●Operational

P50 = typical speed. P95 = worst case 95% of the time. Measured by Tickerr's independent inference checks every 5 minutes. Pricing from official provider docs. Requires ≥10 checks to compute percentiles. Click any column header to sort.

Tool comparisons

AI assistants

DeepSeek vs Gemini

Pricing · Limits · Uptime

›

Cohere Command R vs ChatGPT

Pricing · Limits · Uptime

›

Mistral vs Claude

Pricing · Limits · Uptime

›

Kagi vs Perplexity AI

Pricing · Limits · Uptime

›

Notion AI vs ChatGPT

Pricing · Limits · Uptime

›

Jasper AI vs ChatGPT

Pricing · Limits · Uptime

›

Grammarly vs ChatGPT

Pricing · Limits · Uptime

›

Grok vs Claude

Pricing · Limits · Uptime

›

Perplexity AI vs Gemini

Pricing · Limits · Uptime

›

Meta AI vs ChatGPT

Pricing · Limits · Uptime

›

Grok vs Gemini

Pricing · Limits · Uptime

›

Claude vs Gemini

Pricing · Limits · Uptime

›

Perplexity AI vs Claude

Pricing · Limits · Uptime

›

ChatGPT vs Microsoft Copilot

Pricing · Limits · Uptime

›

Perplexity AI vs ChatGPT

Pricing · Limits · Uptime

›

Mistral vs ChatGPT

Pricing · Limits · Uptime

›

DeepSeek vs Claude

Pricing · Limits · Uptime

›

Claude vs ChatGPT

Pricing · Limits · Uptime

›

DeepSeek vs ChatGPT

Pricing · Limits · Uptime

›

Gemini vs ChatGPT

Pricing · Limits · Uptime

›

Grok vs ChatGPT

Pricing · Limits · Uptime

›

Coding tools

Phind vs Cursor

Pricing · Limits · Uptime

›

Aider vs Cursor

Pricing · Limits · Uptime

›

Amazon Q vs Microsoft Copilot

Pricing · Limits · Uptime

›

Windsurf vs Microsoft Copilot

Pricing · Limits · Uptime

›

Tabnine vs Microsoft Copilot

Pricing · Limits · Uptime

›

Cline vs Cursor

Pricing · Limits · Uptime

›

GitHub Copilot vs Cursor

Pricing · Limits · Uptime

›

Windsurf vs Cursor

Pricing · Limits · Uptime

›

Cursor vs Microsoft Copilot

Pricing · Limits · Uptime

›

Claude vs Cursor

Pricing · Limits · Uptime

›

App builders

Windsurf vs Replit

Pricing · Limits · Uptime

›

v0 vs Bolt

Pricing · Limits · Uptime

›

Bolt vs Replit

Pricing · Limits · Uptime

›

v0 vs Lovable

Pricing · Limits · Uptime

›

Lovable vs Bolt

Pricing · Limits · Uptime

›

Replit vs Lovable

Pricing · Limits · Uptime

›

Replit vs Cursor

Pricing · Limits · Uptime

›

Automation

Voiceflow vs Botpress

Pricing · Limits · Uptime

›

Dify vs Flowise

Pricing · Limits · Uptime

›

Make vs Zapier

Pricing · Limits · Uptime

›

n8n vs Make

Pricing · Limits · Uptime

›

n8n vs Zapier

Pricing · Limits · Uptime

›

Infrastructure

Fireworks AI vs Together AI

Pricing · Limits · Uptime

›

Together AI vs Groq

Pricing · Limits · Uptime

›

OpenRouter vs Together AI

Pricing · Limits · Uptime

›

Replicate vs fal.ai

Pricing · Limits · Uptime

›

Cerebras vs Groq

Pricing · Limits · Uptime

›

Groq vs OpenRouter

Pricing · Limits · Uptime

›

Groq vs Grok

Pricing · Limits · Uptime

›

Other

Flux vs Midjourney

Pricing · Limits · Uptime

›

Leonardo AI vs Midjourney

Pricing · Limits · Uptime

›

Opus Clip vs Descript

Pricing · Limits · Uptime

›

Copy.ai vs Jasper AI

Pricing · Limits · Uptime

›

Writesonic vs Jasper AI

Pricing · Limits · Uptime

›

Play.ht vs ElevenLabs

Pricing · Limits · Uptime

›

Canva AI vs Adobe Firefly

Pricing · Limits · Uptime

›

InVideo AI vs HeyGen

Pricing · Limits · Uptime

›

HeyGen vs Runway

Pricing · Limits · Uptime

›

Kling AI vs Runway

Pricing · Limits · Uptime

›

Adobe Firefly vs Midjourney

Pricing · Limits · Uptime

›

Luma Dream Machine vs Runway

Pricing · Limits · Uptime

›

Suno vs Udio

Pricing · Limits · Uptime

›

Runway vs Sora

Pricing · Limits · Uptime

›

Pika vs Runway

Pricing · Limits · Uptime

›

ElevenLabs vs Murf AI

Pricing · Limits · Uptime

›

Ideogram vs Midjourney

Pricing · Limits · Uptime

›

Midjourney vs Stable Diffusion

Pricing · Limits · Uptime

›

Midjourney vs DALL-E

Pricing · Limits · Uptime

›

HeyGen vs Synthesia

Pricing · Limits · Uptime

›