Prompt performance,
not guesswork

Every prompt tested across the same models. Scored by independent AI judges.

Evaluating across GPT-4, Claude 3.5, and Gemini 1.5

Sort By

All scores are aggregated using multi-judge consensus (GPT-4o Mini + Claude 3 Haiku).

How it works →

24 prompts+ found

Sentiment Analysis

Best Modelclaude-3-5-haiku

View details →

City Extractor (Few-Shot)

Best Modelgemini-2.5-flash-lite

View details →

Language Detector

Best Modelgpt-5-mini

View details →

Capital City Extractor

Best Modelgemini-2.5-flash-lite

View details →

chat-langchain-general-prompt

Best Modelgpt-5-mini

View details →

Legal Document Summarizer

Best Modelgemini-2.5-flash-lite

View details →

Table Data Extractor

Best Modelgpt-5-mini

View details →

Topic Classifier

Best Modelgemini-2.5-flash-lite

View details →

chat-langchain-response-prompt

Best Modelclaude-3-5-haiku

View details →

Quote and Citation Extractor

Best Modelclaude-3-5-haiku

View details →

bytes_to_megabytes

Best Modelclaude-3-5-haiku

View details →

RAG Query Answering

Best Modelgpt-5-mini

View details →

medical-docs-summarizer

Best Modelclaude-3-5-haiku

View details →

rag-qa-with-history

Best Modelgpt-5-mini

View details →

retrieval-qa-chat

Best Modelgpt-5-mini

View details →

chat-langchain-more-info-prompt

Best Modelclaude-3-5-haiku

View details →

python_repl

Best Modelgemini-2.5-flash-lite

View details →

self-rag-answer-grader

Best Modelgemini-2.5-flash-lite

View details →

tweet-critic-fewshot

Best Modelclaude-3-5-haiku

View details →

rag-prompt-llama3

Best Modelgemini-2.5-flash-lite

View details →

sciscigpt-tool-eval

Best Modelgemini-2.5-flash-lite

View details →

rag-prompt-med

Best Modelgpt-5-mini

View details →

tbot20_rag

Best Modelclaude-3-5-haiku

View details →

aza-hr-workflow-prompt-v4

Best Modelgemini-2.5-flash-lite

View details →

Scroll for more