diff --git a/.agents/scripts/generate-models-md.sh b/.agents/scripts/generate-models-md.sh
new file mode 100755
index 000000000..bfa11595d
--- /dev/null
+++ b/.agents/scripts/generate-models-md.sh
@@ -0,0 +1,537 @@
+#!/usr/bin/env bash
+# generate-models-md.sh - Generate MODELS.md leaderboard from pattern-tracker and response-scoring data
+# Part of t1012: live model leaderboard with success rates
+#
+# Usage:
+#   generate-models-md.sh [--output PATH] [--quiet]
+#   generate-models-md.sh help
+#
+# Data sources:
+#   1. Model registry DB (model catalog, pricing, tiers)
+#   2. Pattern-tracker (memory.db — success/failure rates by model)
+#   3. Response-scoring DB (head-to-head contest results, quality scores)
+#
+# Output: Markdown file (default: MODELS.md in repo root) with:
+#   - Model catalog table (all available models)
+#   - Performance leaderboard (from pattern data)
+#   - Contest results (from response-scoring data)
+#   - Auto-generation timestamp
+
+set -euo pipefail
+
+# Configuration
+SCRIPT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")" && pwd)" || exit 1
+source "${SCRIPT_DIR}/shared-constants.sh"
+init_log_file
+
+readonly MEMORY_DB="${AIDEVOPS_MEMORY_DIR:-$HOME/.aidevops/.agent-workspace/memory}/memory.db"
+readonly SCORING_DB="${SCORING_DB_OVERRIDE:-$HOME/.aidevops/.agent-workspace/response-scoring.db}"
+readonly REGISTRY_DB="${MODEL_REGISTRY_DB:-$HOME/.aidevops/.agent-workspace/model-registry.db}"
+readonly PATTERN_TYPES="'SUCCESS_PATTERN','FAILURE_PATTERN','WORKING_SOLUTION','FAILED_APPROACH','ERROR_FIX'"
+readonly SUCCESS_TYPES="'SUCCESS_PATTERN','WORKING_SOLUTION'"
+readonly FAILURE_TYPES="'FAILURE_PATTERN','FAILED_APPROACH','ERROR_FIX'"
+
+# Defaults
+OUTPUT_PATH=""
+QUIET=0
+
+log_info() {
+	[[ "$QUIET" -eq 1 ]] && return 0
+	echo -e "${BLUE}[INFO]${NC} $*"
+	return 0
+}
+log_success() {
+	[[ "$QUIET" -eq 1 ]] && return 0
+	echo -e "${GREEN}[OK]${NC} $*"
+	return 0
+}
+log_warn() {
+	echo -e "${YELLOW}[WARN]${NC} $*"
+	return 0
+}
+log_error() {
+	echo -e "${RED}[ERROR]${NC} $*" >&2
+	return 0
+}
+
+#######################################
+# Find the repo root for default output path
+# Returns: repo root path or empty string
+#######################################
+find_repo_root() {
+	git rev-parse --show-toplevel 2>/dev/null || echo ""
+	return 0
+}
+
+#######################################
+# Check if a SQLite database exists and has data
+# Arguments: db_path, table_name
+# Returns: 0 if table has rows, 1 otherwise
+#######################################
+db_has_data() {
+	local db_path="$1"
+	local table_name="$2"
+
+	[[ -f "$db_path" ]] || return 1
+	local count
+	count=$(sqlite3 "$db_path" "SELECT COUNT(*) FROM $table_name;" 2>/dev/null) || return 1
+	[[ "$count" -gt 0 ]] && return 0
+	return 1
+}
+
+#######################################
+# Generate the model catalog section from registry DB
+# Outputs: markdown table to stdout
+#######################################
+generate_catalog() {
+	if ! [[ -f "$REGISTRY_DB" ]]; then
+		echo "No model registry database found."
+		echo ""
+		return 0
+	fi
+
+	local count
+	count=$(sqlite3 "$REGISTRY_DB" "SELECT COUNT(*) FROM models;" 2>/dev/null) || count=0
+	if [[ "$count" -eq 0 ]]; then
+		echo "No models registered yet."
+		echo ""
+		return 0
+	fi
+
+	echo "| Model | Provider | Tier | Context | Input/1M | Output/1M |"
+	echo "|-------|----------|------|---------|----------|-----------|"
+
+	sqlite3 -separator '|' "$REGISTRY_DB" "
+        SELECT
+            model_id,
+            provider,
+            CASE tier
+                WHEN 'high' THEN 'opus'
+                WHEN 'medium' THEN 'sonnet'
+                WHEN 'low' THEN 'haiku'
+                ELSE tier
+            END,
+            CASE
+                WHEN context_window >= 1000000 THEN (context_window / 1000000) || 'M'
+                ELSE (context_window / 1000) || 'K'
+            END,
+            printf('\$%.2f', input_price),
+            printf('\$%.2f', output_price)
+        FROM models
+        ORDER BY
+            CASE tier WHEN 'high' THEN 1 WHEN 'medium' THEN 2 WHEN 'low' THEN 3 ELSE 4 END,
+            provider,
+            model_id;
+    " 2>/dev/null | while IFS='|' read -r model provider tier ctx input output; do
+		echo "| $model | $provider | $tier | $ctx | $input | $output |"
+	done
+
+	echo ""
+	return 0
+}
+
+#######################################
+# Generate the routing tiers section from subagent_models
+# Outputs: markdown table to stdout
+#######################################
+generate_routing_tiers() {
+	if ! [[ -f "$REGISTRY_DB" ]]; then
+		return 0
+	fi
+
+	local count
+	count=$(sqlite3 "$REGISTRY_DB" "SELECT COUNT(*) FROM subagent_models;" 2>/dev/null) || count=0
+	if [[ "$count" -eq 0 ]]; then
+		return 0
+	fi
+
+	echo "## Routing Tiers"
+	echo ""
+	echo "Active model assignments for each dispatch tier:"
+	echo ""
+	echo "| Tier | Primary Model | Relative Cost |"
+	echo "|------|---------------|---------------|"
+
+	sqlite3 -separator '|' "$REGISTRY_DB" "
+        SELECT
+            sm.tier,
+            sm.model_id,
+            CASE sm.tier
+                WHEN 'haiku' THEN '~0.25x'
+                WHEN 'flash' THEN '~0.20x'
+                WHEN 'sonnet' THEN '1x (baseline)'
+                WHEN 'pro' THEN '~1.5x'
+                WHEN 'opus' THEN '~3x'
+                ELSE '?'
+            END
+        FROM subagent_models sm
+        ORDER BY
+            CASE sm.tier
+                WHEN 'haiku' THEN 1
+                WHEN 'flash' THEN 2
+                WHEN 'sonnet' THEN 3
+                WHEN 'pro' THEN 4
+                WHEN 'opus' THEN 5
+                ELSE 6
+            END;
+    " 2>/dev/null | while IFS='|' read -r tier model cost; do
+		echo "| $tier | $model | $cost |"
+	done
+
+	echo ""
+	return 0
+}
+
+#######################################
+# Generate the performance leaderboard from pattern-tracker data
+# Outputs: markdown table to stdout
+#######################################
+generate_leaderboard() {
+	if ! [[ -f "$MEMORY_DB" ]]; then
+		echo "No pattern data available yet. Run tasks to build the leaderboard."
+		echo ""
+		return 0
+	fi
+
+	local total
+	total=$(sqlite3 "$MEMORY_DB" "
+        SELECT COUNT(*) FROM learnings
+        WHERE type IN ($PATTERN_TYPES);
+    " 2>/dev/null) || total=0
+
+	if [[ "$total" -eq 0 ]]; then
+		echo "No pattern data available yet. Run tasks to build the leaderboard."
+		echo ""
+		return 0
+	fi
+
+	echo "| Model | Tasks | Successes | Failures | Success Rate | Last Used |"
+	echo "|-------|-------|-----------|----------|--------------|-----------|"
+
+	# Query each known model tier
+	local tiers="opus sonnet pro flash haiku"
+	for tier in $tiers; do
+		local successes failures last_used
+		successes=$(sqlite3 "$MEMORY_DB" "
+            SELECT COUNT(*) FROM learnings
+            WHERE type IN ($SUCCESS_TYPES)
+            AND (tags LIKE '%model:${tier}%' OR content LIKE '%[model:${tier}]%');
+        " 2>/dev/null) || successes=0
+
+		failures=$(sqlite3 "$MEMORY_DB" "
+            SELECT COUNT(*) FROM learnings
+            WHERE type IN ($FAILURE_TYPES)
+            AND (tags LIKE '%model:${tier}%' OR content LIKE '%[model:${tier}]%');
+        " 2>/dev/null) || failures=0
+
+		local tasks_total=$((successes + failures))
+		[[ "$tasks_total" -eq 0 ]] && continue
+
+		local rate
+		if [[ "$tasks_total" -gt 0 ]]; then
+			rate=$(((successes * 100) / tasks_total))
+		else
+			rate=0
+		fi
+
+		last_used=$(sqlite3 "$MEMORY_DB" "
+            SELECT SUBSTR(MAX(created_at), 1, 10) FROM learnings
+            WHERE type IN ($PATTERN_TYPES)
+            AND (tags LIKE '%model:${tier}%' OR content LIKE '%[model:${tier}]%');
+        " 2>/dev/null) || last_used="—"
+		[[ -z "$last_used" ]] && last_used="—"
+
+		echo "| $tier | $tasks_total | $successes | $failures | ${rate}% | $last_used |"
+	done
+
+	echo ""
+	return 0
+}
+
+#######################################
+# Generate performance breakdown by task type
+# Outputs: markdown table to stdout
+#######################################
+generate_task_type_breakdown() {
+	if ! [[ -f "$MEMORY_DB" ]]; then
+		return 0
+	fi
+
+	local total
+	total=$(sqlite3 "$MEMORY_DB" "
+        SELECT COUNT(*) FROM learnings
+        WHERE type IN ($PATTERN_TYPES);
+    " 2>/dev/null) || total=0
+	[[ "$total" -eq 0 ]] && return 0
+
+	local has_data=0
+	local task_types="feature bugfix refactor code-review docs testing deployment security architecture planning research content seo"
+	local rows=""
+
+	for task_type in $task_types; do
+		local successes failures
+		successes=$(sqlite3 "$MEMORY_DB" "
+            SELECT COUNT(*) FROM learnings
+            WHERE type IN ($SUCCESS_TYPES)
+            AND (tags LIKE '%${task_type}%' OR content LIKE '%[task:${task_type}]%');
+        " 2>/dev/null) || successes=0
+
+		failures=$(sqlite3 "$MEMORY_DB" "
+            SELECT COUNT(*) FROM learnings
+            WHERE type IN ($FAILURE_TYPES)
+            AND (tags LIKE '%${task_type}%' OR content LIKE '%[task:${task_type}]%');
+        " 2>/dev/null) || failures=0
+
+		local task_total=$((successes + failures))
+		[[ "$task_total" -eq 0 ]] && continue
+
+		has_data=1
+		local rate=$(((successes * 100) / task_total))
+		rows+="| $task_type | $task_total | $successes | $failures | ${rate}% |"$'\n'
+	done
+
+	if [[ "$has_data" -eq 1 ]]; then
+		echo "### By Task Type"
+		echo ""
+		echo "| Task Type | Tasks | Successes | Failures | Success Rate |"
+		echo "|-----------|-------|-----------|----------|--------------|"
+		printf '%s' "$rows"
+		echo ""
+	fi
+
+	return 0
+}
+
+#######################################
+# Generate contest results from response-scoring DB
+# Outputs: markdown section to stdout
+#######################################
+generate_contest_results() {
+	if ! [[ -f "$SCORING_DB" ]]; then
+		echo "No contest data available yet. Run \`/compare-models\` or enable contest mode (t1011) to generate data."
+		echo ""
+		return 0
+	fi
+
+	local response_count
+	response_count=$(sqlite3 "$SCORING_DB" "SELECT COUNT(*) FROM responses;" 2>/dev/null) || response_count=0
+	if [[ "$response_count" -eq 0 ]]; then
+		echo "No contest data available yet."
+		echo ""
+		return 0
+	fi
+
+	# Model quality scores (from scored responses)
+	local score_count
+	score_count=$(sqlite3 "$SCORING_DB" "SELECT COUNT(*) FROM scores;" 2>/dev/null) || score_count=0
+
+	if [[ "$score_count" -gt 0 ]]; then
+		echo "### Quality Scores"
+		echo ""
+		echo "Weighted average across all evaluated responses (correctness 30%, completeness 25%, code quality 25%, clarity 20%):"
+		echo ""
+		echo "| Model | Responses | Avg Score | Avg Time (s) |"
+		echo "|-------|-----------|-----------|--------------|"
+
+		sqlite3 -separator '|' "$SCORING_DB" "
+            SELECT
+                r.model_id,
+                COUNT(DISTINCT r.response_id),
+                printf('%.2f',
+                    AVG(CASE WHEN s.criterion='correctness' THEN s.score * 0.30
+                             WHEN s.criterion='completeness' THEN s.score * 0.25
+                             WHEN s.criterion='code_quality' THEN s.score * 0.25
+                             WHEN s.criterion='clarity' THEN s.score * 0.20
+                             ELSE 0 END) * (1.0 / 0.25)
+                ),
+                printf('%.1f', AVG(r.response_time))
+            FROM responses r
+            JOIN scores s ON r.response_id = s.response_id
+            GROUP BY r.model_id
+            ORDER BY AVG(CASE WHEN s.criterion='correctness' THEN s.score * 0.30
+                              WHEN s.criterion='completeness' THEN s.score * 0.25
+                              WHEN s.criterion='code_quality' THEN s.score * 0.25
+                              WHEN s.criterion='clarity' THEN s.score * 0.20
+                              ELSE 0 END) DESC;
+        " 2>/dev/null | while IFS='|' read -r model responses avg_score avg_time; do
+			echo "| $model | $responses | $avg_score/5.0 | $avg_time |"
+		done
+
+		echo ""
+	fi
+
+	# Head-to-head comparison wins
+	local comparison_count
+	comparison_count=$(sqlite3 "$SCORING_DB" "SELECT COUNT(*) FROM comparisons;" 2>/dev/null) || comparison_count=0
+
+	if [[ "$comparison_count" -gt 0 ]]; then
+		echo "### Head-to-Head Results"
+		echo ""
+		echo "| Model | Wins | Contests |"
+		echo "|-------|------|----------|"
+
+		sqlite3 -separator '|' "$SCORING_DB" "
+            SELECT
+                r.model_id,
+                COUNT(*),
+                (SELECT COUNT(*) FROM comparisons c2
+                 JOIN responses r2 ON c2.prompt_id = r2.prompt_id
+                 WHERE r2.model_id = r.model_id) as total_contests
+            FROM comparisons c
+            JOIN responses r ON c.winner_id = r.response_id
+            GROUP BY r.model_id
+            ORDER BY COUNT(*) DESC;
+        " 2>/dev/null | while IFS='|' read -r model wins contests; do
+			echo "| $model | $wins | $contests |"
+		done
+
+		echo ""
+	fi
+
+	return 0
+}
+
+#######################################
+# Generate the overall stats summary
+# Outputs: markdown to stdout
+#######################################
+generate_stats_summary() {
+	local pattern_total=0
+	local scoring_total=0
+
+	if [[ -f "$MEMORY_DB" ]]; then
+		pattern_total=$(sqlite3 "$MEMORY_DB" "
+            SELECT COUNT(*) FROM learnings WHERE type IN ($PATTERN_TYPES);
+        " 2>/dev/null) || pattern_total=0
+	fi
+
+	if [[ -f "$SCORING_DB" ]]; then
+		scoring_total=$(sqlite3 "$SCORING_DB" "SELECT COUNT(*) FROM responses;" 2>/dev/null) || scoring_total=0
+	fi
+
+	echo "- **Pattern data points**: $pattern_total"
+	echo "- **Scored responses**: $scoring_total"
+
+	if [[ -f "$MEMORY_DB" ]] && [[ "$pattern_total" -gt 0 ]]; then
+		local oldest newest
+		oldest=$(sqlite3 "$MEMORY_DB" "
+            SELECT SUBSTR(MIN(created_at), 1, 10) FROM learnings WHERE type IN ($PATTERN_TYPES);
+        " 2>/dev/null) || oldest="—"
+		newest=$(sqlite3 "$MEMORY_DB" "
+            SELECT SUBSTR(MAX(created_at), 1, 10) FROM learnings WHERE type IN ($PATTERN_TYPES);
+        " 2>/dev/null) || newest="—"
+		echo "- **Date range**: $oldest to $newest"
+	fi
+
+	echo ""
+	return 0
+}
+
+#######################################
+# Main: assemble the full MODELS.md
+#######################################
+generate_models_md() {
+	local output="$1"
+	local timestamp
+	timestamp=$(date -u '+%Y-%m-%dT%H:%M:%SZ')
+
+	{
+		echo "# Model Leaderboard"
+		echo ""
+		echo "Live performance data from pattern-tracker and response-scoring databases."
+		echo "Auto-generated by \`generate-models-md.sh\` — do not edit manually."
+		echo ""
+		echo "**Last updated**: $timestamp"
+		echo ""
+		generate_stats_summary
+		echo "## Available Models"
+		echo ""
+		generate_catalog
+		generate_routing_tiers
+		echo "## Performance Leaderboard"
+		echo ""
+		echo "Success rates from autonomous task execution (pattern-tracker data):"
+		echo ""
+		generate_leaderboard
+		generate_task_type_breakdown
+		echo "## Contest Results"
+		echo ""
+		echo "Quality evaluations from model comparison sessions (response-scoring data):"
+		echo ""
+		generate_contest_results
+		echo "---"
+		echo ""
+		echo "*Generated by [aidevops](https://github.com/anomalyco/aidevops) t1012*"
+	} >"$output"
+
+	return 0
+}
+
+#######################################
+# Show help
+#######################################
+cmd_help() {
+	echo "generate-models-md.sh - Generate MODELS.md leaderboard"
+	echo ""
+	echo "Usage:"
+	echo "  generate-models-md.sh [--output PATH] [--quiet]"
+	echo "  generate-models-md.sh help"
+	echo ""
+	echo "Options:"
+	echo "  --output PATH   Output file path (default: MODELS.md in repo root)"
+	echo "  --quiet         Suppress info messages"
+	echo ""
+	echo "Data sources:"
+	echo "  Model registry:    $REGISTRY_DB"
+	echo "  Pattern tracker:   $MEMORY_DB"
+	echo "  Response scoring:  $SCORING_DB"
+	return 0
+}
+
+# Parse arguments
+while [[ $# -gt 0 ]]; do
+	case "$1" in
+	--output)
+		OUTPUT_PATH="$2"
+		shift 2
+		;;
+	--quiet)
+		QUIET=1
+		shift
+		;;
+	help | --help | -h)
+		cmd_help
+		exit 0
+		;;
+	*)
+		log_error "Unknown argument: $1"
+		cmd_help
+		exit 1
+		;;
+	esac
+done
+
+# Determine output path
+if [[ -z "$OUTPUT_PATH" ]]; then
+	local_repo_root="$(find_repo_root)"
+	if [[ -n "$local_repo_root" ]]; then
+		OUTPUT_PATH="${local_repo_root}/MODELS.md"
+	else
+		OUTPUT_PATH="./MODELS.md"
+	fi
+fi
+
+# Verify sqlite3 is available
+if ! command -v sqlite3 &>/dev/null; then
+	log_error "sqlite3 is required but not found"
+	exit 1
+fi
+
+log_info "Generating MODELS.md from live data..."
+log_info "  Registry: $REGISTRY_DB"
+log_info "  Patterns: $MEMORY_DB"
+log_info "  Scoring:  $SCORING_DB"
+
+generate_models_md "$OUTPUT_PATH"
+
+log_success "Generated $OUTPUT_PATH"
diff --git a/.agents/scripts/supervisor-helper.sh b/.agents/scripts/supervisor-helper.sh
index e666d7acf..fc53601f5 100755
--- a/.agents/scripts/supervisor-helper.sh
+++ b/.agents/scripts/supervisor-helper.sh
@@ -11002,6 +11002,60 @@ cmd_pulse() {
 		log_warn "  Phase 11: Memory exceeds threshold but tasks still active — monitoring"
 	fi
 
+	# Phase 12: Regenerate MODELS.md leaderboard (t1012)
+	# Throttled to once per hour — only regenerates when pattern data may have changed.
+	# Iterates over known repos and updates MODELS.md in each repo root.
+	local models_md_interval=3600 # seconds (1 hour)
+	local models_md_stamp="$SUPERVISOR_DIR/models-md-last-regen"
+	local models_md_now
+	models_md_now=$(date +%s)
+	local models_md_last=0
+	if [[ -f "$models_md_stamp" ]]; then
+		models_md_last=$(cat "$models_md_stamp" 2>/dev/null || echo 0)
+	fi
+	local models_md_elapsed=$((models_md_now - models_md_last))
+	if [[ "$models_md_elapsed" -ge "$models_md_interval" ]]; then
+		local generate_script="${SCRIPT_DIR}/generate-models-md.sh"
+		if [[ -x "$generate_script" ]]; then
+			local models_repos
+			models_repos=$(db "$SUPERVISOR_DB" "SELECT DISTINCT repo FROM tasks;" 2>/dev/null || true)
+			if [[ -n "$models_repos" ]]; then
+				while IFS= read -r models_repo_path; do
+					[[ -n "$models_repo_path" && -d "$models_repo_path" ]] || continue
+					local models_repo_root
+					models_repo_root=$(git -C "$models_repo_path" rev-parse --show-toplevel 2>/dev/null) || continue
+					log_verbose "  Phase 12: Regenerating MODELS.md in $models_repo_root"
+					if "$generate_script" --output "${models_repo_root}/MODELS.md" --quiet 2>/dev/null; then
+						if git -C "$models_repo_root" diff --quiet -- MODELS.md 2>/dev/null; then
+							log_verbose "  Phase 12: MODELS.md unchanged in $models_repo_root"
+						else
+							git -C "$models_repo_root" add MODELS.md 2>/dev/null \
+								&& git -C "$models_repo_root" commit -m "chore: regenerate MODELS.md leaderboard (t1012)" --no-verify 2>/dev/null \
+								&& git -C "$models_repo_root" push 2>/dev/null \
+								&& log_info "  Phase 12: MODELS.md updated and pushed ($models_repo_root)" \
+								|| log_warn "  Phase 12: MODELS.md regenerated but commit/push failed ($models_repo_root)"
+						fi
+					else
+						log_warn "  Phase 12: MODELS.md generation failed for $models_repo_root"
+					fi
+				done <<<"$models_repos"
+			fi
+		fi
+		echo "$models_md_now" > "$models_md_stamp" 2>/dev/null || true
+	else
+		local models_md_remaining=$((models_md_interval - models_md_elapsed))
+		log_verbose "  Phase 12: MODELS.md regen skipped (${models_md_remaining}s until next run)"
+	fi
+				else
+					log_warn "  Phase 12: MODELS.md generation failed"
+				fi
+			fi
+		fi
+		record_throttle "$models_md_throttle_key" 2>/dev/null || true
+	else
+		log_verbose "  Phase 12: MODELS.md regen skipped (throttled)"
+	fi
+
 	# Release pulse dispatch lock (t159)
 	release_pulse_lock
 	# Reset trap to avoid interfering with other commands in the same process
@@ -13190,16 +13244,16 @@ cmd_cron() {
 	local script_path
 	script_path="$(cd "$(dirname "${BASH_SOURCE[0]}")" && pwd)/supervisor-helper.sh"
 	local cron_marker="# aidevops-supervisor-pulse"
-	
+
 	# Detect current PATH for cron environment (t1006)
 	local user_path="${PATH}"
-	
+
 	# Detect GH_TOKEN from gh CLI if available (t1006)
 	local gh_token=""
 	if command -v gh &>/dev/null; then
 		gh_token=$(gh auth token 2>/dev/null || true)
 	fi
-	
+
 	# Build cron command with environment variables
 	local env_vars=""
 	if [[ -n "$user_path" ]]; then
@@ -13208,7 +13262,7 @@ cmd_cron() {
 	if [[ -n "$gh_token" ]]; then
 		env_vars="${env_vars:+${env_vars} }GH_TOKEN=${gh_token}"
 	fi
-	
+
 	local cron_cmd="*/${interval} * * * * ${env_vars:+${env_vars} }${script_path} pulse ${batch_arg} >> ${SUPERVISOR_DIR}/cron.log 2>&1 ${cron_marker}"
 
 	case "$action" in
diff --git a/.agents/subagent-index.toon b/.agents/subagent-index.toon
index 18864319a..cd5750462 100644
--- a/.agents/subagent-index.toon
+++ b/.agents/subagent-index.toon
@@ -87,7 +87,7 @@ feature-development,workflows/feature-development.md,Feature development workflo
 conversation-starter,workflows/conversation-starter.md,Session greeting and auto-recall
 -->
 
-<!--TOON:scripts[77]{name,purpose}:
+<!--TOON:scripts[78]{name,purpose}:
 accessibility-helper.sh,Accessibility and contrast testing (WCAG compliance WAVE API for websites and emails)
 accessibility-audit-helper.sh,Accessibility audit CLI wrapping axe-core WAVE API WebAIM contrast and Lighthouse a11y
 auto-update-helper.sh,Automatic update polling daemon (enable disable status check logs)
@@ -155,6 +155,7 @@ model-registry-helper.sh,Provider/model registry with periodic sync (sync list s
 model-availability-helper.sh,Model availability checker - probe before dispatch (check probe status cache clear)
 fallback-chain-helper.sh,Fallback chain configuration - per-agent and global model fallbacks (list get set test status validate)
 response-scoring-helper.sh,Response scoring - evaluate AI model responses side-by-side (prompt record score compare leaderboard export)
+generate-models-md.sh,Generate MODELS.md leaderboard from pattern-tracker and response-scoring data (--output --quiet help)
 coderabbit-task-creator-helper.sh,Auto-create tasks from CodeRabbit findings with false positive filtering (scan create filter status)
 sops-helper.sh,SOPS encrypted config file management (init encrypt decrypt edit rotate status install)
 gocryptfs-helper.sh,gocryptfs encrypted filesystem overlay (init mount unmount create open close list status install)
diff --git a/MODELS.md b/MODELS.md
new file mode 100644
index 000000000..b283d9170
--- /dev/null
+++ b/MODELS.md
@@ -0,0 +1,85 @@
+# Model Leaderboard
+
+Live performance data from pattern-tracker and response-scoring databases.
+Auto-generated by `generate-models-md.sh` — do not edit manually.
+
+**Last updated**: 2026-02-12T21:53:34Z
+
+- **Pattern data points**: 487
+- **Scored responses**: 18
+- **Date range**: 2026-02-05 to 2026-02-12
+
+## Available Models
+
+| Model | Provider | Tier | Context | Input/1M | Output/1M |
+|-------|----------|------|---------|----------|-----------|
+| claude-opus-4 | Anthropic | opus | 200K | $15.00 | $75.00 |
+| o3 | OpenAI | opus | 200K | $10.00 | $40.00 |
+| claude-sonnet-4 | Anthropic | sonnet | 200K | $3.00 | $15.00 |
+| gemini-2.5-pro | Google | sonnet | 1M | $1.25 | $10.00 |
+| gpt-4.1 | OpenAI | sonnet | 1M | $2.00 | $8.00 |
+| gpt-4o | OpenAI | sonnet | 128K | $2.50 | $10.00 |
+| o4-mini | OpenAI | sonnet | 200K | $1.10 | $4.40 |
+| claude-haiku-3.5 | Anthropic | haiku | 200K | $0.80 | $4.00 |
+| deepseek-r1 | DeepSeek | haiku | 131K | $0.55 | $2.19 |
+| deepseek-v3 | DeepSeek | haiku | 131K | $0.27 | $1.10 |
+| gemini-2.0-flash | Google | haiku | 1M | $0.10 | $0.40 |
+| gemini-2.5-flash | Google | haiku | 1M | $0.15 | $0.60 |
+| llama-4-maverick | Meta | haiku | 1M | $0.20 | $0.60 |
+| llama-4-scout | Meta | haiku | 512K | $0.15 | $0.40 |
+| gpt-4.1-mini | OpenAI | haiku | 1M | $0.40 | $1.60 |
+| gpt-4.1-nano | OpenAI | haiku | 1M | $0.10 | $0.40 |
+| gpt-4o-mini | OpenAI | haiku | 128K | $0.15 | $0.60 |
+
+## Routing Tiers
+
+Active model assignments for each dispatch tier:
+
+| Tier | Primary Model | Relative Cost |
+|------|---------------|---------------|
+| haiku | claude-3-5-haiku | ~0.25x |
+| flash | gemini-2.5-flash-preview-05-20 | ~0.20x |
+| sonnet | claude-sonnet-4 | 1x (baseline) |
+| pro | gemini-2.5-pro-preview-06-05 | ~1.5x |
+| opus | claude-opus-4 | ~3x |
+
+## Performance Leaderboard
+
+Success rates from autonomous task execution (pattern-tracker data):
+
+| Model | Tasks | Successes | Failures | Success Rate | Last Used |
+|-------|-------|-----------|----------|--------------|-----------|
+| opus | 292 | 287 | 5 | 98% | 2026-02-12 |
+| sonnet | 64 | 64 | 0 | 100% | 2026-02-12 |
+| haiku | 1 | 0 | 1 | 0% | 2026-02-05 |
+
+### By Task Type
+
+| Task Type | Tasks | Successes | Failures | Success Rate |
+|-----------|-------|-----------|----------|--------------|
+| feature | 311 | 297 | 14 | 95% |
+| bugfix | 8 | 5 | 3 | 62% |
+| refactor | 1 | 0 | 1 | 0% |
+| testing | 1 | 1 | 0 | 100% |
+| security | 1 | 1 | 0 | 100% |
+| architecture | 2 | 2 | 0 | 100% |
+| research | 1 | 1 | 0 | 100% |
+| content | 6 | 6 | 0 | 100% |
+
+## Contest Results
+
+Quality evaluations from model comparison sessions (response-scoring data):
+
+### Quality Scores
+
+Weighted average across all evaluated responses (correctness 30%, completeness 25%, code quality 25%, clarity 20%):
+
+| Model | Responses | Avg Score | Avg Time (s) |
+|-------|-----------|-----------|--------------|
+| claude-opus-4 | 6 | 4.56/5.0 | 0.0 |
+| claude-sonnet-4 | 6 | 4.28/5.0 | 0.0 |
+| gemini-2.5-pro | 6 | 4.11/5.0 | 0.0 |
+
+---
+
+*Generated by [aidevops](https://github.com/anomalyco/aidevops) t1012*