гора.
AI / generative media

GoraGen — платформа AI-генерации видео

Self-serve LoRA-тренировка, оркестрация ComfyUI на арендованных GPU, Gemini-оценка качества и сториборды — всё в одной мультитенантной платформе.

Регион
goragen.com (global)
Роль
Tech lead, architect, full-stack
Период
2025–2026
Ниша
AI / generative media

Внутренние метрики выручки и числа пользователей не публикуются. Все детали извлечены из публичного README и кода репозитория.

Это сводка по проекту. Дальше — три параллельных раздела: бизнес-логика и пользовательский опыт, обзор админки и control-plane, технический стек.

Каждый раздел самодостаточен.

Что внутри

  • Четыре приложения за одним Caddy: landing (Astro), dash (React 19), admin (React 19), API (FastAPI) — каждое со своей CSP и WS-таймаутами.
  • Plan-100 Control Plane: координатор + раннер + реконсилер с лидерскими лизами, шесть стадий cutover, naive восстановление после краша.
  • 61 SQL-миграция, Postgres-native; `pg_advisory_lock(42)` для multi-replica startups.
  • Изолированный workers-контейнер (singleton, replicas:1, stop_grace 120s) с восемью loop'ами: координатор, раннер, реконсилер, auto-provisioner, daily cleanup, distribution, voice, lip-sync, heartbeat.
  • Итеративный pipeline качества: RU→EN перевод → Claude выбирает модель → Vast.ai instance (40-80GB VRAM) → ComfyUI → Gemini оценивает по 4 критериям → решение (regenerate / acceptable / good).
  • Self-serve LoRA training: kohya_ss оркестратор + BLIP-2 captioning + validation grid + автоматический persona insert.
  • ChromaDB для семантического поиска рецептов промптов и Civitai-сборок (3.3MB схем ComfyUI nodes).
  • @idempotent middleware на пяти мутирующих эндпоинтах (sha256 от body, 24h TTL, replay на retry).
  • Cookie JWT + Bearer `gk_live_*` Argon2-хэшированные ключи для SDK/CI.
  • Distribution worker — 30s tick, scheduled posts в соцсети с captioning через Claude.

Стек

  • FastAPI (Python)
  • psycopg v3 (Postgres-native)
  • PostgreSQL 16
  • ChromaDB (vectors)
  • Cloudflare R2 (S3-compat)
  • Caddy (TLS + CSP + WS timeouts)
  • Docker compose
  • Vast.ai (GPU rental)
  • Kling Direct API
  • Anthropic Claude (orchestration)
  • Google Gemini 2.5 Pro (evaluation)
  • Sentry (errors)
  • ComfyUI (remote)
  • kohya_ss (LoRA training)
  • BLIP-2 (captioning)
  • React 19 (dash + admin)
  • TanStack Router (dash)
  • Astro (landing)
  • Vite 6
  • TypeScript
  • Argon2 (auth)
  • Idempotency-Key middleware
  • 11—17 мая 2026Migration 055 + shadow tables (instance_requests, provision_attempts, provision_events). Dual-write hooks в 6 entry points. Plan-100 Stage 1.
  • 11—17 мая 2026Coordinator + Runner workers, OCC state machine, lease heartbeat. Stages 2–3 admission control + multi-source cutover. Flag-gated.
  • 11—17 мая 2026Stage 4–6: job_pressure source, provider_api_limiter, control_plane_metrics, emergency pause, alert thresholds. Postgres-only, Plan-100 complete.
  • 4—10 мая 2026Claude Code terminal на Vast инстансах. WebSocket proxy обходит mixed content, auth ack перед bidirectional pipe.
вся хроника по GoraGen
GoraGen — платформа AI-генерации видео · hiregora.com