← всі звіти · replicate.md

type: integration name: Replicate slug: replicate category: llm status: active owner_agent: TODO used_by: [arteggia-bot, med-detective] last_updated: 2026-05-01

Replicate

Why deployed

Hosted inference для LLM/Vision моделей коли власні Gemini ключі недоступні (403/quota) або не підходять (Llama для UA-locale).

Where used

Endpoints / Touchpoints

Credentials

Health & monitoring

Known issues / quirks

Cost

Pay-per-use. Орієнтовно ~$0.001-0.005 per Gemini-2.5-flash call (OCR), ~$0.0002 per Llama-3-8B call.