Open Generative AI: 200+ modelos de imagem e vídeo grátis

Open Generative AI é uma plataforma open-source com 14.096 stars no GitHub que dá acesso a mais de 200 modelos de IA generativa — Flux, Midjourney, Kling, Sora, Veo — sem assinatura, sem filtros de conteúdo e sem ecossistema fechado. Criada pelo desenvolvedor Anil-matcha, a ferramenta se posiciona como alternativa direta às plataformas pagas que dominam o mercado de geração de imagem e vídeo com IA. O projeto é JavaScript, teve último commit há 4 dias e lançou 12 releases — a mais recente em 11 de maio de 2026. Subiu na lista de trending do GitHub no início de maio de 2026, quando o lançamento do Sora 2 e do Veo 3 da Google aumentou a demanda por interfaces unificadas para múltiplos modelos. Roda self-hosted (você instala na sua máquina ou servidor) e permite automação via agentes de código como Claude Code e Codex, conectando-se ao fluxo de quem trabalha com vibe coding.

O que faz

A proposta é simples: uma única interface para rodar dezenas de modelos de geração de mídia que normalmente exigiriam assinaturas separadas. Em vez de pagar Midjourney (a partir de US$ 10/mês), RunwayML (US$ 15/mês), Kling AI (US$ 10/mês) e ChatGPT Plus para usar Sora (US$ 20/mês), o usuário acessa todos os 200+ modelos via uma plataforma que ele mesmo hospeda.

Cobre três fluxos principais: text-to-image (texto vira imagem), text-to-video (texto vira vídeo) e image-to-video (imagem estática vira vídeo animado). Os modelos disponíveis incluem Flux para imagens fotorealistas, alternativas ao Midjourney para estilos artísticos, Kling para vídeo curto e modelos compatíveis com Sora e Veo para vídeo longo.

Resolve dois problemas concretos para quem produz conteúdo em escala. Primeiro, custo: três ferramentas SaaS pagas viram uma stack zero-mensalidade. Segundo, flexibilidade: como não tem filtros de conteúdo (uncensored), permite gerar materiais que ferramentas comerciais bloqueiam por padrão.

Por que está em alta

Saiu de menos de 5.000 stars em fevereiro para 14.096 stars em maio de 2026 — crescimento de quase 3x em três meses. O gatilho foi o lançamento do Sora 2 (OpenAI, abril 2026) e do Veo 3 (Google, abril 2026), que reacenderam o interesse por geração de vídeo via IA.

Plataformas comerciais cobram caro pelo acesso a esses modelos. Sora exige ChatGPT Plus mais cota mensal; Veo está atrás do Gemini Advanced. A demanda por alternativas open-source que rodem os mesmos modelos sem pay-wall explodiu.

O top contributor responde por 90% dos commits, então o projeto ainda é dependente de uma pessoa. Mas o ritmo de releases (12 em poucos meses) e o último commit de 4 dias atrás mostram investimento sério na manutenção.

Métricas do repositório

Métrica	Valor
Stars	14.096
Licença	Não especificada (verificar antes de uso comercial)
Último update	4 dias atrás (maio 2026)
Linguagem	JavaScript
Contributors	5 (top: 90% dos commits)

Para quem serve

Serve para quem produz conteúdo visual em escala e está gastando R$ 200-500/mês em ferramentas como Midjourney, RunwayML, Kling e ChatGPT Plus. Agências de marketing testando criativos para Meta Ads e Google Ads se beneficiam direto — dá para gerar 50 variações de criativo por dia sem estourar cota. Produtores de conteúdo que precisam de imagens e vídeos curtos para redes sociais reduzem o ciclo de produção. Empreendedores construindo MVPs que precisam de assets visuais sem inflar o custo operacional encontram um substituto sólido.

Para quem NÃO serve

NÃO serve para quem não tem familiaridade mínima com terminal e instalação de softwares. Apesar do projeto ter UI, o setup exige Node.js, configuração de API keys (alguns modelos rodam via MUAPI, com cota gratuita mas cobrança em uso intenso) e infraestrutura para rodar modelos pesados.

Empresas reguladas (saúde, finanças) precisam revisar a falta de filtros de conteúdo — pode gerar materiais inadequados se prompts forem mal escritos. Quem precisa de garantia de uptime e SLA também deve ficar nas SaaS pagas. Para campanhas pagas no Instagram com volume crítico, manter uma ferramenta paga como backup é prudente.

Alternativas

Midjourney (midjourney.com): US$ 10-60/mês. Melhor qualidade média em imagens estilizadas, mas só faz imagens (sem vídeo) e exige Discord ou web app oficial.
RunwayML (runwayml.com): US$ 15-95/mês. Líder em vídeo IA com Gen-3, mas cobra por créditos e tem cota baixa nos planos baixos.
ComfyUI (github.com/comfyanonymous/ComfyUI): Open-source. Mais técnico, baseado em workflows visuais. Melhor para quem quer controle granular sobre o pipeline de geração.
Fooocus (github.com/lllyasviel/Fooocus): Open-source com foco só em imagens. Setup mais simples, mas sem vídeo.

Veredicto

Vale o teste para quem produz conteúdo visual para redes sociais ou criativos para Google Ads e quer cortar R$ 300+ de mensalidade. A dependência de um único contributor é o risco principal — não monte um fluxo de produção crítico sem ter um plano B. Para experimentação e produção secundária, é uma das melhores opções open-source de maio de 2026.

Fonte: Anil-matcha/Open-Generative-AI no GitHub