Automatizei Minha Curadoria de Notícias com IA
CEO da LeadMark · Especialista em SEO e Tráfego Pago
Curadoria de notícias com IA é o processo de coletar, filtrar e resumir notícias de várias fontes usando um modelo de linguagem para julgar o que importa e descartar o resto. Eu fazia isso na mão, abrindo 12 sites toda manhã, lendo umas 200 manchetes e separando 5 que valiam a pena. Levava 40 minutos por dia.
Há quatro meses, troquei essa rotina por um pipeline que lê RSS, filtra, resume com a Claude API e publica sozinho. Hoje ele me entrega 5 itens curados por dia em menos de 2 minutos de máquina. Vou mostrar a arquitetura exata, da leitura dos feeds até o post publicado, com custos e erros reais.
Como funciona uma curadoria de notícias com IA?
Uma curadoria de notícias com IA funciona em quatro etapas encadeadas, da ingestão à publicação. Primeiro a ingestão lê os feeds, depois a filtragem remove duplicatas e ruído, então a IA pontua relevância e por fim gera o resumo com link para a fonte. No meu caso, são quatro scripts independentes em TypeScript que rodam por cron, cada um lendo o resultado do anterior sem um monólito central.
A comunicação entre eles passa por um único arquivo de estado em JSON. Se um script quebra, os outros não caem junto. Eu sei exatamente em qual etapa um item travou — e isso facilita demais o conserto.
O coração de tudo é o RSS. RSS (Really Simple Syndication — um formato padrão em XML que sites publicam para distribuir suas atualizações) é um protocolo aberto e gratuito, e quase todo portal sério ainda mantém um feed. Eu cadastro a URL, o script lê o XML e extrai título, link, data e resumo de cada item.
Sem scraping, sem quebrar termo de uso de ninguém. A especificação completa está documentada pelo RSS Advisory Board e mudou pouco em 20 anos. Essa estabilidade é uma vantagem rara em tecnologia, e significa que a base do meu sistema dificilmente vai quebrar por atualização.
Por que automatizar a curadoria de notícias?
Automatizar a curadoria devolve tempo e reduz o viés de “li o que apareceu primeiro”. O ganho concreto, no meu caso, foi recuperar aquelas 40 minutos por dia — cerca de 14 horas por mês triando manchete. O ganho silencioso foi maior ainda.
A IA lê os 12 feeds inteiros toda vez. Eu, cansado às 7h da manhã, parava no terceiro site e perdia notícia boa que estava no nono. A máquina não tem manhã ruim.
O contexto de mercado explica por que isso importa cada vez mais. O Reuters Institute, no Digital News Report 2025, mostra que o consumo de notícias está cada vez mais fragmentado entre dezenas de fontes. Ninguém consegue acompanhar tudo na mão.
Para quem trabalha com conteúdo, há um efeito colateral valioso. Em 200+ contas e projetos que acompanho, o erro mais comum é escrever sobre o que o dono acha relevante, não sobre o que o mercado discute agora. A curadoria automatizada vira radar de pauta.
Quais ferramentas usar para montar o pipeline?
As ferramentas dependem de você querer escrever código ou não. Para a versão com código, eu uso TypeScript com a biblioteca rss-parser para ler os feeds e a Claude API para pontuar e resumir. Para a versão sem código, n8n ou Make conectam um feed RSS a um modelo de IA com blocos visuais de arrastar e soltar.
As duas resolvem — a diferença é controle versus velocidade de montagem. Aqui está o que cada caminho entrega:
| Caminho | Nível técnico | Custo mensal | Controle | Melhor para |
|---|---|---|---|---|
| TypeScript + Claude API | Avançado | R$30 a R$80 | Total | Regras de filtro complexas |
| n8n self-hosted | Intermediário | R$30 a R$50 (VPS) | Alto | Visual com flexibilidade |
| Make (nuvem) | Iniciante | US$9 a US$29 | Médio | Primeiro teste sem servidor |
Se você nunca montou um fluxo de automação, comece pelo n8n. O nó nativo de leitura de RSS está pronto e documentado, conforme a documentação oficial do n8n. Eu montei meu primeiro protótipo nele em uma tarde antes de migrar para código próprio.
Quer entender o n8n a fundo antes de começar? Escrevi um passo a passo em automação no n8n conectando WhatsApp e CRM em 30 minutos. Ele serve de base para qualquer fluxo, inclusive este de notícias.
Como filtrar o que importa e descartar o ruído?
A filtragem acontece em duas camadas, uma mecânica e barata, outra inteligente e cara. Errar a ordem é o que estoura o custo de IA. A camada mecânica roda primeiro, sem gastar um token.
Ela remove duplicatas — a mesma notícia que aparece em três feeds. Descarta itens com mais de 48 horas. E elimina manchetes que batem com uma lista de palavras-proibidas que eu mantenho, de assuntos que não me interessam.
Só o que sobra dessa peneira vai para a IA. A camada inteligente é a IA pontuando cada item de 0 a 10 por relevância, contra critérios que defini num prompt fixo. Itens com nota abaixo de 6 são descartados sem dó.
A ordem importa por dinheiro. Quando montei a primeira versão, eu mandava todos os 200 itens direto para a IA pontuar — gastava uns R$18 por dia. Ao colocar a deduplicação e o filtro de data antes, sobravam uns 40 itens, e o custo caiu para menos de R$5 por dia.
A regra que carrego para qualquer projeto é simples: nunca gaste IA no que um if resolve. Vale separar os tipos de filtro para deixar claro o que cada um faz:
- Deduplicação por URL e por similaridade de título: a mesma matéria republicada em vários portais vira um item só.
- Janela temporal: nada com mais de 48 horas entra — notícia velha não é curadoria, é arquivo.
- Lista de exclusão: palavras-chave de assuntos que não interessam barram o item antes da IA.
- Pontuação por IA: o julgamento final de relevância, feito só no que sobrou das peneiras acima.
Como a IA gera o resumo sem inventar fato?
A IA gera o resumo trabalhando apenas com o texto que já veio no feed — ela reescreve e condensa, nunca cria informação nova. Essa é a regra inegociável de todo o sistema. É o que separa curadoria responsável de máquina de desinformação.
O prompt recebe o título e o resumo originais do RSS com uma instrução literal de resumir em 3 frases, sem adicionar números, datas ou nomes que não estejam no texto fornecido. Sem acesso à web durante a geração, a IA não tem de onde inventar. A fonte é a única verdade que ela conhece.
Cada item publicado carrega o link para a matéria original, em destaque. Isso não é só ética, é estratégia — o leitor que quer o detalhe vai à fonte, e eu não corro o risco de parafrasear errado uma informação sensível. A lógica de geração com a Claude API é a mesma que detalho no meu pipeline de conteúdo que publica 6 posts por dia.
Notícia não é tema neutro. Conteúdo sobre saúde, finanças ou direito é o que o Google chama de YMYL (Your Money Your Life — assuntos que afetam diretamente a vida e o bolso das pessoas). No meu pipeline, qualquer item dessas categorias é marcado e não publica sozinho, ficando numa fila de revisão para eu olhar antes.
Quanto custa rodar uma curadoria de notícias com IA?
O custo total fica entre R$120 e R$280 por mês, somando tokens de IA e a infraestrutura dos crons. A leitura dos feeds RSS não custa nada — é a parte mais barata e mais estável. O peso fica na pontuação por IA, e mesmo essa é modesta quando você filtra antes de chamar o modelo.
Abaixo está a quebra real do meu setup, processando cerca de 200 notícias por dia de 12 fontes:
| Componente | Custo mensal | Observação |
|---|---|---|
| Leitura de RSS | R$0 | Protocolo aberto e gratuito |
| Pontuação por IA (Haiku) | R$90 a R$150 | ~40 itens/dia após filtro mecânico |
| Geração de resumos | R$30 a R$80 | Só os itens com nota 6 ou mais |
| VPS (crons) | R$30 a R$50 | Servidor básico roda tudo de sobra |
A escolha do modelo muda o jogo. Para pontuar e resumir notícia, um modelo barato e rápido como Claude Haiku ou Gemini Flash é mais que suficiente. Não preciso do modelo mais caro para julgar se uma manchete é relevante.
Reservo modelos maiores apenas para análise editorial mais profunda, o que ainda não precisei. Trocar o modelo é mudar uma linha de código, sem refazer nada da arquitetura. Essa independência é o que separa um pipeline próprio de uma ferramenta engessada.
Comparado a um SaaS de monitoramento de notícias — que cobra de US$50 a US$300 por mês e ainda te prende às fontes que ele escolheu —, o pipeline próprio sai mais barato e cabe no seu nicho. A desvantagem é o tempo de montar. Gastei cerca de 25 horas entre construir, testar e calibrar os critérios de relevância.
Quais erros quase derrubaram o pipeline?
O erro que mais doeu foi confiar que todo feed RSS é bem-comportado — eles não são. Na segunda semana, um portal mudou a estrutura do XML e meu parser começou a engolir itens sem título. Eles viravam resumos vazios publicados no ar.
Aprendi na marra a validar todo campo antes de usar. Item incompleto é descartado em silêncio, em vez de virar lixo público. Os outros tropeços que todo mundo que monta isso vai repetir estão na lista abaixo:
- Não tratar feed que sai do ar: portais caem e mudam de URL. Sem tratamento de erro por fonte, um feed quebrado trava o lote inteiro. Hoje cada fonte falha isolada e o resto segue.
- Filtro de duplicata fraco: comparar só pela URL não pega a mesma notícia republicada com link diferente. Resolvi adicionando comparação por similaridade de título.
- Prompt de relevância genérico: “selecione notícias importantes” não diz nada à IA. Os critérios precisam ser específicos do seu nicho, ou ela aprova tudo.
- Esquecer o fuso e a data: feed com data em formato estranho fazia notícia velha furar a janela de 48 horas. Normalizar a data na ingestão resolveu.
O que salvou o projeto foi rodar em modo de teste por uma semana antes de publicar de verdade. Ele gerava os resumos, mas só gravava num arquivo de log para eu revisar. Encontrei os quatro erros acima sem que nenhum chegasse ao público.
Se a sua curadoria vai alimentar descoberta por IA, vale entender como esse conteúdo é lido pelos buscadores generativos no guia para aparecer no AI Overview do Google. E se você está começando do zero no desenvolvimento com IA, o guia completo de vibe coding cobre o caminho desde a primeira linha de código.
Vale a pena automatizar para o seu caso?
Vale quando você consome notícia de muitas fontes e o tempo de triagem virou gargalo. Abaixo de 3 ou 4 feeds, fazer na mão ainda é mais rápido do que manter um sistema. A conta é direta — se você gasta mais de 30 minutos por dia separando o que ler, o pipeline se paga em tempo recuperado já no primeiro mês.
Se você lê dois sites de vez em quando, não monte nada. Você só vai ter código para manter sem ganho real. Automação que não resolve um gargalo concreto é hobby, não produtividade.
O outro fator é o que você faz com a curadoria. Se ela só alimenta seu consumo pessoal, uma ferramenta simples basta. Se vira insumo de pauta, base de uma newsletter ou radar competitivo do seu setor, o controle de um pipeline próprio compensa o esforço de montar.
Quanto mais específico for o seu critério de relevância, mais difícil é uma ferramenta genérica acertar — e mais sentido faz construir o seu. Esse é o mesmo raciocínio que aplico em qualquer automação. Terceirize o genérico e construa o que é a sua real vantagem.
Quer montar uma automação de conteúdo ou de monitoramento que realmente caiba no seu negócio — especialmente em nichos onde acompanhar o mercado em tempo real faz diferença? Entre em contato. Analiso sua operação e indico a arquitetura certa para o volume e o controle que você precisa.
Perguntas frequentes
O que é curadoria de notícias com IA?
É usar um modelo de linguagem para fazer o trabalho de um editor — ler muitas fontes, julgar o que é relevante e entregar só o que importa, resumido. A diferença para um simples agregador de feeds é o julgamento. O agregador mostra tudo na ordem que chega, enquanto a IA pontua cada item e descarta o ruído antes de você ver.
Quanto custa montar uma curadoria de notícias automatizada?
No meu setup, entre R$120 e R$280 por mês processando 200 notícias diárias de 12 fontes. A maior parte é token de IA, e ainda assim é modesta porque o filtro mecânico remove a maioria dos itens antes de qualquer chamada paga. Se você usar uma ferramenta sem código como Make na nuvem, o custo de servidor some, mas você troca controle por conveniência.
Preciso saber programar para automatizar curadoria de notícias?
Para a versão com código, é preciso conforto básico com TypeScript ou Python para ler RSS e chamar a API de IA. Para a versão visual, ferramentas como n8n e Make eliminam quase todo o código com blocos de arrastar e soltar. O gargalo nunca é a sintaxe — é definir os critérios de relevância, e essa parte é decisão editorial sua, não problema técnico.
A IA pode publicar notícia errada ou inventada?
Pode, se você deixar. A trava que uso é nunca permitir que a IA gere fato novo — ela só resume o texto que já veio na fonte, sem acesso à web durante a geração. Para assuntos sensíveis como saúde, finanças e jurídico, o item nunca publica sozinho e vai para uma fila de revisão humana, porque automação responsável é saber o que não deixar a máquina decidir.
Este artigo foi útil?
Fale com o especialista
Precisa escalar seus leads?
15 anos gerando +60 mil leads/mês para planos de saúde. Vamos conversar sobre a sua operação.
Falar no WhatsApp
CEO @leadmarkbr · Especialista em SEO e Tráfego Pago
CEO da LeadMark desde 2012. Mais de 15 anos em Google Ads, SEO/GEO e Meta Ads. Gero +60k leads/mês para 30 mil corretores de planos de saúde em todo o Brasil. Certificado Google Ads Search. Palestrante em eventos de marketing digital.
Nenhum comentário ainda
Seja o primeiro a compartilhar sua opinião