Construcción de un bot automático de noticias de IA con n8n, LLM & Telegram

Introducción

Cada día aparecen cientos de nuevos artículos sobre IA y tecnología. Nadie tiene tiempo de revisarlo todo manualmente. El objetivo de este proyecto fue simple: un canal de Telegram que automáticamente proporcione las noticias más importantes, resumidas y ordenadas.

El resultado de este sistema está al alcance de todos. Se trata de un canal abierto de Telegram (AI & Tech Monitor), que puede visitarse en la siguiente dirección:

t.me/AITechMonitor

El sistema consta de los siguientes componentes principales

n8n (Workflow Automation)
Una plataforma basada en nodos para la automatización de procesos. Funciona como orquestador, conecta las API de los distintos servicios y ejecuta la lógica de recuperación de datos, procesamiento y envío.
Baserow (Datenbank)
Una base de datos relacional de código abierto. Sirve como backend para gestionar las fuentes RSS y almacena los artículos junto con su estado de procesamiento (por ejemplo, “versendet”) para evitar redundancias.
Ollama (AI Inference)
Un entorno de ejecución para correr modelos de lenguaje de forma local. Aquí se utiliza Llama 3.2 para analizar y resumir los textos de los feeds RSS en el servidor, sin recurrir a APIs en la nube externas.
Telegram (Frontend)
El medio de salida para los usuarios finales. A través de la Bot API de Telegram se envían las versiones finales de las resúmenes al canal definido.
Docker (Infrastruktur)
El entorno de ejecución de las aplicaciones. Todos los servicios (n8n, Baserow, Ollama) se ejecutan en contenedores aislados, lo que minimiza las dependencias del sistema operativo anfitrión.

Así funciona el flujo de trabajo de n8n

Este sistema implementa una canalización automatizada para la agregación de contenidos RSS, su resumen con IA y la publicación vía Telegram.

Workflow 01 - Read Feeds: Este flujo de trabajo actúa como desencadenador central y recopilador de datos del sistema. Se inicia automáticamente cada 30 minutos y primero obtiene una lista de feeds RSS a supervisar desde una base de datos Baserow. Tras comprobar que los enlaces de los feeds están marcados como activos, descarga los artículos actuales de esos feeds y limita el número a un máximo de cinco entradas por ejecución. Estos datos brutos de los artículos se estructuran a continuación y se envían individualmente al segundo flujo de trabajo, que se invoca como subflujo para el procesamiento de contenido.

Workflow 02 - Read Feed-Entries: Este flujo de trabajo se encarga del procesamiento inteligente y almacenamiento y se alimenta directamente con los datos de los artículos desde el primer flujo. Primero verifica en la base de datos de Baserow si el enlace ya existe, para excluir duplicados de forma sistemática. Si se trata de un artículo nuevo y desconocido, el flujo envía el contenido a un agente de IA que se ejecuta sobre Ollama (modelo Llama 3) y genera un breve resumen del texto. El resultado, compuesto por título, enlace y resumen generado, se guarda en la base de datos.

Workflow 03 - Telegram Message: El tercer flujo de trabajo se ocupa de publicar los contenidos preparados. Consulta la base de datos de Baserow en busca de entradas que estén procesadas pero aún no marcadas como “versendet”. Para cada uno de esos elementos pendientes, envía un mensaje formateado con el título, el resumen de la IA y el enlace al canal de Telegram definido. Inmediatamente después del envío, actualiza el estado de la entrada en la base de datos a “gesendet” (True), asegurando que ningún mensaje se publique dos veces.

Como aquí me interesaba primordialmente probar la interacción entre las herramientas, el estado actual cubre únicamente ‚casos ideales‘ y requiere aún algo de trabajo en la gestión de errores para un uso permanente.

Introducción#

El sistema consta de los siguientes componentes principales#

Así funciona el flujo de trabajo de n8n#

Introducción

El sistema consta de los siguientes componentes principales

Así funciona el flujo de trabajo de n8n