MindsDB ist eine Open-Source-Plattform, die entwickelt wurde, um maschinelles Lernen, Zeitreihenanalysen und die Integration großer Sprachmodelle direkt in klassische Datenbank-Workflows zu ermöglichen. Die Plattform erlaubt es, KI-Funktionalität über einfache SQL-Abfragen zugänglich zu machen, ohne dass eine separate Machine-Learning-Infrastruktur notwendig ist.
In diesem Beitrag wird eine der zahlreichen Funktionen von MindsDB vorgestellt: der Aufruf eines großen Sprachmodells (GPT-4) über ein vordefiniertes Template, das dynamisch mit Datenbankwerten befüllt wird. Ziel ist es, die emotionale Wirkung von Songs aus einem bestehenden Spotify-Datensatz automatisch bewerten zu lassen. Dabei wird lediglich ein Teil des gesamten Funktionsumfangs von MindsDB genutzt, um die grundlegende Arbeitsweise und das Zusammenspiel von Datenbank und LLM kennenzulernen.
Der Einstieg in MindsDB ist unkompliziert. Über Docker lässt sich die Plattform lokal in wenigen Sekunden starten. Der folgende Befehl startet MindsDB im Hintergrund, öffnet die notwendigen Ports für API und Studio-Oberfläche und legt ein Volume an, um Daten und Konfigurationen dauerhaft zu speichern:
Nach dem Start ist die Weboberfläche über http://localhost:47335 erreichbar. Dort können Dateien hochgeladen, Modelle bzw. Templates definiert und SQL-Abfragen ausgeführt werden. Für den folgenden Anwendungsfall wird der „200k Spotify Songs Light“-Datensatz verwendet, der unter kaggle.com verfügbar ist. Der Datensatz enthält über 200.000 Spotify-Songs mit Merkmalen wie Songtitel, Emotion, Tempo, Variabilität und weiteren Musikparametern.

Ziel ist es, die emotionale Wirkung eines Songs durch ein Large Language Model wie GPT-4 einschätzen zu lassen – basierend auf numerischen Parametern wie Emotion, Tempo und Varianz. Dafür wird in MindsDB ein Modell definiert, das GPT-4 über ein Prompt-Template ansteuert. Die Datenbankwerte werden dabei automatisch in den Prompt eingesetzt:

Diese Anweisung erstellt kein KI-Modell im klassischen Sinne, sondern erstellt (lokal) ein wiederverwendbares Template zur Kommunikation mit GPT-4. Erst wenn eine konkrete SQL-Abfrage ausgeführt wird, bei der reale Werte in den Prompt eingefügt werden, wird die Anfrage an GPT-4 gesendet.
Ein Beispiel für eine solche Anfrage sieht folgendermaßen aus:

Die dabei zurückgelieferte Antwort von GPT-4 lautet:
Dieser Workflow zeigt exemplarisch, wie sich numerische Daten aus klassischen Tabellen mit semantischer Auswertung kombinieren lassen. Ohne separates Prompt-Management, API-Scripting oder externe Tools wird GPT-4 direkt über SQL angesprochen und in analytische Workflows eingebunden.
Weitere Funktionen von MindsDB
MindsDB bietet weit mehr als nur die Anbindung von LLMs. In vielen Anwendungsfällen dient die Plattform dazu, klassische Machine-Learning-Modelle auf strukturierte Daten anzuwenden, Vorhersagen zu treffen oder komplexe Analysen zu automatisieren.
Klassische Vorhersagemodelle lassen sich direkt aus SQL heraus erstellen. Beispiele sind die Vorhersage von Kundenabwanderung (Churn Prediction), die Schätzung von Miet- oder Immobilienpreisen oder die Prognose von Verkaufszahlen und Wetterdaten. Dies geschieht vollständig innerhalb der Datenbankumgebung und ohne separate ML-Infrastrukturen.
Ein weiterer großer Bereich ist die Zeitreihenanalyse. MindsDB ermöglicht die Vorhersage zeitabhängiger Werte wie Energieverbrauch, Produktnachfrage oder Maschinenzustände. Dadurch können Trends frühzeitig erkannt und Kapazitäten besser geplant werden.
Zusätzlich unterstützt MindsDB die Integration großer Sprachmodelle wie GPT-4, Claude oder Mistral. Diese können für Aufgaben wie Textzusammenfassungen, Sentiment-Analysen, Klassifikationen oder Übersetzungen eingesetzt werden. Auch emotionale Wirkungsanalysen, wie im hier beschriebenen Beispiel, lassen sich darüber abbilden.
MindsDB ist ebenfalls in der Lage, Anomalien in großen Datenmengen zu erkennen. Das System eignet sich damit zur Betrugserkennung, zur Qualitätssicherung in Produktionsprozessen oder zur Überwachung von IT-Systemen.
Empfehlungssysteme lassen sich ebenfalls mit MindsDB aufbauen. Basierend auf Nutzungs- oder Kaufhistorien können Modelle erstellt werden, die personalisierte Produktempfehlungen generieren.
Schließlich bietet MindsDB die Möglichkeit, eigene Machine-Learning-Modelle zu integrieren. Mit der Funktion „Bring Your Own Model“ können selbsttrainierte Modelle beispielsweise aus PyTorch oder TensorFlow eingebunden und über dieselbe SQL-Schnittstelle verwendet werden.