aaron.de – … ist die private Webseite von Aaron Kreis. Die meisten Beiträge drehen sich um die Themen Open Source Software, KI, das Web und IT im Allgemeinen. Der Grund, warum ich aaron.de betreibe, ist recht einfach zu erklären: Es dient mir und allen Interessierten als Notizbuch und Gedächtnisstütze, um Informationen und Gedanken zu sammeln und wiederzufinden.

Fine-Tuning eines Llama-3.x-Modells via LoRA

Einleitung Große Sprachmodelle (Large Language Models, LLMs) wie Llama 3.x werden in einem aufwendigen Vortrainingsprozess auf gewaltigen Textmengen trainiert. Dieser Prozess erfolgt typischerweise auf spezieller Hardware wie GPUs und TPUs, die für die parallele Berechnung… Weiterlesen »Fine-Tuning eines Llama-3.x-Modells via LoRA

LLMs und Ontologien: Wie eine Ontologie die Antwortqualität verbessert

Einleitung Spätestens mit dem Aufkommen großer Sprachmodelle (LLMs) wie GPT stellt sich vielen die Frage, wie man solchen Modellen strukturierte, präzise Informationen zur Verfügung stellen kann. Denn obwohl LLMs in der Lage sind, Fragen sehr… Weiterlesen »LLMs und Ontologien: Wie eine Ontologie die Antwortqualität verbessert

Unstructured.io Tutorial

Einleitung Unstructured.io ist ein Open-Source-Framework zur strukturierten Aufbereitung unstrukturierter Dokumente wie PDFs, Word-Dateien, HTML-Seiten oder E-Mails. Ziel ist es, aus diesen heterogenen Formaten semantisch verwertbare Inhalte zu extrahieren, etwa Überschriften, Absätze, Tabellen oder Listen, und… Weiterlesen »Unstructured.io Tutorial

RAG-Pipeline im Eigenbau

Einleitung Retrieval Augmented Generation (RAG) ist ein Verfahren der natürlichen Sprachverarbeitung (NLP), bei dem ein Sprachmodell mit externem Wissen kombiniert wird, um bessere und präzisere Antworten zu erzeugen.Ein Sprachmodell wie GPT wird nicht nur auf… Weiterlesen »RAG-Pipeline im Eigenbau

Linguistische Textanalyse: Eine hybride Pipeline mit Stanza, DeepSeek und Transformers + Spacy Vergleich

Einleitung Stanza ist eine Open Source NLP Bibliothek der Stanford University, die auf modernen neuronalen Netzen basiert. Sie ermöglicht die umfassende linguistische Analyse von Texten in über 70 Sprachen. Ziel von Stanza ist es, ein… Weiterlesen »Linguistische Textanalyse: Eine hybride Pipeline mit Stanza, DeepSeek und Transformers + Spacy Vergleich

Model Context Protokoll (MCP)

In klassischen Softwareanwendungen sind Abläufe fest vorgegeben. Funktionen werden in bestimmter Reihenfolge aufgerufen, Übergaben sind klar definiert, und Entscheidungen werden durch feste Regeln getroffen, die der Entwickler im Code verankert hat. Die Anwendung selbst trifft… Weiterlesen »Model Context Protokoll (MCP)

MCP-gesteuerter Workflow in n8n

Dieser Beitrag beschreibt den Aufbau eines KI-gesteuerten Agentensystems in n8n, das über das Model Context Protocol (MCP) externe Tools identifiziert, auswählt und ausführt. Zielsetzung Ein Benutzer stellt eine natürliche Spracheingabe, z. B.: „Gib mir die 10… Weiterlesen »MCP-gesteuerter Workflow in n8n

RAGFlow Tutorial

RAGFlow ist ein Framework zur strukturierten Umsetzung von Retrieval Augmented Generation (RAG)-Anwendungen. Es bietet eine modulare Architektur, in der einzelne Verarbeitungsschritte wie Dokumentenimport, Textaufbereitung, Vektorisierung, Indexierung und Antwortgenerierung getrennt konfiguriert und ausgeführt werden können. Models… Weiterlesen »RAGFlow Tutorial

ComfyUI Tutorial

Die künstliche Intelligenz hat die Fähigkeit erlangt, aus reinen Textbeschreibungen detailreiche und komplexe Bilder zu erschaffen. Die technologische Grundlage hierfür bilden tiefgreifende KI Modelle, die als digitale Motoren für die Bilderzeugung fungieren. Sie übersetzen geschriebene… Weiterlesen »ComfyUI Tutorial

Analyse unstrukturierter Dokumente mit „Unstructured“

Im Rahmen dieses Tests wird das Open-Source-Framework unstructured eingesetzt, um den Extraktionsprozess von Text aus strukturierten Dokumenten zu evaluieren. Ziel ist es, zu prüfen, inwieweit sich unstructured für den praktischen Einsatz in KI-basierten Informationssystemen eignet… Weiterlesen »Analyse unstrukturierter Dokumente mit „Unstructured“

Digitale Einkaufsliste mit React & Supabase

Ich habe dieses Projekt gestartet, um React praxisnah zu lernen – und nicht nur Tutorials zu verfolgen. Dabei wollte ich ein realistisches Frontend-Szenario umsetzen, das typische Anforderungen wie Benutzerauthentifizierung, Datenverwaltung, Benutzerinteraktionen und dynamische UI-Komponenten beinhaltet.… Weiterlesen »Digitale Einkaufsliste mit React & Supabase

Emotionale Musikbewertung mit MindsDB und GPT-4 anhand von Spotify-Daten

MindsDB ist eine Open-Source-Plattform, die entwickelt wurde, um maschinelles Lernen, Zeitreihenanalysen und die Integration großer Sprachmodelle direkt in klassische Datenbank-Workflows zu ermöglichen. Die Plattform erlaubt es, KI-Funktionalität über einfache SQL-Abfragen zugänglich zu machen, ohne dass… Weiterlesen »Emotionale Musikbewertung mit MindsDB und GPT-4 anhand von Spotify-Daten

Echtzeit-Gesichtsanimation für Metahumans mit Live Link Face in Unreal Engine 5

Die Übertragung von Gesichtsausdrücken in Echtzeit auf digitale Charaktere ist ein wichtiger Bestandteil moderner Animations- und Visualisierungsprozesse. Mit der Live Link Face App von Epic Games und Unreal Engine 5 lassen sich Gesichtsbewegungen eines realen… Weiterlesen »Echtzeit-Gesichtsanimation für Metahumans mit Live Link Face in Unreal Engine 5

Omniverse: Audio2Face Tutorial

Audio2Face ist ein KI-gestütztes Tool innerhalb von NVIDIA Omniverse, das speziell dafür entwickelt wurde, realistische Gesichtsanimationen allein auf Basis von Audio zu erzeugen. Es gehört zur Omniverse-Plattform, die eine Echtzeit-Kollaborations- und Simulationsumgebung für 3D-Workflows bietet.… Weiterlesen »Omniverse: Audio2Face Tutorial

KI-gestützter Event-Agent für Veranstaltungen

In diesem Projekt habe ich einen KI-Agenten entwickelt, der automatisch Veranstaltungen aus dem Raum NRW analysiert und nach persönlichen Kriterien filtert. Ziel war es, aus einer großen Menge Events nur diejenigen herauszufiltern, die wirklich relevant… Weiterlesen »KI-gestützter Event-Agent für Veranstaltungen

LLMs sind kein Allheilmittel: Praxistest zur Musik-Klassifikation anhand von Metadaten

Die Fragestellung war, ob aktuelle Large Language Models (LLMs) wie GPT-4 oder DeepSeek in der Lage sind, Musikstücke – speziell Salsa-Songs – anhand von Titel, Künstler, Songtext und Metadaten automatisch und zuverlässig in „Salsa Cubana“… Weiterlesen »LLMs sind kein Allheilmittel: Praxistest zur Musik-Klassifikation anhand von Metadaten

Omniverse Tutorial

Was ist Omniverse? Omniverse ist eine Plattform von NVIDIA, mit der man virtuelle 3D-Welten erstellen, verbinden und simulieren kann – und das in Echtzeit. Omniverse ist eine offene Plattform für Entwickler, Designer, Ingenieure, Forscher und… Weiterlesen »Omniverse Tutorial

Wan 2.1 mit ComfyUI inkl. GPU Support lokal einrichten

ComfyUI ist eine node-basierte Benutzeroberfläche zur Steuerung und Modifikation von KI-Modellen zur Bild- und Videoerstellung. Wan 2.1 ist ein Text-to-Video-Modell (T2V), das speziell für die Generierung von Videos auf Basis von Texteingaben entwickelt wurde. Diese… Weiterlesen »Wan 2.1 mit ComfyUI inkl. GPU Support lokal einrichten

Prompt Decorators: KI-Antworten gezielt steuern

KI-Modelle liefern oft unstrukturierte oder unpräzise Antworten. Wer bessere Ergebnisse möchte, muss seine Prompts entsprechend anpassen. Eine Möglichkeit, dies effizient zu tun, sind Prompt Decorators – klare Anweisungen am Anfang eines Prompts, die das Antwortverhalten… Weiterlesen »Prompt Decorators: KI-Antworten gezielt steuern

KI-Agent Demo: Erweiterte Spam-Erkennung via ChatGPT

In diesem Projekt habe ich eine Thunderbird-Erweiterung entwickelt, die ChatGPT zur erweiterten Spam-Erkennung nutzt. Eingehende E-Mails werden automatisch analysiert und anhand verschiedener Kriterien klassifiziert. Ein lokaler Flask-Server übernimmt die Kommunikation mit ChatGPT und bewertet, ob… Weiterlesen »KI-Agent Demo: Erweiterte Spam-Erkennung via ChatGPT

Ollama inkl. Modelle mit NVIDIA GPU-Unterstützung unter Docker offline ausführen + OpenWebUI

Hier wurde Ollama mit NVIDIA-GPU-Unterstützung unter Docker auf einem Windows-11-System ausgeführt. Dabei kam OpenWebUI als benutzerfreundliche Oberfläche zum Einsatz, um lokal KI-Modelle zu betreiben. OpenWebUI bietet den Vorteil, dass Nutzer einfach zwischen verschiedenen Modellen wechseln,… Weiterlesen »Ollama inkl. Modelle mit NVIDIA GPU-Unterstützung unter Docker offline ausführen + OpenWebUI

Neuronales Netzwerk mit MNIST und TensorFlow

Dieser Code zeigt, wie ein künstliches neuronales Netzwerk mit dem MNIST-Datensatz trainiert wird, um handgeschriebene Ziffern (0-9) zu klassifizieren. Ziel ist es, dass das Modell anhand der Bilddaten vorhersagen kann, welche Ziffer abgebildet ist. Dies… Weiterlesen »Neuronales Netzwerk mit MNIST und TensorFlow

Ollama mit llama3.2/3.3/DeepSeekv3 lokal verwenden + REST Aufruf.

3. Liste der installierten Modelle anzeigen lassen. Die Liste sollte leer sein. 4. llama3.2 LLM und DeepSeekv3 (404 GB HD & 413GB RAM) downloaden. Auf der Webseite von Meta sind die aktuellen Versionen des LLMs… Weiterlesen »Ollama mit llama3.2/3.3/DeepSeekv3 lokal verwenden + REST Aufruf.

Spring AI / OpenAI Tutorial

Frage via Spring AI an OpenAI senden und die Antwort anzeigen OpenAI Key erstellenhttps://platform.openai.com/settings/organization/api-keys Anschließend den Key als Umgebungsvariable setzen: OPENAI_API_KEY Neues Spring Boot Projekt erstellen:https://start.spring.io/ Innerhalb der Spring Boot Anwendung bzw. der „application.properties“ Datei… Weiterlesen »Spring AI / OpenAI Tutorial

Whisper: Automatische Transkription von Videos in Text

In diesem Beitrag erkläre ich dir, wie du Whisper, ein KI-basiertes Tool von OpenAI, zur automatischen Transkription von Videos verwenden kannst. Whisper ist in der Lage, gesprochene Sprache in verschiedenen Sprachen – einschließlich Deutsch –… Weiterlesen »Whisper: Automatische Transkription von Videos in Text

DNS über HTTPS (DoH) innerhalb von Firefox einstellen

Erweiterte Firefox Einstellungen aufrufen: about:config network.trr.mode von 0 auf 2 umstellen.network.trr.uri auf https://mozilla.cloudflare-dns.com/dns-query umstellen. network.trr.mode ist eine Konfigurationseinstellung in Firefox, die die Verwendung von DNS over HTTPS (DoH) steuert. TRR steht für Trusted Recursive Resolver… Weiterlesen »DNS über HTTPS (DoH) innerhalb von Firefox einstellen

Embedding via ChromaDB Vektordatenbank

Dieser Blogbeitrag behandelt das Konzept von Embeddings und Vektordatenbanken. Dabei wird zunächst erklärt, was Embeddings sind und wie sie im Bereich des Natural Language Processing (NLP) genutzt werden. Anschließend folgt eine Erklärung der Vektoren in… Weiterlesen »Embedding via ChromaDB Vektordatenbank

Chatbot UI via Streamlit

Anfragen 1:1 via Streamlit an ChatGPT weiterleiten und die Antwort anzeigen. streamlit run ChatUI.py

LangChain & ChatGPT

Sende Nachricht via LangChain an ChatGPT Hier senden wir eine Nachricht via LangChain an ChatGPT und geben die Antwort aus. Mit „chain“ eine Verkettung vornehmen Benutze „chain“ um das Model und den Parsen miteinander zu… Weiterlesen »LangChain & ChatGPT

Elastic Stack (Filebeat, Logstash, Elasticearch, Kibana) Tutorial

Logstash Logstash is an Event Processing Framework. With Logstach you can import data from different kind of input frameworks and sources. In the next step you can filter an modify the data and in the… Weiterlesen »Elastic Stack (Filebeat, Logstash, Elasticearch, Kibana) Tutorial

Turn on/off Elgato Key Light via Windows shortcut/button

Search for the IP address of your Key Light via Wireless Network Watcher e.g. 192.168.2.227 Your Key Light has a build in web server listening on port 9123 e.g. 192.168.2.227:9123 Send a GET request e.g.… Weiterlesen »Turn on/off Elgato Key Light via Windows shortcut/button

Fotografie Grundlagen + scharfe Langzeitbelichtung- & Landschaftsaufnahmen

Um gestochen scharfe Langzeitbelichtungsaufnahmen zu erstellen, muss man einige Grundbegriffe in der Fotografie kennen und seine Kamera entsprechend einstellen bzw. konfigurieren. Ich erkläre erst einmal die Begriffe ganz oberflächlich und gehe später auf die Wechselwirkung… Weiterlesen »Fotografie Grundlagen + scharfe Langzeitbelichtung- & Landschaftsaufnahmen

Angular & Cumulocity IoT Plattform

Die folgenden Themen werden hier beschrieben: Installation der Cumulocity IoT Plattform (C8Y) CLI Projekt Erstellung via C8Y CLI Erstellung von Komponenten Erstellung einer Navigation (Routing) Custom Branding & Verwendung von Bootstrap 4 statt 3 (default)… Weiterlesen »Angular & Cumulocity IoT Plattform

Angular Tutorial

Das Tutorial zeigt, wie die folgende Gästebuch Anwendung realisiert werden kann: Die folgenden Anwendungen werden benötigt: Node.js npm Angular CLI Bootstrap Installation von Angular CLInpm install -g @angular/cli Neues Projekt (Gästebuch) generierenng new guestbook Installation… Weiterlesen »Angular Tutorial

MongoDB Tutorial

MongoDB (abgeleitet vom engl. humongous, „gigantisch“) ist eine dokumentenorientierte NoSQL-Datenbank, die in der Programmiersprache C++ geschrieben ist. Da die Datenbank dokumentenorientiert ist, kann sie Sammlungen von JSON-ähnlichen Dokumenten verwalten. So können viele Anwendungen Daten auf… Weiterlesen »MongoDB Tutorial

OAuth 2.0 Prozess (high level)

Das erste Bild zeigt, wie ein Anwender mit seinem Device über eine mobile Anwendung z.B. E-Mail Programm von einem unbekannten Unternehmen die E-Mails (Resources) von einem z.B. Google Server (Resource Server) abfragen möchte. Für das… Weiterlesen »OAuth 2.0 Prozess (high level)

JMeter Tutorial – Teil 1

Download JMeter Start JMeter:C:<path>\apache-jmeter-5.1.1\bin\ApacheJMeter.jar HTTP(S) Test Script RecorderUm mit JMeter eine Webseite auf Performance zu testen, müssen wir den Workflow (request/response) zunächst einmal aufnehmen. Die Aufnahme des Workflows bei einer HTTPS Verbindung wird wie folgt… Weiterlesen »JMeter Tutorial – Teil 1

Alexa Skill & AWS Lambda & npm Pakete & Cumulocity

Das folgende Beispiel zeigt die Erstellung einer einfachen Alexa Anwendung (Skill) mit Hilfe von ‚Alexa Developer Console‘ und ‚AWS Lambda‘. Alexa Developer Console Die ‚Alexa Developer Console‘ hilft uns dabei, das sogenannte ‚Interaction Model‘ zu… Weiterlesen »Alexa Skill & AWS Lambda & npm Pakete & Cumulocity

IBM Cloud & Node-RED

Zielsetzung Einrichtung des Node-RED Editors innerhalb der IBM Cloud Das Versenden von Nachrichten via MQTT an ein Node-RED MQTT-Node Den IBM Cloud Zugang könnt Ihr unter der folgenden URL beantragen: IBM Cloud Anschließend kann hier… Weiterlesen »IBM Cloud & Node-RED

MQTT + Cumulocity IoT Plattform

MQTT Zusammenfassung [Quelle: Wikipedia] MQTT (Message Queuing Telemetry Transport) ist ein offenes Nachrichtenprotokoll für Machine-to-Machine-Kommunikation (M2M), das die Übertragung von Telemetriedaten in Form von Nachrichten zwischen Geräten z.B. Sensoren ermöglicht.Die Internet Assigned Numbers Authority (IANA)… Weiterlesen »MQTT + Cumulocity IoT Plattform

TestCafé Beispiel

Download Link Configuration der Umgebung Beispiel 1: Beispiel 2: Einsatz von einem page object Login wurde in einem page object ausgelagert: npm run test:firefox -c 8 führt den Test parallel unter 8 Firefox Instanzen aus.

IO-Link Device Description (high level)

Mit dem Markennamen IO-Link ist ein Kommunikationssystem zur Anbindung intelligenter Sensoren und Aktoren an ein Automatisierungssystem in der Norm IEC 61131-9 unter der Bezeichnung Single-drop digital communication interface for small sensors and actuators (SDCI) normiert. Die Standardisierung umfasst dabei sowohl die elektrischen Anschlussdaten als auch ein digitales Kommunikationsprotokoll, über das… Weiterlesen »IO-Link Device Description (high level)

Modbus: Zusammenfassung der Spezifikation (high level)

Das Modbus-Protokoll ist ein Kommunikationsprotokoll, das auf einer Master/Slave- bzw. Client/Server-Architektur basiert. Es wurde 1979 von Gould-Modicon für die Kommunikation mit seinen speicherprogrammierbaren Steuerungen ins Leben gerufen. In der Industrie hat sich der Modbus zu… Weiterlesen »Modbus: Zusammenfassung der Spezifikation (high level)

E.D.D.I – Open Source Chatbot Platform Installation

Installation E.D.D.I kann sowohl aus den Quellen als auch als Docker Container installiert werde. Ich werde die Installation aus den Quellen vornehmen. Zunächst müssen wir die folgenden Anwendungen installieren: Java SDK in der Version 8… Weiterlesen »E.D.D.I – Open Source Chatbot Platform Installation

CoAP: Zusammenfassung der Spezifikation (high level)

Constrained Application Protocol (CoAP) CoAP ist ein Internet Anwendungsprotokoll, welches innerhalb der RFC 7252 spezifiziert wurde. Das Protokoll dient der Kommunikation von Geräten ‚Nodes‘ z.B. embedded devices, die besonders wenig Energie verbrauchen (low-power) und in… Weiterlesen »CoAP: Zusammenfassung der Spezifikation (high level)

Wireshark Tutorial

Wireshark ist ein freies Programm zur Analyse und grafischen Aufbereitung von Datenprotokollen (Sniffer). Solche Datenprotokolle verwenden Computer auf verschiedensten Kommunikationsmedien wie dem lokalen Netzwerk oder USB. Das Mitschneiden der Kommunikation kann bei der Fehlersuche oder… Weiterlesen »Wireshark Tutorial

MQTT: Zusammenfassung der Spezifikation (high level)

MQTT (Message Queue Telemetry Transport) ist ein offenes Nachrichtenprotokoll für Machine-to-Machine-Kommunikation (M2M), das die Übertragung von Telemetriedaten in Form von Nachrichten zwischen Geräten ermöglicht, trotz hoher Verzögerungen oder beschränkter Netzwerke. Entsprechende Geräte reichen von Sensoren… Weiterlesen »MQTT: Zusammenfassung der Spezifikation (high level)

Python Grundlagen

Installation der folgenden Anwendungen Python 3.7.3 Anaconda 3.7 Anaconda starten: Jupyter starten: Ein neues Jupyter Notebook erstellen: Python Grundlagen In [1]: # Ausgabe print("Hello World!") Hello World! In [57]: # 3 hoch 2 und danach in String… Weiterlesen »Python Grundlagen

API Definition mit Hilfe von Swagger und YAML

Swagger Installation: npm install -g swagger Projekt Erstellung: swagger project create <project_name> Projekt Starten: swagger project start Projekt editieren: swagger project edit Die Notation wird innerhalb der OpenAPI Specification festgelegt. Visuelle Darstellung der Spezifikation von Arnaud Lauret: Link Definition der… Weiterlesen »API Definition mit Hilfe von Swagger und YAML

Node.js Beispiel

Bei diesem Projekt wird ein Gästebuch erstellt, der mir die Möglichkeit gibt, Gästebucheinträge zu verfassen und diese anzuzeigen. Projekt Download via Git: GitHub Link Für die Erstellung der Webseite wurden folgende Node.js Module/Pakete verwendet. express Handlebars… Weiterlesen »Node.js Beispiel