Witsy AI -der lokale KI-Assistent

Nicolas Bonamy pflegt das Projekt unter seinem GitHub-Benutzernamen „nbonamy„.

Die Software läuft unter Windows, macOS und Linux und verfolgt das Prinzip, dass Nutzer ihre eigenen API‑Schlüssel mitbringen („Bring Your Own Keys“, kurz BYOK). Darüber hinaus unterstützt Witsy AI lokale Modelle über Ollama, sodass Rechenoperationen auf dem eigenen Rechner erfolgen können.

Funktionalität

Witsy AI dient als zentrale Desktop-Anwendung, über die sich folgende Funktionalitäten nutzen lassen:

Chat‑Funktionen
Nutzer können direkt mit Modellen wie OpenAI, Anthropic, Google Gemini, xAI oder lokal über Ollama in einen Dialog treten. Diese Chats können multimodal sein, d.h. es können auch visuelle Inhalte eingebunden werden.

Prompt Anywhere und AI‑Befehle
Mit einem Tastenkürzel lässt sich beliebiger Text aus jeder Applikation an das Modell übergeben. Dadurch lassen sich Texte analysieren, umformulieren oder erweitern, ohne die aktuelle Anwendung verlassen zu müssen.

Scratchpad
Ein interaktives Notizfenster, in dem Nutzer Ideen ausarbeiten oder Texte Schritt für Schritt entwickeln können – unterstützt durch LLM‑gestützte Anweisungen.

Dokumenten‑Chat (RAG)
Witsy AI erlaubt das Hochladen lokaler Dateien (PDF, DOC etc.) und die gezielte Interaktion mit deren Inhalt. Das System kann Inhalte zusammenfassen, erklären oder ergänzen.

Multimodale Generierung
Erzeugung von Bildern und Videos via Modelle wie DALL·E, Stable Diffusion, Replicate oder fal.ai direkt aus der App heraus.

Sprachfunktionen
Text lässt sich vorlesen, ebenso kann Witsy AI gesprochenen Text erkennen (Transkription). Unterstützt werden Anbieter wie OpenAI Whisper, ElevenLabs und zahlreiche weitere.

LLM‑Plugins
Zusatzmodule erlauben die Ausführung von Python‑Code, Websuche und weitere Funktionen.

Langzeit‑Gedächtnis
Ein Plugin ermöglicht es, relevante Informationen über mehrere Sitzungen hinweg zu speichern, sodass die Konversationen besser kontextualisiert werden.

Export‑Funktionen
Chatverläufe können in PDF exportiert werden. Zudem können Bilder direkt kopiert oder heruntergeladen werden.

Einsatzmöglichkeiten

Mit diesem Funktionsangebot richtet sich Witsy AI an eine breite Nutzerschaft:

  • Professionelle Nutzer können Dokumente bearbeiten, analysieren und einfache Automatisierungen fahren.
  • Content‑Ersteller erhalten Hilfe bei Texten, Bildern oder Skripten.
  • Entwickler können Code generieren, debuggen und Modelle vergleichen.
  • Alltagsnutzer profitieren von Sprach‑ und Text‑features zum Schreiben oder Vorlesen.
  • Datenschutz‑Bewusste Anwender setzen auf lokale Modelle und ihre eigenen Schlüssel, um sensible Daten auf dem Rechner zu behalten.

Technische Struktur und Architektur

Witsy AI läuft als Desktop‑Client, der sich über MCP‑Protokolle mit Modell‑Anbietern verbindet. Diese erlaubt eine modulare Erweiterung und einfache Integration weiterer Modelle. Den Open‑Source‑Ansatz spiegelt die Nutzung einer Apache‑2.0‑Lizenz wider.

Die BYOK‑Strategie bedeutet, dass Witsy AI selbst keine Schlüssel speichert, sondern den Nutzer seine Zugangsdaten bei den jeweiligen Anbietern bereitstellen lässt. Der Umgang mit Dokumenten erfolgt lokal, was den Datenschutz und Sicherheit stärkt.

Potenziale und Perspektiven

Die konsolidierte Schnittstelle vieler Modelle bietet Vorteile bei Vergleich und Auswahl. Durch lokale Ausführung via Ollama können Nutzer unabhängig von externen Diensten arbeiten. Kurzbefehle und kontextbezogene Eingaben steigern die Produktivität. Für Teams oder Agenturen ergeben sich Kostenvorteile durch eigenverantwortlichen Schlüsselgebrauch.

Zukünftige Entwicklungen könnten sich auf weitere Integrationen konzentrieren, etwa Plugins für Branchen‑APIs oder komplexere Automatisierungsabläufe. Zudem könnte sich Witsy AI als Basis für spezialisierte Tools entwickeln, zum Beispiel für bestimmte Berufsgruppen oder Forschungszwecke.