Im Gegensatz zu herkömmlichen Chatbots, die sich auf Konversation beschränken, ist Proxy darauf ausgelegt, aktiv im digitalen Raum zu handeln – es navigiert Websites, klickt auf Schaltflächen, scrollt durch Seiten und führt Aufgaben aus, als wäre es ein menschlicher Nutzer. Diese Fähigkeit hebt es von der Masse ab und positioniert es als direkten Konkurrenten zu Tools wie OpenAI’s Operator. Convergence AI, ein in London ansässiges Startup, das im April 2024 von den ehemaligen Shopify- und Cohere-Mitarbeitern Marvin Purtorab und Andy Toulis gegründet wurde, hat mit Proxy einen Meilenstein erreicht, unterstützt durch eine Pre-Seed-Finanzierung von 12 Millionen Dollar, angeführt von Balderton Capital.
Der Kern von Proxy liegt in seiner Fähigkeit, alltägliche und berufliche Aufgaben zu automatisieren. Es kann beispielsweise Flüge buchen, Produkte auf Amazon suchen, Formulare ausfüllen oder Wetterberichte zusammenfassen – alles durch einfache, natürliche Sprachanweisungen. Nutzer müssen keine technischen Kenntnisse mitbringen; Proxy ist so gestaltet, dass es mit minimalem Aufwand funktioniert. Diese Benutzerfreundlichkeit wird durch ein Geschäftsmodell unterstrichen, das einen kostenlosen Zugang mit fünf Sitzungen pro Tag bietet und eine unbegrenzte Nutzung für nur 20 Dollar pro Monat – ein Bruchteil der Kosten von OpenAI’s Operator, das 200 Dollar monatlich verlangt. Dies macht Proxy nicht nur leistungsstark, sondern auch erschwinglich.
Technologisch basiert Proxy auf sogenannten Large Meta Learning Models (LMLMs), die es ihm ermöglichen, neue Fähigkeiten zu erlernen und sich in Echtzeit zu verbessern. Ein zentrales Merkmal ist sein Langzeitgedächtnis: Proxy merkt sich vergangene Interaktionen und wiederkehrende Aufgaben, wodurch es effizienter wird. Ein Händler könnte etwa eine tägliche Marktanalyse anfordern, die Proxy automatisch liefert, ohne erneute Anweisungen. Diese Anpassungsfähigkeit unterscheidet es von spezialisierten “narrow agents” und zielt darauf ab, ein vielseitiger Allgemeinassistent zu sein, der sich an individuelle Bedürfnisse anpasst.
Proxy´s Leistung wurde im WebVoyager-Benchmark getestet, wo es mit 88 % bei 643 realen Aufgaben auf Plattformen wie Amazon oder Booking.com glänzte – ein Beweis für seine Robustheit. Nutzer loben auf Plattformen wie X seine Geschwindigkeit und Präzision, etwa wenn es Preise schneller findet als Operator oder komplexe Aufgaben eigenständig löst. Dennoch ist es nicht perfekt: Manche Aufgaben dauern länger als manuelle Eingriffe, und die Formulierung von Anweisungen erfordert gelegentlich Feintuning. Sicherheit steht im Fokus – Proxy agiert nur mit expliziter Zustimmung bei sensiblen Aktionen wie Zahlungen.
Für wen ist Proxy gedacht? Es spricht sowohl Privatnutzer an, die Alltagsaufgaben wie Einkäufe delegieren, als auch Unternehmen, die Prozesse wie Datenaggregation oder Terminplanung optimieren wollen. Convergence experimentiert noch mit dem Einsatzspektrum, sammelt Feedback von Konsumenten, um geschäftsorientierte Funktionen zu verfeinern. Langfristig soll Proxy ein “Generalist” werden, der branchenübergreifend arbeitet – von Forschung bis E-Commerce. Mit einem Team aus Experten von Google DeepMind, Meta und PolyAI und der Vision, Mensch-Maschine-Kollaboration zu revolutionieren, könnte Proxy 2025 zum Maßstab für KI-Assistenten werden. Es ist ein Werkzeug, das nicht nur redet, sondern handelt – und das zu einem unschlagbaren Preis.