Computer-using Agents für KMU: KI automatisiert alte Software ohne API

Viele Automatisierungsprojekte scheitern nicht an fehlender KI, sondern an alten Oberflächen. Ein Lieferantenportal hat keine API, die Warenwirtschaft läuft in einer Desktop-Anwendung, Daten kommen per E-Mail als PDF, und der sauberste Prozess endet trotzdem mit Kopieren, Prüfen, Klicken und Nachtragen. Genau hier werden Computer-using Agents interessant: KI-Agenten, die nicht nur Text generieren, sondern Anwendungen über die Benutzeroberfläche bedienen können.

Für österreichische KMU ist das mehr als ein neues Feature in großen Software-Suiten. Es verschiebt die Frage von „Können wir das überhaupt automatisieren?“ zu „Welchen Prozess dürfen wir verantwortbar automatisieren, und wie prüfen wir jeden Schritt?“ Damit wird KI-Automatisierung konkreter, aber auch anspruchsvoller. Wer jetzt nur auf Tool-Demos schaut, übersieht Governance, Zugriffsrechte, Fehlerfälle und die Qualität der eigenen Prozesse.

Was jetzt neu ist

Microsoft hat am 13. Mai 2026 die allgemeine Verfügbarkeit von Computer-using Agents in Copilot Studio kommuniziert. In den offiziellen Unterlagen beschreibt Microsoft diese Funktion als Möglichkeit, Websites und Desktop-Anwendungen über eine grafische Benutzeroberfläche zu bedienen: Buttons klicken, Menüs auswählen, Felder ausfüllen und Daten extrahieren, auch wenn keine API verfügbar ist. Am 26. Mai 2026 folgten weitere Copilot-Studio-Updates rund um Workflows, Work IQ, Interoperabilität und Agent-to-Agent-Kommunikation.

Wichtig ist dabei nicht nur das Klicken selbst. Die Produktentwicklung geht klar in Richtung Betrieb: sichere Anmeldeinformationen, unterschiedliche Modelle für unterschiedliche Oberflächen, Monitoring, Session-Replay, Audit-Logs und Cloud-PC-Kapazitäten für skalierbare Ausführung. Das ist ein anderes Signal als ein einzelner Bot, der auf einer Demo-Webseite ein Formular ausfüllt. Die Anbieter bauen Betriebsschichten, damit Agenten in echten Arbeitsabläufen verwaltet werden können.

OpenAI zeigt denselben Trend aus einer anderen Richtung. In den ChatGPT Enterprise & Edu Release Notes vom 29. Mai 2026 wird Computer Use für Codex auf Windows beschrieben, inklusive Remote-Control-Szenarien. Einen Tag davor, am 28. Mai 2026, wurden neue Modell-, Admin-, App-Zugriffs- und Antwortfunktionen für ChatGPT Workspace Agents angekündigt. Die Richtung ist eindeutig: Agenten wandern aus dem Chatfenster in die operative Arbeit und bekommen mehr Rechte, mehr Kontext und mehr Administrationsbedarf.

Warum das für österreichische KMU relevant ist

Viele KMU haben keine perfekte Systemlandschaft. Es gibt gewachsene Branchenlösungen, Buchhaltungs- und Warenwirtschaftssysteme, Lieferantenportale, Excel-Listen, E-Mail-Postfächer, CRM-Felder und manuelle Freigaben. Klassische Automatisierung funktioniert dort gut, wo Daten sauber strukturiert sind und Schnittstellen stabil bleiben. Sie wird teuer und wartungsintensiv, wenn Oberflächen wechseln, Eingaben variieren oder Entscheidungen vom Kontext abhängen.

Computer-using Agents schließen diese Lücke nicht vollständig, aber sie können sie kleiner machen. Ein Agent kann zum Beispiel eingehende E-Mails klassifizieren, relevante Daten aus einem Anhang herausziehen, sie mit einer Kunden- oder Auftragsliste abgleichen und anschließend ein internes Portal bedienen. Bei Unsicherheit kann er einen Menschen um Freigabe bitten. Das ist kein Ersatz für saubere APIs, aber ein pragmatischer Zwischenschritt für Prozesse, die sonst jahrelang liegen bleiben.

Gerade in Österreich ist dieser Zwischenweg spannend, weil viele Betriebe mit kleinen Teams arbeiten. Der Engpass ist selten nur Softwarebudget. Häufig fehlt Zeit für wiederkehrende Sachbearbeitung: Angebote nachfassen, Bestelldaten übertragen, Servicefälle vorsortieren, Rechnungsinformationen prüfen oder Website-Anfragen qualifizieren. Wenn ein Agent hier 20 bis 40 Prozent der Routinearbeit vorbereitet, entsteht schon Nutzen, bevor ein komplettes ERP-Projekt gestartet wird.

Die eigentliche Chance liegt nicht im Bot, sondern im Prozessdesign

Der Fehler vieler KI-Projekte ist ein zu breiter Start. „Wir automatisieren den Kundenservice“ klingt gut, ist aber für einen ersten Agenten zu groß. Besser ist ein klar begrenzter Ablauf: ein Eingangskanal, ein Dokumenttyp, ein Zielsystem, eindeutige Erfolgskriterien und definierte Stopps. Zum Beispiel: „Eingehende Händleranfragen aus einem Postfach erfassen, Dubletten prüfen, Stammdaten vorschlagen und erst nach menschlicher Freigabe ins CRM schreiben.“

Hier passt die Leistung Künstliche Intelligenz und Automatisierung fachlich direkt hinein. Wir konfigurieren nicht nur ein Tool, sondern zerlegen den Prozess zuerst in prüfbare Schritte: Welche Daten werden gelesen? Welche Entscheidungen darf der Agent treffen? Wo braucht es Freigabe? Welche Systeme werden berührt? Welche Protokolle braucht das Unternehmen später für Datenschutz, Qualitätssicherung und Fehleranalyse?

Wenn der Agent mit der eigenen Website, Formularen oder Kundenportalen interagiert, kommt zusätzlich Webdesign und Webentwicklung ins Spiel. Eine Website, die für Menschen gerade noch verständlich ist, ist nicht automatisch agententauglich. Klare Formularzustände, robuste Fehlermeldungen, semantisches HTML, konsistente Button-Beschriftungen und saubere Bestätigungsseiten helfen Menschen, Suchmaschinen und Agenten gleichermaßen. Der Beitrag Wenn KI auf Ihrer Website klickt vertieft diesen Blick auf agententaugliche Websites.

Wo Computer-using Agents sinnvoll starten können

Ein guter erster Anwendungsfall hat drei Eigenschaften: Er ist häufig genug, um Aufwand zu rechtfertigen, er ist begrenzt genug, um sicher getestet zu werden, und ein Fehler ist korrigierbar. Beispiele sind die Vorqualifizierung von Kontaktanfragen, das Abgleichen von Lieferantenbestätigungen, das Übertragen von Daten aus standardisierten PDFs, die Vorbereitung von Supporttickets oder das Befüllen interner Masken nach einer menschlichen Prüfung.

Weniger geeignet sind irreversible Vorgänge ohne Freigabe: Zahlungen auslösen, Verträge final abschicken, Preisdaten massenhaft ändern oder personenbezogene Entscheidungen ohne nachvollziehbare Kontrolle treffen. Dort sollte ein Agent höchstens vorbereiten, erklären und dokumentieren. Die endgültige Handlung bleibt beim Menschen oder bei einer stabilen, regelbasierten Schnittstelle.

Besonders stark wird der Ansatz, wenn er mit bestehenden Automatisierungen kombiniert wird. Klassische RPA, Power Automate, Zapier, Make oder eigene API-Integrationen bleiben sinnvoll, wenn Abläufe stabil und deterministisch sind. Computer-using Agents ergänzen diese Landschaft dort, wo ein Portal keine API bietet oder ein Prozess zu viele kleine Varianten hat. Das Ziel ist nicht, alles durch KI zu ersetzen, sondern die richtige Automatisierungsform pro Prozessschritt zu wählen.

Grenzen: UI-Agenten brauchen harte Leitplanken

Computer-using Agents wirken flexibel, weil sie Oberflächen sehen und bedienen können. Genau daraus entstehen Risiken. Eine Oberfläche kann sich ändern. Ein Pop-up kann anders aussehen. Ein versteckter Hinweis in einer Webseite kann als Prompt Injection versuchen, den Agenten zu beeinflussen. Microsoft weist in der eigenen Dokumentation zur menschlichen Aufsicht ausdrücklich darauf hin, dass Computer-use-Agenten Prompt-Injection-Angriffen begegnen können und dass Human-Supervision nicht als garantierter Sicherheitsmechanismus missverstanden werden darf.

Für KMU heißt das: Ein Agent braucht eine Testumgebung, begrenzte Rechte, saubere Zugangsdaten, Protokollierung und klare Abbruchregeln. Er sollte nicht mit einem Allzweck-Admin-Konto arbeiten. Er sollte nur auf Systeme zugreifen, die für den Prozess nötig sind. Und jede produktive Ausführung sollte nachvollziehbar machen, welche Informationen gelesen, welche Felder geändert und welche Entscheidungen getroffen wurden.

Auch Datenschutz und EU AI Act gehören früh in die Planung. Die EU-Kommission nennt für den AI Act mehrere relevante Meilensteine: KI-Kompetenzpflichten und Verbote gelten seit 2. Februar 2025, die Regeln für General-Purpose-AI-Modelle seit 2. August 2025, Transparenzregeln werden im August 2026 wirksam. Nach der politischen Einigung vom 7. Mai 2026 sollen bestimmte Hochrisiko-Regeln später greifen, aber Transparenz, Dokumentation und Zuständigkeiten bleiben praktische Themen für Unternehmen, die KI-Systeme einsetzen.

Ein pragmatischer 30-Tage-Pilot

Für ein österreichisches KMU muss der erste Pilot nicht groß sein. Sinnvoll ist ein 30-Tage-Plan mit vier Bausteinen.

Erstens: Prozessaufnahme. Ein Team dokumentiert einen konkreten Ablauf mit echten Beispielen, Varianten, Fehlerfällen und beteiligten Systemen. Wichtig ist die Frage, welche Entscheidung heute wirklich menschliches Urteil braucht und welche nur Gewohnheit ist.

Zweitens: Risiko- und Datenprüfung. Personenbezogene Daten, Zugangsdaten, vertrauliche Kundendokumente und externe Portale werden markiert. Daraus entstehen Rollen, Rechte, Freigabeschritte und Löschfristen.

Drittens: Agenten-Prototyp. Der Agent arbeitet zunächst nur lesend oder in einer Testumgebung. Er erstellt Vorschläge, füllt Entwürfe aus oder simuliert Klickpfade. Gemessen werden Durchlaufzeit, Korrekturbedarf, Fehlertypen und Akzeptanz im Team.

Viertens: Betriebsentscheidung. Erst wenn der Ablauf stabil genug ist, wird entschieden, ob der Agent produktiv schreiben darf, ob eine klassische API-Integration besser ist oder ob die Oberfläche selbst verbessert werden muss. Genau an dieser Stelle wird aus KI-Spielerei ein belastbares Automatisierungsprojekt.

Was wir praktisch daraus machen können

Wir können Computer-using Agents als Brücke zwischen Beratung, technischer Umsetzung und laufender Optimierung einsetzen. Für Betriebe, die bereits wissen, welcher Prozess schmerzt, beginnt die Arbeit mit einem Automatisierungs-Audit. Für Betriebe, die nur spüren, dass viel Zeit in Routine verschwindet, beginnt sie mit einer Prozesslandkarte: Eingangskanäle, Systeme, manuelle Übergaben, Risiken und erwarteter Nutzen.

Daraus entsteht ein kleiner, überprüfbarer Pilot statt einer großen KI-Vision. Wir wählen geeignete Tools aus, formulieren Prompts und Prozesslogik, bereiten Testdaten vor, definieren Freigaben und bauen die technische Umgebung so, dass ein Agent nicht mehr darf, als er wirklich braucht. Wenn die eigene Website oder Landingpage Teil des Ablaufs ist, werden Formulare, Tracking, Fehlerzustände und Inhalte gleich mitgedacht. Wenn Sichtbarkeit und Anfragequalität betroffen sind, kann Online-Marketing zusätzlich helfen, die richtigen Anfragen in den Prozess zu bringen.

Der Beitrag AI Agent Entwicklung für KMU in Österreich 2026 beschreibt die breitere Agenten-Strategie. Der neue Punkt ist enger: Computer-using Agents machen alte Software nicht modern, aber sie können eine Lücke überbrücken, bis Systeme sauber integriert oder ersetzt werden. Für viele KMU ist genau diese Brücke der realistische Start.

Fazit

Computer-using Agents sind kein Freibrief für autonome Software, die unbeaufsichtigt im Unternehmen herumklickt. Sie sind ein neuer Automatisierungsbaustein für die vielen Prozesse, die bisher zwischen E-Mail, PDF, Portal und Desktop-Anwendung feststecken. Der Nutzen entsteht dort, wo ein klarer Prozess, begrenzte Rechte, menschliche Freigaben und technische Protokolle zusammenspielen.

Für österreichische KMU lautet die wichtigste Frage deshalb nicht: „Welches Agenten-Tool ist das beste?“ Die bessere Frage ist: „Welcher wiederkehrende Ablauf ist wertvoll genug, begrenzt genug und prüfbar genug, um ihn jetzt mit KI zu pilotieren?“ Wer so startet, kann von der neuen Agenten-Welle profitieren, ohne Kontrolle, Datenschutz und Qualität dem Zufall zu überlassen.