Der Eintrag „Berlinale Tickets“ um 9:45 Uhr in meinem Google Kalender erinnerte mich daran, Karten für einen begehrten Film während des Festivals zu ergattern. Ich hatte Googles Sprachmodell Gemini vor einigen Tagen darum gebeten, mich zeitig vor dem Verkaufsbeginn zu erinnern. Dass ein Kalendereintrag von einem Sprachmodell erstellt wurde, wirkt zunächst vielleicht wie eine triviale Kleinigkeit, aber sie ist ein Vorgeschmack auf das, was aktuell ausgerollt wird: Die führenden KI-Unternehmen wagen sich daran, unterschiedliche Anwendungen mit ihrem Sprachmodell zu verknüpfen. Googles Gemini kann jetzt beispielsweise auf Apps wie YouTube oder Gmail zugreifen und Informationen zusammenfassen oder – wie im Beispiel des Kalendereintrags – Aktionen ausführen.
Manche reden davon, dass jetzt die Ära der „KI-Superagenten“ (ich nenne sie lieber Multitasker, das klingt weniger nach Science Fiction) beginnt: Sprachmodelle übernehmen eine koordinierende und übersetzende Rolle zu anderen Apps. Open AI arbeitet gerade an ähnlichen Prozessen und veröffentliche kürzlich seinen „Operator“, der beispielsweise ein Kochrezept raussuchen und die passenden Zutaten in einen virtuellen Warenkorb legen soll – so bewirbt OpenAI seinem Dienst zumindest selbst:
Ich finde diese Entwicklung aus zwei Gründen sehr interessant:
1. Die führenden Sprachmodelle wurden in den letzten Wochen aktualisiert und sie können nun „mehrschrittig denken“, bevor sie antworten. Die Automatisierbarkeit von immer mehr Tätigkeiten wird dadurch möglich. Die neuen Sprachmodelle drehen interne Schleifen und verbessern somit die Ergebnisqualität um ein Vielfaches. OpenAIs „Deep Research“ Modell soll laut den US-Universitätsprofessoren Tyler Cowen und Ethan Mollick solide wissenschaftliche Paper wie ein Doktorand schreiben – auch, wenn die Originalität weiterhin fehlen soll. Diesen Prozess der Mehrschrittigkeit kann man nun auch nachverfolgen, wenn man möchte, dass ein Sprachmodell mit anderen Anwendungen interagiert. Ich habe zum Beispiel Gemini 2.0 darum gebeten, mir Zusammenfassungen aus YouTube-Videos zum Thema „KI-Skills im Betrieb“ zu erstellen. Die Videos sollten dabei nicht älter als ein Jahr sein. Das Sprachmodell dokumentiert wie es vorgegangen ist:

Für eine oberflächliche Recherche waren die Ergebnisse auch hilfreich und korrekt:

2. Der Hauptgrund, weshalb mich die Entwicklung interessiert, ist, dass ein unfassbar großes Produktivitätspotenzial drinsteckt. Wenn Google es schaffen sollte, seine Anwendungen für Tabellen und Präsentationen mit seinem Sprachmodell zu verknüpfen, können sich Arbeitsprozesse um ein Vielfaches erleichtern. Ich denke speziell an Kleinstunternehmen und Selbstständige, die künftig einem Sprachmodell beschreiben, wenn sie eine Präsentation benötigen oder lästige Kalkulationen machen müssen und binnen weniger Minuten Ergebnisse oder zumindest Entwürfe erhalten.
Natürlich gibt es bereits jetzt Wege, Präsentationsgestaltung oder tabellarische Kalkulationen zu automatisieren, aber die Bequemlichkeit alles über eine „zentrale Stelle“ zu machen, könnte Zeit und Mühe sparen. KI-Sprachmodelle werden zunehmend zu Assistenten, mit denen man spricht – und sie führen konkrete Aufgaben selbstständig aus. Wenn Sprachmodelle zu Schnittstellen zwischen Browsern und unterschiedlichen Programmen werden können, können viele simple Tätigkeiten automatisiert werden, die vor allem auf Sachbearbeitungsebene sind – das Dokumentieren und korrekte Sortieren von Informationen würde sehr viel schneller gehen. Sicher – KI-Sprachmodelle halluzinieren noch und sind nicht so präzise, wie man es bräuchte, aber voraussichtlich wird auch dieses Problem immer geringer.
Mein Eindruck ist, dass der KI-Hype sich gerade wieder normalisiert und die Angst um Massenarbeitslosigkeit auch zurückgeht. Ich denke, das liegt vor allem daran, dass die ersten KI-Sprachmodelle, die in der Breite angekommen sind, teilweise ernüchternd fehlerbehaftet und unpräzise waren. Teilweise liegt es auch daran, dass viele Beschäftigte und Betriebe nie identifiziert haben, wie sie KI überhaupt sinnvoll für sich nutzen können. Je weiter sich KI-Sprachmodelle jedoch weiterentwickeln, umso größer wird der Einfluss auf die Arbeitswelt. Man sollte weiterhin wachsam sein und verfolgen, welche Tätigkeiten letztendlich entwertet werden – und welche sogar an Bedeutung gewinnen.
Eine grobe Orientierung bietet der Job Futuromat des Instituts für Arbeitsmarkt- und Berufsforschung. Er zeigt in welchen Berufen sich Tätigkeiten bereits automatisieren lassen. Der Stand des Futuromaten ist aus dem Dezember 2023, aber er ist dennoch sehr aussagekräftig und ich empfehle einen Besuch der Webseite.
Am Beispiel des Berufs Bankkauffrau/Bankkaufmann sieht man, dass bereits jetzt sieben von neun Kerntätigkeiten automatisiert werden können, doch vor allem der zwischenmenschliche Aspekt des Jobs (z.B. Kundenbetreuung) „maschinenfest“ zu sein schein

Bisher deutet vieles für mich darauf hin, dass zwischenmenschliche Fähigkeiten wichtiger werden. Ob sich diese Fähigkeiten auch in guten Gehältern übersetzen werden, ist jedoch vollkommen offen.
Übrigens: Auf meinem persönlichen Newsletter gibt es mehr Beobachtungen und Perspektiven zur Arbeitswelt und dem Einfluss von KI. Und nein, es kostet nichts. Nein, ich verkaufe auch nichts. Es ist einfach ein Newsletter, der mehr Raum für Gedanken zulässt.