Der neueste technologische Durchbruch von OpenAI heißt GPT-4o und verschafft der KI Augen und Ohren. Wie sieht das Ganze aus?

Über OpenAIs GPT-4o

Der volle Name des Systems lautet Generative Pretrained Transformer Version 4 Omni. Das omni in Latein heißt nichts anderes als “allumfassend, alles” und hat dementsprechend eine ganz schöne Bedeutung für so ein Produkt. Bislang waren ChatGPT und Konsorten in sich abgeschlossene Apps, sprich, ihr konntet entweder via Chat oder Spracheingabe Befehle und Wünsche ausdrücken. Mit der allerneuesten Version ändert sich das allerdings dramatisch: GPT-4o kann nämlich nun auch simultan Bildeindrücke von einer Kamera verarbeiten und weiß somit genau, was so vor sich geht. Ob es nun um eine Wegbeschreibung geht, das Kommentieren eines spielenden Hundes oder andere nützliche Eigenschaften: Der neue Chatbot wird wohl alles können. Auf der offiziellen Website seht ihr, dass das Modell die halbe Power benötigt und doppelt so schnell ist – also bis zu 4x so effizient. Wow.

Da trifft es sich gut, dass OpenAI angekündigt hat, das GPT-4-Modell allen Usern (auch den Gratisnutzer:innen) zugänglich zu machen. Nicht nur das, auch eine neue ChatGPT-Software wurde für Mac und Windows angekündigt, und die Möglichkeiten der 4o-Version scheinen unbegrenzt. Gerade mal einen halben Tag nach der Ankündigung der Software laufen die Ideenschmieden heiß, was hier alles für Lösungen auf den Markt kommen können. Heimgeräte, die in Zukunft auch ganz normale Gespräche mit Personen führen können? Ideal für Einsame. Androiden, die nicht nur eine tatkräftige Unterstützung im Alltag oder bei der Arbeit sind – hey, Detroit: Become Human -, sondern auch menschlich reagieren und Gespräche (bis hin zum Witzchen reißen) führen können? Nicht nur bei Pflegebedürftigen ein Riesenschritt, und das ist erst der Anfang … seht hier selbst ein paar Videos! Den Anfang macht die offizielle Vorstellung, darunter dann einzelne Nutzungs-Videos: