Google hat mit Gemini 2.0 die nächste Ära von großen Sprachmodellen eingeläutet, mitsamt einem neuen KI-Forschungsassistenten! Es geht Schlag auf Schlag – nachdem das Video-Creation-Tool Sora veröffentlicht wurde, hat Google mit dem Willow-Chip ordentliche Quanten-Computer-Hardware nachgelegt. Jetzt geht das Unternehmen einen entscheidenden Schritt weiter!

Über Googles Gemini 2.0

Das erste Modell dieser neuen Ära ist eine experimentelle Version von Gemini 2.0 Flash. Nutzer*innen von Gemini Advanced profitieren zudem ab sofort von Deep Research, dem neuen KI-Forschungsassistenten von Gemini. Das bisher leistungsfähigste Modell ist mit neuen Fortschritten in der Multimodalität – wie nativem Bild- und Audio-Output ausgestattet. Ab sofort können Gemini-Nutzer*innen weltweit auf eine für Chats optimierte Version von 2.0 Flash Experimental zugreifen, indem sie diese in der Modell-Dropdown-Liste auswählen. Gemini 2.0 Flash baut auf dem Erfolg von 1.5 Flash auf, mit verbesserter Leistung bei ähnlich schnellen Reaktionszeiten. Bemerkenswert ist, dass 2.0 Flash bei wichtigen Benchmarks sogar doppelt so schnell ist wie 1.5 Pro.

Dabei bietet 2.0 Flash auch neue Funktionen. Flash 2.0 unterstützt nicht nur multimodale Eingaben wie Bilder, Video und Audio, sondern auch multimodale Ausgaben wie nativ generierte Bilder gemischt mit Text und steuerbarem Text-to-Speech (TTS) in mehreren Sprachen. Gemini 2.0 Flash ist ab sofort als experimentelles Modell für Entwickler*innen über die Gemini-API in Google AI Studio und Vertex AI verfügbar, mit multimodaler Eingabe, Textausgabe und Text-to-Speech sowie nativer Bilderzeugung für Early-Access-Partner. Die allgemeine Verfügbarkeit wird im Januar zusammen mit weiteren Modellgrössen folgen. Der englischsprachige Blogpost von Google höchstselbst hat diesbezüglich noch mehr Infos für euch!

Deep Research: KI-Assistent von Gemini

Neben Gemini 2.0 hat Google zudem auch den KI-Forschungsassistenten Deep Research vorgestellt. Die neue Funktion ist ab sofort in Gemini Advanced verfügbar und unterstützt mithilfe künstlicher Intelligenz, komplexe Themen zu recherchieren und die Ergebnisse in einem umfassenden, leicht verständlichen Bericht anzuzeigen. Deep Research stellt unter Beweis, wie Gemini immer besser komplexe Aufgaben bewältigt und so Zeit spart. Mit Deep Research hat Google ein neues agentenbasiertes System entwickelt. Was bedeutet das?

So wird die Expertise von Google bei der Suche nach relevanten Informationen im Internet genutzt, um das Browsen und die Recherche von Gemini zu steuern. Zusammen mit den fortschrittlichen Schlussfolgerungs-Fähigkeiten von Gemini und dem branchenführenden 1M-Token-Kontextfenster erstellt es umfassende Berichte mit hilfreichen, leicht verständlichen Informationen. Weitere Informationen zu Deep Research findet ihr in diesem englischsprachigen Blogpost von Google.