OpenAI hat eine neue Serie fortschrittlicher Reasoning-Modelle vorgestellt, bekannt als OpenAI o1-preview. Diese Modelle sind darauf ausgelegt, komplexe Probleme in Wissenschaft, Programmierung und Mathematik zu lösen und zeigen dabei eine deutlich verbesserte Problemlösungsfähigkeit im Vergleich zu früheren Modellen.
Funktionsweise
Die Modelle wurden trainiert, mehr Zeit in das Nachdenken über Aufgaben zu investieren, ähnlich wie ein Mensch. Sie verfeinern ihren Denkprozess, testen unterschiedliche Strategien und erkennen Fehler. Das nächste Update erzielte in Tests vergleichbare Ergebnisse wie Doktoranden in Physik, Chemie und Biologie. Besonders in Mathematik und Programmierung zeigte das Modell herausragende Fähigkeiten.
Verfügbarkeit und Nutzung
Die ersten Modelle der o1-Serie sind ab sofort in ChatGPT und der API verfügbar. Regelmäßige Updates und Verbesserungen werden erwartet. Die Modelle können manuell in der Modellauswahl von ChatGPT ausgewählt werden, wobei o1-preview und o1-mini jetzt zur Verfügung stehen. ChatGPT Plus- und Team-Nutzer haben ab heute Zugriff, während ChatGPT Enterprise- und Edu-Nutzer nächste Woche Zugang erhalten werden.
Sicherheitsmaßnahmen
Ein wichtiger Aspekt bei der Entwicklung dieser Modelle ist die Sicherheit. Ein neuer Ansatz für das Sicherheitstraining nutzt die Reasoning-Fähigkeiten der Modelle, um Sicherheits- und Ausrichtungsrichtlinien einzuhalten. Ein Messpunkt für die Sicherheit ist, wie gut das Modell seinen Sicherheitsrichtlinien folgt, selbst bei Versuchen, diese zu umgehen („Jailbreaking“). Auf einem der härtesten Jailbreaking-Tests erzielte das o1-preview-Modell 84 von 100 Punkten, während GPT-4o nur 22 Punkte erreichte.
Für die neuen Modelle wurden die Sicherheitsmaßnahmen, die interne Governance und die Zusammenarbeit mit der Bundesregierung intensiviert. Dies umfasst strenge Tests, Bewertungen durch das Preparedness Framework, Red-Teaming-Maßnahmen und Prüfprozesse auf Vorstandsebene, einschließlich des Safety & Security Committee.
Anwendungsgebiete und Zielgruppen
Die erweiterten Reasoning-Fähigkeiten der o1-Modelle sind besonders nützlich für Nutzer, die komplexe Probleme in Wissenschaft, Programmierung, Mathematik und ähnlichen Feldern lösen müssen. o1-Modelle können von Gesundheitsforschern zur Annotation von Zellsequenzierungsdaten genutzt werden, von Physikern zur Erstellung komplexer mathematischer Formeln für die Quantenoptik und von Entwicklern zur Erstellung und Ausführung mehrstufiger Workflows.
OpenAI o1-mini
Zusätzlich zu o1-preview wird auch OpenAI o1-mini angeboten, ein schnelleres und kostengünstigeres Modell, das besonders effektiv beim Programmieren ist. o1-mini ist 80 % günstiger als o1-preview und bietet eine leistungsstarke, kosteneffiziente Lösung für Anwendungen, die Reasoning erfordern, aber nicht auf umfassendes Weltwissen angewiesen sind.
Zukünftige Entwicklungen
Diese Veröffentlichung ist eine frühe Vorschau auf die neuen Reasoning-Modelle in ChatGPT und der API. Neben Modell-Updates sind zusätzliche Funktionen wie Browsing, Datei- und Bild-Uploads geplant, um die Modelle nützlicher zu machen. Weitere Entwicklungen in der GPT-Serie und der OpenAI o1-Serie sind geplant.
Mit diesen neuen Modellen macht OpenAI einen bedeutenden Schritt in Richtung einer neuen Stufe der AI-Fähigkeiten, insbesondere im Bereich des Reasonings und der Problemlösung in komplexen Aufgabenfeldern.

