ChatGPT KI

  • IH Challenge zeigt wie Modelle Regeln richtig priorisieren

    IH Challenge zeigt wie Modelle Regeln richtig priorisieren

    Am 10. März 2026 hat OpenAI mit IH-Challenge ein Trainingsset vorgestellt, das Sprachmodelle konsequenter dazu bringt, Anweisungen nach Vertrauensstufe zu sortieren. Das soll Konfliktfälle sauber lösen, Sicherheitsvorgaben im Systemprompt zuverlässiger durchsetzen und Prompt-Injection über Tool-Ausgaben spürbar erschweren. Übersicht: Warum falsche Prioritäten schnell zur Sicherheitslücke werden Welche Trainingsfallen Hierarchie Verhalten kaputtmachen Wodurch IH-Challenge echte Signale statt…

  • Codex Security startet als Security Agent im Preview

    Codex Security startet als Security Agent im Preview

    Codex Security ist ein KI-gestützter Application-Security-Agent, der ein Softwareprojekt kontextbasiert analysiert, Schwachstellen priorisiert, möglichst validiert und konkrete Fixes vorschlägt. In der Research Preview wird der Zugang über Codex Web für ChatGPT Enterprise, Business und Edu ausgerollt, im ersten Monat mit kostenloser Nutzung. Der Kernnutzen: weniger Fehlalarme, weniger Triage-Arbeit und schnelleres Shipping von sicherem Code, trotz…

  • So bauten Investoren eine KI Forschungsmaschine fürs Investieren

    So bauten Investoren eine KI Forschungsmaschine fürs Investieren

    Ein globales Investmenthaus hat seine Research-Arbeit neu organisiert, mit einer zentralen KI-Plattform, die wie ein Analyst denken, Quellen finden und Aufgaben ausführen kann. Entscheidend waren harte Modelltests vor dem Rollout, Agenten-Workflows mit Werkzeugzugriff und klare Compliance-Leitplanken. Das Ergebnis: deutlich schnelleres Research bei nachvollziehbaren, prüfbaren Outputs, genutzt von rund 95 Prozent der Investmentteams. Übersicht: Wo traditionelle…

  • Update auf GPT 5.4

    Update auf GPT 5.4

    GPT-5.4 ist laut OpenAI ein Frontier-Modell, das gezielt auf professionelle Wissensarbeit und agentische Workflows optimiert wurde, verfügbar in ChatGPT, der API und Codex. Im Kern kombiniert es stärkere Planung und Recherche, sehr gute Code-Fähigkeiten, native Computerbedienung und deutlich bessere Token-Effizienz, damit komplexe Aufgaben mit weniger Nachfragen und geringeren Kosten durchlaufen. Zusätzlich gibt es GPT-5.4 Pro…

  • Was die GPT 5.4 Thinking System Card zeigt

    Was die GPT 5.4 Thinking System Card zeigt

    Worum es bei GPT 5.4 Thinking geht GPT 5.4 Thinking ist laut OpenAI das neueste Reasoning Modell innerhalb der GPT 5 Thinking Linie. Der Kernpunkt der System Card: Die Sicherheitsarchitektur folgt dem bisherigen Ansatz der Serie, erweitert aber erstmals ein allgemeines Modell um spezielle Schutzmaßnahmen für hohe Fähigkeiten im Bereich Cybersicherheit. Wie das Modell im…

  • Warum Modelle ihr Denken schlecht verschleiern können

    Warum Modelle ihr Denken schlecht verschleiern können

    Aktuelle Reasoning-Modelle können ihre eigenen Gedankenspuren meist nicht gezielt so formen, dass sie für Überwachungssysteme schwerer auswertbar werden. Genau diese Schwäche ist aus Safety-Sicht beruhigend, weil sie Chain-of-thought Monitoring heute als Schutzschicht vergleichsweise verlässlich macht. Was an der Schwäche der Modelle beruhigt Wie sich Denkspuren überhaupt steuern lassen sollen Welche Tests die Studie wirklich nutzt…

  • GPT 5.3 Codex Spark beschleunigt Echtzeit Programmierung

    GPT 5.3 Codex Spark beschleunigt Echtzeit Programmierung

    Was Codex Spark ist Wofür Echtzeit Coding gedacht ist Leistung und Latenz im Trade off Welche Pipeline Optimierungen dahinterstecken Warum Cerebras hier eine Rolle spielt Verfügbarkeit und Limits Sicherheitsbewertung Ausblick auf zwei Codex Modi Ein Modell für Realtime Iteration in Codex GPT-5.3-Codex-Spark ist auf extrem niedrige Latenz getrimmt, damit Änderungen am Code in Codex nahezu…

  • OpenAI o3

    OpenAI o3

    OpenAI sorgt mit seinem o3-Modell für Aufmerksamkeit und wirft Fragen zu den Chancen und Herausforderungen moderner KI auf. OpenAI hat mit seinem o3-Modell eine neue Stufe im Bereich KI-gestützter Reasoning-Anwendungen erreicht. Die Reaktionen aus der Community reichen von Begeisterung bis hin zu Besorgnis. Dabei steht immer wieder die Frage im Raum, ob o3 nun endgültig…