ChatGPT Sicherheit

  • So schützt OpenAI Sora vor Missbrauch

    So schützt OpenAI Sora vor Missbrauch

    Stand 23. März 2026 setzt Sora laut OpenAI auf ein Sicherheitsprinzip mit zwei Seiten: Inhalte werden technisch als KI erstellt markiert, und riskante Nutzungen rund um Personen, Jugendkonten und problematische Themen werden durch Regeln, Moderation und Nutzerkontrollen begrenzt. Wer Sora verantwortungsvoll nutzt, arbeitet mit diesen Leitplanken, statt sie zu umgehen. Übersicht: Wie Herkunftssignale Fälschungen entwerten…

  • Japan setzt auf strenge Schutzregeln für Teenager KI

    Japan setzt auf strenge Schutzregeln für Teenager KI

    Laut OpenAI Japan wurde am 17. März 2026 ein Japan Teen Safety Blueprint vorgestellt, ein Rahmen, der die Nutzung generativer KI für Jugendliche gezielt absichern soll. Im Kern geht es um bessere Alterserkennung, strengere Unter-18-Regeln, mehr Elternwerkzeuge und ein Design, das Wohlbefinden nicht als Nebenbedingung behandelt. Übersicht: Welche Änderungen Jugendliche in Japan tatsächlich spüren Welche…

  • Wie Rakuten mit Codex Ausfälle doppelt so schnell behebt

    Wie Rakuten mit Codex Ausfälle doppelt so schnell behebt

    Rakuten setzt OpenAI Codex als Coding-Agent an drei Engstellen ein, Incident-Response, CI/CD-Prüfungen und die Umsetzung unklarer Spezifikationen. Das Unternehmen berichtet über rund 50% weniger Mean-Time-to-Recovery (MTTR), schnelleres, konsistenteres Code-Review und Projekte, die statt eines Quartals in wenigen Wochen lieferbar werden. Übersicht: Warum ausgerechnet jetzt Agenten-Workflows greifen Wie aus Alarmen schneller Fixes werden Wie Tempo steigt,…

  • Wie die Responses API Agenten produktionsreif macht

    Wie die Responses API Agenten produktionsreif macht

    Agenten scheitern in der Praxis selten an „Intelligenz“, sondern an Ausführung: Dateien ablegen, Daten nachladen, Ergebnisse reproduzierbar erzeugen, ohne dass Logs den Kontext sprengen oder das Netzwerk zum Risiko wird. OpenAI beschreibt dafür eine Computer-Umgebung rund um die Responses API, in der Modelle Schritte planen, Tools auslösen und in einem isolierten Workspace verlässlich Artefakte wie…

  • So werden KI Agenten gegen Prompt Injection robuster

    So werden KI Agenten gegen Prompt Injection robuster

    Prompt Injection ist längst kein simples „Ignore all instructions“ mehr, sondern wirkt in der Praxis oft wie Social Engineering, also wie gezielte Manipulation durch scheinbar plausiblen Kontext. Wer KI Agenten absichern will, braucht deshalb nicht nur Erkennung, sondern Systemgrenzen, die den Schaden begrenzen, selbst wenn ein Angriff teilweise durchrutscht. Genau diesen Perspektivwechsel beschreibt das Unternehmen…

  • IH Challenge zeigt wie Modelle Regeln richtig priorisieren

    IH Challenge zeigt wie Modelle Regeln richtig priorisieren

    Am 10. März 2026 hat OpenAI mit IH-Challenge ein Trainingsset vorgestellt, das Sprachmodelle konsequenter dazu bringt, Anweisungen nach Vertrauensstufe zu sortieren. Das soll Konfliktfälle sauber lösen, Sicherheitsvorgaben im Systemprompt zuverlässiger durchsetzen und Prompt-Injection über Tool-Ausgaben spürbar erschweren. Übersicht: Warum falsche Prioritäten schnell zur Sicherheitslücke werden Welche Trainingsfallen Hierarchie Verhalten kaputtmachen Wodurch IH-Challenge echte Signale statt…

  • OpenAI übernimmt Promptfoo für sichere KI Agenten

    OpenAI übernimmt Promptfoo für sichere KI Agenten

    OpenAI hat am 9. März 2026 angekündigt, Promptfoo zu übernehmen und die Sicherheits und Evaluationsfunktionen nach Abschluss direkt in OpenAI Frontier zu integrieren. Ziel ist, dass Unternehmen KI Agenten vor dem Rollout systematisch auf Angriffe, Datenabfluss und Regelverstöße testen können und dafür nachvollziehbare Prüfspuren für Governance und Compliance erhalten. Laut OpenAI soll das Open Source…

  • Codex Security startet als Security Agent im Preview

    Codex Security startet als Security Agent im Preview

    Codex Security ist ein KI-gestützter Application-Security-Agent, der ein Softwareprojekt kontextbasiert analysiert, Schwachstellen priorisiert, möglichst validiert und konkrete Fixes vorschlägt. In der Research Preview wird der Zugang über Codex Web für ChatGPT Enterprise, Business und Edu ausgerollt, im ersten Monat mit kostenloser Nutzung. Der Kernnutzen: weniger Fehlalarme, weniger Triage-Arbeit und schnelleres Shipping von sicherem Code, trotz…

  • Was die GPT 5.4 Thinking System Card zeigt

    Was die GPT 5.4 Thinking System Card zeigt

    Worum es bei GPT 5.4 Thinking geht GPT 5.4 Thinking ist laut OpenAI das neueste Reasoning Modell innerhalb der GPT 5 Thinking Linie. Der Kernpunkt der System Card: Die Sicherheitsarchitektur folgt dem bisherigen Ansatz der Serie, erweitert aber erstmals ein allgemeines Modell um spezielle Schutzmaßnahmen für hohe Fähigkeiten im Bereich Cybersicherheit. Wie das Modell im…

  • Warum Modelle ihr Denken schlecht verschleiern können

    Warum Modelle ihr Denken schlecht verschleiern können

    Aktuelle Reasoning-Modelle können ihre eigenen Gedankenspuren meist nicht gezielt so formen, dass sie für Überwachungssysteme schwerer auswertbar werden. Genau diese Schwäche ist aus Safety-Sicht beruhigend, weil sie Chain-of-thought Monitoring heute als Schutzschicht vergleichsweise verlässlich macht. Was an der Schwäche der Modelle beruhigt Wie sich Denkspuren überhaupt steuern lassen sollen Welche Tests die Studie wirklich nutzt…

  • Einführung in GPT-4.5

    Einführung in GPT-4.5

    Die nächste Evolutionsstufe der KI OpenAI hat angekündigt, dass GPT-4.5 ab dem 14. Juli 2025 aus der OpenAI-API entfernt wird. Entwickler, die derzeit GPT-4.5 über die API nutzen, müssen bis zu diesem Datum auf ein anderes Modell umsteigen. OpenAI empfiehlt insbesondere den Wechsel zu GPT-4.1, das ähnliche oder bessere Leistungen zu deutlich geringeren Kosten bietet.…

  • Einführung von OpenAI o1-Preview

    Einführung von OpenAI o1-Preview

    OpenAI hat eine neue Serie fortschrittlicher Reasoning-Modelle vorgestellt, bekannt als OpenAI o1-preview. Diese Modelle sind darauf ausgelegt, komplexe Probleme in Wissenschaft, Programmierung und Mathematik zu lösen und zeigen dabei eine deutlich verbesserte Problemlösungsfähigkeit im Vergleich zu früheren Modellen. Funktionsweise Die Modelle wurden trainiert, mehr Zeit in das Nachdenken über Aufgaben zu investieren, ähnlich wie ein…