ChatGPT Sicherheit

Agents SDK 2026 bringt Harness und Sandbox

OpenAI erweitert das Agents SDK um zwei Bausteine, die beim Schritt von Demo zu Produktion oft fehlen: einen stärker modellnahen Harness für den Agent-Loop und eine native Sandbox-Schicht, in der Agenten Dateien, Shell-Befehle und Code sicher ausführen können. Ziel ist weniger Bastel-Infrastruktur, mehr kontrollierbare Ausführung, auch bei langen, mehrstufigen Aufgaben. Übersicht: Was sich im Agents…

April 16, 2026
ChatGPT sicher nutzen: Regeln für Alltag und Arbeit

ChatGPT lässt sich sicher und effektiv nutzen, wenn drei Dinge konsequent zusammenkommen, Regeln und Zuständigkeiten klären, Ergebnisse prüfen, sensible Daten schützen. Praktisch bedeutet das, KI als Assistenz zu behandeln, Transparenz über KI Einsatz zu schaffen und bei wichtigen Entscheidungen immer Menschen und belastbare Quellen vorzuschalten. Übersicht: Warum eine KI Antwort nicht automatisch belastbar ist Welche…

April 11, 2026
OpenAI veröffentlicht Child Safety Blueprint für besseren Kinderschutz

OpenAI hat einen Child Safety Blueprint veröffentlicht, eine Leitlinie dafür, wie Anbieter von KI-Systemen besser gegen KI-gestützte sexuelle Ausbeutung von Kindern vorgehen können. Der Schwerpunkt liegt auf drei Hebeln, aktualisierte Gesetze, präzisere Meldungen und Koordination, sowie Safety-by-Design direkt in KI-Produkten. Die Veröffentlichung ist auf der OpenAI-Seite mit dem Datum 7. April 2026 versehen. Übersicht: Warum…

April 8, 2026
OpenAI Safety Fellowship startet Bewerbung bis 3. Mai

Das OpenAI Safety Fellowship ist laut OpenAI ein befristetes Pilotprogramm für externe Forschende und Praktiker, die konkrete, technisch belastbare Arbeit zu KI-Sicherheit und Alignment liefern wollen. Laufzeit ist vom 14. September 2026 bis 5. Februar 2027, Bewerbungen sind bis 3. Mai 2026 möglich, Rückmeldungen sollen bis 25. Juli 2026 erfolgen. Ziel ist ein substanzielles Ergebnis…

April 6, 2026
Wie OpenAIs Model Spec Verhalten von KI lenkt

Die Model Spec ist OpenAIs öffentliches Regelwerk dafür, wie sich die eigenen KI-Modelle in Konfliktsituationen verhalten sollen, von harter Sicherheit bis zu frei steuerbarem Stil. Der Kern ist eine Prioritätenordnung für Anweisungen, plus klare Standards, an denen Training, Tests und Updates messbar werden. Übersicht: Warum ein öffentliches Verhaltensregelwerk plötzlich praktisch wird Wie sich Model Spec…

März 25, 2026
Teen Sicherheitsregeln als Prompts für sichere KI Apps

OpenAI stellt neue Jugendschutz Richtlinien bereit, die als sofort nutzbare Prompt Vorlagen formuliert sind. Ziel ist, dass Entwickler diese Policies direkt mit dem offenen Safety Modell gpt-oss-safeguard als Klassifikator einsetzen können, um Teen spezifische Risiken konsistent zu erkennen und abzufedern. Übersicht: Warum Teen Kontext Regeln verschiebt Was an Prompt Policies praktisch neu ist So wird…

März 24, 2026
So schützt OpenAI Sora vor Missbrauch

Stand 23. März 2026 setzt Sora laut OpenAI auf ein Sicherheitsprinzip mit zwei Seiten: Inhalte werden technisch als KI erstellt markiert, und riskante Nutzungen rund um Personen, Jugendkonten und problematische Themen werden durch Regeln, Moderation und Nutzerkontrollen begrenzt. Wer Sora verantwortungsvoll nutzt, arbeitet mit diesen Leitplanken, statt sie zu umgehen. Übersicht: Wie Herkunftssignale Fälschungen entwerten…

März 23, 2026
Japan setzt auf strenge Schutzregeln für Teenager KI

Laut OpenAI Japan wurde am 17. März 2026 ein Japan Teen Safety Blueprint vorgestellt, ein Rahmen, der die Nutzung generativer KI für Jugendliche gezielt absichern soll. Im Kern geht es um bessere Alterserkennung, strengere Unter-18-Regeln, mehr Elternwerkzeuge und ein Design, das Wohlbefinden nicht als Nebenbedingung behandelt. Übersicht: Welche Änderungen Jugendliche in Japan tatsächlich spüren Welche…

März 18, 2026
Wie Rakuten mit Codex Ausfälle doppelt so schnell behebt

Rakuten setzt OpenAI Codex als Coding-Agent an drei Engstellen ein, Incident-Response, CI/CD-Prüfungen und die Umsetzung unklarer Spezifikationen. Das Unternehmen berichtet über rund 50% weniger Mean-Time-to-Recovery (MTTR), schnelleres, konsistenteres Code-Review und Projekte, die statt eines Quartals in wenigen Wochen lieferbar werden. Übersicht: Warum ausgerechnet jetzt Agenten-Workflows greifen Wie aus Alarmen schneller Fixes werden Wie Tempo steigt,…

März 11, 2026
Wie die Responses API Agenten produktionsreif macht

Agenten scheitern in der Praxis selten an „Intelligenz“, sondern an Ausführung: Dateien ablegen, Daten nachladen, Ergebnisse reproduzierbar erzeugen, ohne dass Logs den Kontext sprengen oder das Netzwerk zum Risiko wird. OpenAI beschreibt dafür eine Computer-Umgebung rund um die Responses API, in der Modelle Schritte planen, Tools auslösen und in einem isolierten Workspace verlässlich Artefakte wie…

März 11, 2026
So werden KI Agenten gegen Prompt Injection robuster

Prompt Injection ist längst kein simples „Ignore all instructions“ mehr, sondern wirkt in der Praxis oft wie Social Engineering, also wie gezielte Manipulation durch scheinbar plausiblen Kontext. Wer KI Agenten absichern will, braucht deshalb nicht nur Erkennung, sondern Systemgrenzen, die den Schaden begrenzen, selbst wenn ein Angriff teilweise durchrutscht. Genau diesen Perspektivwechsel beschreibt das Unternehmen…

März 11, 2026
IH Challenge zeigt wie Modelle Regeln richtig priorisieren

Am 10. März 2026 hat OpenAI mit IH-Challenge ein Trainingsset vorgestellt, das Sprachmodelle konsequenter dazu bringt, Anweisungen nach Vertrauensstufe zu sortieren. Das soll Konfliktfälle sauber lösen, Sicherheitsvorgaben im Systemprompt zuverlässiger durchsetzen und Prompt-Injection über Tool-Ausgaben spürbar erschweren. Übersicht: Warum falsche Prioritäten schnell zur Sicherheitslücke werden Welche Trainingsfallen Hierarchie Verhalten kaputtmachen Wodurch IH-Challenge echte Signale statt…

März 11, 2026
OpenAI übernimmt Promptfoo für sichere KI Agenten

OpenAI hat am 9. März 2026 angekündigt, Promptfoo zu übernehmen und die Sicherheits und Evaluationsfunktionen nach Abschluss direkt in OpenAI Frontier zu integrieren. Ziel ist, dass Unternehmen KI Agenten vor dem Rollout systematisch auf Angriffe, Datenabfluss und Regelverstöße testen können und dafür nachvollziehbare Prüfspuren für Governance und Compliance erhalten. Laut OpenAI soll das Open Source…

März 10, 2026
Codex Security startet als Security Agent im Preview

Codex Security ist ein KI-gestützter Application-Security-Agent, der ein Softwareprojekt kontextbasiert analysiert, Schwachstellen priorisiert, möglichst validiert und konkrete Fixes vorschlägt. In der Research Preview wird der Zugang über Codex Web für ChatGPT Enterprise, Business und Edu ausgerollt, im ersten Monat mit kostenloser Nutzung. Der Kernnutzen: weniger Fehlalarme, weniger Triage-Arbeit und schnelleres Shipping von sicherem Code, trotz…

März 6, 2026
Was die GPT 5.4 Thinking System Card zeigt

Worum es bei GPT 5.4 Thinking geht GPT 5.4 Thinking ist laut OpenAI das neueste Reasoning Modell innerhalb der GPT 5 Thinking Linie. Der Kernpunkt der System Card: Die Sicherheitsarchitektur folgt dem bisherigen Ansatz der Serie, erweitert aber erstmals ein allgemeines Modell um spezielle Schutzmaßnahmen für hohe Fähigkeiten im Bereich Cybersicherheit. Wie das Modell im…

März 6, 2026