ChatGPT training
-

Wie GPT-Modelle auf einmal Goblin-Metaphern lernen konnten
Die auffälligen Goblin- und Gremlin-Metaphern in GPT‑5.x waren kein Zufall, sondern ein Nebenprodukt von Trainings-Anreizen. Ausgerechnet das Training für eine verspielte „Nerdy“-Personality belohnte Kreaturen-Metaphern so stark, dass sich der Sprach-Tick in andere Kontexte „übertrug“ und über mehrere Modellgenerationen sichtbar blieb. Übersicht: Der Goblin-Tick in GPT‑5.x Wie die Spur zur Nerdy-Personality führte Warum ein belohnter Stil-Tick…
-

IH Challenge zeigt wie Modelle Regeln richtig priorisieren
Am 10. März 2026 hat OpenAI mit IH-Challenge ein Trainingsset vorgestellt, das Sprachmodelle konsequenter dazu bringt, Anweisungen nach Vertrauensstufe zu sortieren. Das soll Konfliktfälle sauber lösen, Sicherheitsvorgaben im Systemprompt zuverlässiger durchsetzen und Prompt-Injection über Tool-Ausgaben spürbar erschweren. Übersicht: Warum falsche Prioritäten schnell zur Sicherheitslücke werden Welche Trainingsfallen Hierarchie Verhalten kaputtmachen Wodurch IH-Challenge echte Signale statt…
