Diese Ergebnisse legen nahe, dass eine ToM-ähnliche Fähigkeit (die bisher als einzigartig menschlich angesehen wurde) als Nebenprodukt der Verbesserung der Sprachfähigkeiten von Sprachmodellen spontan entstanden sein könnte.
ChatGPT
Es folgt eine Auflistung von verschiedenen Jailbreaks für ChatGPT.
Eine Temperatur von 0 bedeutet grob gesagt, dass das Modell immer das Wort mit der höchsten Wahrscheinlichkeit auswählt. Eine höhere Temperatur bedeutet, dass das Modell möglicherweise ein Wort mit etwas geringerer Wahrscheinlichkeit auswählt.