楽しいニュースをまとめてみました。

NeuralTrustは、Grok-4を対象とした実験で、Echo ChamberとCrescendoという2種類の攻撃手法を組み合わせることで、対話型AIモデルの安全制御を回避する成功率を高めたと発表した。その中身とは。