AI開発者は、AIが有害な情報を出力することがないようさまざまな安全対策を施しています。ところが、厳密に思える安全対策でも「チーズの作り方」といった一見無害な情報で微調整されることで突破されてしまう可能性があることが明らかになりました。