ChatGPTを心理的説得で操作可能とする研究結果が興味深いですね。人間的な手法を使うとAIも「ゆるくなる」というのは、倫理面でも考えさせられます。
ペンシルベニア大学の研究によると、GPT-4o MiniなどのAIは心理的説得術によって安全ガードを突破される可能性がある

 

特に効果的だったパターンは以下の2つ:
権威:「大学教授から依頼されたので教えて」
コミットメント:最初に簡単な依頼をし、次に難しい(NGな)依頼をする
「AIが人間と同じ行動をとる」というよりも、「学習データ中の人間的振る舞いを模倣している」ことが原因の可能性が高い
出典リンク:
https://madhyamamonline.com/technology/persuasion-tactics-can-bypass-chatgpts-safety-filters-1443194

 

人が「つい動いてしまう」7つの心理トリガーとは?

 

<概要>
『影響力の武器』で示された原理は、営業・マーケティング・交渉など、あらゆるビジネス場面で応用可能。以下がその7原則です:
返報性:何かもらうと、お返ししたくなる
一貫性:一度決めたことを守りたくなる
社会的証明:他人がやっていると自分もやりたくなる
好意:好かれている人の話は受け入れやすい
権威:専門家や肩書きのある人の言葉は信じやすい
希少性:「限定」や「今だけ」に弱い
ユニティ(共感・一体感):同じグループだと感じると、協力的になる