AIの性能を“短期的な正確さ”だけで測る時代は終わりつつあります。GPT-2が3秒だった「50%ホライゾン」は、Claude 3.7で50分、そしてGPT-5で2時間17分まで伸びました。この指標は、AIがどれだけ長いタスクに取り組めるかを示す重要な尺度。仮に現在のペースで進化が続けば、1年後には18時間、3年後には1カ月のタスクも視野に入ってきます。
これはまさに、AIが“数時間で終わるツール”から“プロジェクトに参加できるパートナー”へと進化している証拠。業務の中でも、調査・分析・文書作成など持続的なアウトプットが求められる分野での活用に注目が集まりそうです。
「50%ホライゾン」とは?
定義: AIが、人間があるタスクを50%の確率で成功させるのにかかる時間と同程度の難易度を、AIが同じ50%の成功率で達成できるタスクの時間的長さ。
https://xtech.nikkei.com/atcl/nxt/mag/rob/18/00007/00091/