昨今のAIリサーチブームに対し、Perplexityは「DRACO」という極めて厳しい新評価基準を公開し、自社モデルが法務・学術・金融などの専門領域で圧倒的優位にあることを示しました 。 OpenAIやGoogleもDeep Researchを掲げていますが、Perplexityは現実のユーザーが直面する「複雑な推論」を評価の軸に据え、他社システムを20ポイント以上引き離すスコアを叩き出しています。
<管理部の視点から>
法務や経理のリサーチにおいて、判例の網羅性や税務通達の解釈をAIに下調べさせる際、Perplexityは現時点で最も「手戻りが少ない」選択肢といえます(※法務・経理的に重要)。
https://research.perplexity.ai/articles/evaluating-deep-research-performance-in-the-wild-with-the-draco-benchmark
