<ニュース概要>
NVIDIAが次世代基盤「Rubin」で、推論トークンのコストを最大1/10にできる見込みを示しました。
LLMの開発会社のコストも最大で1/10になりえるので、利益をLLM提供会社が享受するのか?より安くLLMのAPIを提供するベンダーがでてくるのか?ますますAI周辺は変化に加速がつきそうです。
https://www.nvidia.com/en-us/data-center/vera-rubin-nvl72/