PCを購入する際に、例えばCPUならばクロック周波数やコア数、RAMならばその容量、グラフィックボードならば搭載VRAM容量やメモリ帯域幅など、比較のための指標が数多く存在する。また、ベンチマークテストによって、CPUやGPUならばその計算能力を比較する事が出来る。これまで、コンピュータの計算能力は浮動小数点演算の実行回数である「FLOPS」(FLoating-point Operations Per Second)で表現されることが多かった。これは、特に科学技術計算や3DCGなどでコンピュータに求められる性能を比較するために重要な指標であるが、AI PCの登場により、また状況は少し変わってくる。
MicrosoftがAI PCこと「Copilot+ PC」を推進し、Windows PCがAI性能を重視するようになると、ユーザーが個々のPCのAI性能を比較するための指標が必要となる。AIの機械学習(Machine Learning: ML)では整数演算を行うことが多く、AI処理向けに設計されたAIアクセラレータや、新世代のCPU、GPU、それに搭載されるNPUなどには整数演算の高速化に特化した回路や命令などが用意されるようになってきた。そして、これまでの浮動小数点演算を比較するFLOPSに代わり、整数演算の能力を反映した指標が求められるようになった。それが「TOPS(Tera Operations per Second)」だ。
TOPSは新しい言葉ではないが、AI PCと言う言葉が以前より多く聞かれることにより、より一般化してきた印象だ。
TOPSは、その言葉通り、単純に“システムが1秒間に何兆回の演算を実行できるか”を示すものだ。例えば、10TOPSならば、1秒間に10兆回の演算が実行できるコンピューティングパワーを表す。この場合の演算とは、特にこれが用いられる場面が整数演算処理性能が重視されるAI関連が多い為、通常は整数演算を指すことが多い。1秒間に10兆回の演算性能を持つデバイスならば、「10TOPS (INT8)」と言った表記が行われる。
TOPSは、システム全体のパフォーマンスを測定するために使用できるが、特定のハードウェアを分割して測定することもできる。例えばAI PCにおけるニューラル・プロセッシング・ユニット(NPU)の処理能力を表す指標として、このTOPSが最近ではよく用いられている。
IntelのCore Ultra CPU(同社初のNPU搭載CPU)は、CPU、統合GPU、NPUを含めて全体で34TOPSを提供し、そのうち約10TOPSはNPUのみで実現している。AMDのRyzen AI 300モバイルプロセッサーは、NPUの性能を50TOPSに引き上げており、Qualcommの次期Snapdragon Xプロセッサは45TOPSのNPUを搭載して発売される予定だ。
Intel、AMD、Qualcommは、次世代でもNPU性能の向上を続けると予想されている。現在、Intelの次世代プロセッサ「Lunar Lake」が48TOPSのNPUを搭載することが分かっている。
これらのチップメーカーは、自社製品を宣伝するためにTOPSを用いているが、それは主に性能を単純化し、購入者に性能をアピールしやすくするためである事は忘れてはならない。
NPU性能を分析する際、TOPSが全体像を表していないことは確かだ。次世代コンソールがまだ目前に迫っていた2023年のTFLOPSブームのように、TOPSはシステム性能を単純化し、より多くの人に宣伝するために使われている。競合他社の2倍、3倍のTOPSが可能なNPUは、理論上は素晴らしく見えるが、実際の利用を環境を反映していないこともある。
現状TOPSは、「大きければ良く、小さければ悪い」という状況だが、NPUの性能を左右する要因はもっとたくさんある。例えば、ある特定のNPUが、特定のタスク用にチューニングされている可能性があり、その場合これは例え100TOPSの性能しかなくても、別のタスク用にチューニングされた200TOPSのNPUに勝てる可能性もあるのだ。最適化次第によって実際の性能は大きく変わる可能性がある。
CPUやGPUにベンチマークテストがあり、これによってそれぞれの性能比較が行われているように、NPUのテストもまた、TOPSとはまた別の情報をユーザーに提供する事になるだろう。
とはいえ、TOPSがNPUの性能を判断する最良の指標ではないとしても、AI PCを大まかに比較できる基準を購入者に与える一助となることは確かだ。ただそれでも、TOPSは完璧な指標ではなく、チップメーカーが自社製品を比較・宣伝するための簡単な手段であることは忘れてはならない。