利用者:Harrier7931/sandbox

ここはHarrier7931さんの利用者サンドボックスです。編集を試したり下書きを置いておいたりするための場所であり、百科事典の記事ではありません。ただし、公開の場ですので、許諾されていない文章の転載はご遠慮ください。

登録利用者は自分用の利用者サンドボックスを作成できます（サンドボックスを作成する、解説）。

ヘテロジニアス・マルチコア (英: heterogeneous multi-core) は、異種の命令セットアーキテクチャ（instruction set architecture: ISA）を持つマイクロプロセッサが統合されたCPU、すなわち異種混在のマルチコアを表す用語。ヘテロジニアス・コンピューティングのために利用される。

対して、同種のコアを複数実装するプロセッサをホモジニアス・マルチコア (英: homogeneous multi-core) と言う。

ARMアーキテクチャのbig.LITTLEのように、ISAは同じであるものの、異なる動作クロック周波数を持つCPUコアからなる構成を、異種CPUトポロジー (heterogeneous CPU topologies) と呼ぶ^[1]。これは主に電力効率の向上を目的としている。異種CPUトポロジーは技術的には非対称型マルチプロセッシング（英語版） (asymmetric multi-processing: AMP) の特徴も含んでいるが、完全なメモリ共有型であり、どちらかというと対称型マルチプロセッシング (symmetric multi-processing: SMP) に近い。異種CPUトポロジーの場合、基本的に各プロセッサコアへのタスクの割り当て（スケジューリング）はオペレーティングシステムが管理し、アプリケーションソフトウェアからは個々のコアの違いを意識することはなく、透過的である^[2]。

概要

初期のヘテロジニアス・マルチコアの製品として、PlayStation 3等に搭載されたCell Broadband Engineがあり、後のAMDによるCPUとGPUの統合製品（後にAPUと呼ばれる）とともに、マルチコア・アーキテクチャの方向性を決定付けたとされている^[3]。

例として、Cellプロセッサは、オペレーティングシステム (OS) によるシステム全体の制御等の汎用処理に特化した1個のコントロールポイントプロセッサ「Power Processor Element (PPE)」と、グラフィックスや音声のストリーム等のデータ処理に特化した複数のデータポイントプロセッサ「Synergistic Processor Element (SPE)」で構成される^[4]^[5]。これらのシンプルな異種コアを組み合わせることで、シングルスレッド性能とマルチスレッド性能を両立するアプローチをとっている^[5]。

モバイルデバイス環境ではCPUとGPUを統合したSoCが使われており、ヘテロジニアス・マルチコア環境とも言えるシステムが一般的となっているが、CPUとGPUのメモリ空間が統合されているわけではない。

ヘテロジニアス・マルチコア環境では、プロセッサごとのメモリ空間が異なっていたり、各プロセッサのISAやメモリアクセス特性に応じた固有のプログラミングが必要であったりと、利用上の難しさが問題視されており、そのような問題を解決するための方法も模索されている^[6]。

ヘテロジニアス・マルチコアの目的

ヘテロジニアス・マルチコアCPUは、それまで主流だった同じアーキテクチャのCPUコアを1チップに複数搭載するホモジニアス・マルチコアCPUとは大きく異なり、1つのチップに異なる種類のアーキテクチャのCPUコアを搭載したCPUをいう。

その目的は、2つの方向性があると考えられている。

ヘテロジニアス・マルチコアならば、シングルスレッド性能を維持しつつ、マルチスレッド性能を大幅に高めることができる。
それぞれのCPUコアを最適化することによって、ホモジニアス・マルチコアCPUでは実現できない高効率処理を実現できる。

1の手法はソフトウェア指向型の設計であり、2の手法はハードウェア指向型の設計でもある。なお、この2つを組み合わせたヘテロジニアス・マルチコアという方法も十分に考えられる。

ヘテロジニアス・マルチコア出現の背景

CPU単体性能の限界

ヘテロジニアス・マルチコアが浮上して来た背景には、CPU単体での性能向上が行き詰まってきたという事情がある。

2000年頃までのCPU設計は、シングルコアで性能を引き上げるために、次の2点に注力してきた。

動作周波数の向上
IPC（Instructions Per Cycle: 1サイクルで実行できる命令数）の向上

この2つの目標を達成するために、動作周波数の向上にはパイプラインを細分化する事で対応し、IPCの向上には動的に命令レベルの並列性 (Instruction-Level Parallelism, ILP) を高めるアウト・オブ・オーダー実行とそれに付随するさまざまな高速化技術を導入することで対応してきた^[7]。

しかし、この2点を追求することによってシングルコアCPUは複雑化と高コスト化を招いた。2000年頃からCPUでは、ダイサイズ（半導体本体の面積）を2倍の大きさに増やしても、増やした面積の平方根分（約1.4倍）しか性能が向上しなくなり、「性能/消費電力」と「性能/ダイサイズ」が悪化した非効率なものとなった^[7]。

IPCの引き上げに限界が見えて来たことで、性能を引き上げるため動作周波数の向上をめざしたが、ここにも限界があった。消費電力の増大である。それでも、製造プロセスが微細化されることで相殺されると考えられていた。しかしプロセスの微細化はリーク電流という問題を生み出し、消費電力と発熱が増大したことで動作周波数の引き上げは困難となった^[8]。

シングルコアからマルチコアへ

そこで、CPU業界はマルチスレッド性能の向上へと向かい始めた^[9]。「CPUチップのマルチコア化によって「スレッドレベル並列性 (Thread-Level Parallelism, TLP)」を向上させれば、これまでより効率よくCPU性能を上げることができるようになるのではないだろうか?」と考えた。

しかし、ここにも問題があった。インテルやAMDはシングルスレッド性能も維持するために、従来のシングルコアCPUのコアを再利用してマルチコアを実現した。そのために、消費電力やダイエリア当たりの性能は依然としてそれほど向上しなかった。対称型デュアルコアCPUが登場した当時の半導体製造プロセスである90nmでは、2way以上のマルチコア化が難しく、対称型クアッドコアCPUが主流になるのは45nmプロセスに移行してからのことになった^[10]。その後もプロセスの微細化は進んでいるが、22nm世代でもコンシューマー向けのボリュームゾーンではデュアルコアやクアッドコアが主流のままとなっている。

この問題の解決策は単純な発想で、CPUコアをシンプルにすれば回避できる。複雑な制御機構を省けば、ずっと小さなCPUコアでそこそこの性能を維持することが可能である。つまり、「ポラックの法則」を逆に考えるなら、CPUコアのダイエリアを1/4にしても性能は1/2にしか落ちないことになる。シンプルなCPUコアなら多数搭載できるから、マルチスレッド性能はずっと高くなるだろう。簡単に「ダイエリア消費量ならびに電力効率のいいマルチコアCPUを作ることができるのではないか?」ということだった。

マルチコアからヘテロジニアス・マルチコアへ

しかし、この手法ですらトレードオフがある。

シンプルコアにした場合には、シングルスレッドの性能が落ちる。
OSなどに多いコントロール系タスクと、マルチメディア系のストリーム処理、それぞれを高速に処理できるシンプルコアを作ることは難しい。

そこで出てきたアイディアが、ヘテロジニアス型のマルチコアである。

例としては、

シングルスレッド性能を追求した大型CPUコアと、シンプルな構造にして効率を追求した小型CPUコアを組み合わせれば、シングルスレッド性能を維持しつつ、高並列のマルチスレッド処理が実現可能。
CPUコアを、コントロール系CPUコアとデータ系CPUコアに切り分ける。コントロール系のCPUコアはOSを走らせることと制御のみを担当し、データ処理系のCPUコアはストリーム・データなどのリアルタイムデータ処理を担当する。

それぞれのアプローチに違いはあるが、異なるアーキテクチャを組み合わせることで、これまでの限界を乗り越えようとしている。

ヘテロジニアス・マルチコアの実例

big.LITTLE

スマートフォンなど電力効率を求められる場面において、ヘテロジニアス・マルチコアにより電力効率を向上させたのがarmのbig.LITTLEである。負荷が小さいときにはLITTLEコアで処理を行うことで消費電力を削減し、負荷が大きいときにはbigコアで処理を行い、最大性能を引き上げている。LITTLEコアは絶対性能を追い求めなくてよいため、ダイの面積が小さくなり、電力効率・面積効率共に向上する。

当初はタスクマイグレーションモデルといい、負荷が小さいときにはLITTLEコアのみを、負荷が大きいときにはbigコアのみを動作させ、これを切り替える手法が取られていた。2014年頃からは、MPモデルが取られ、OS側でコアにタスクの割り当てを行い、bigコアとLITTLEコアを同時に動作させることが可能となった。

Hybrid Technology

Windows on Arm発表以来、armはその効率の良さからノートパソコン市場において存在感を増していた。これに対抗してintelは効率のよいx86プロセッサを開発した。Lakefiledである。元々intelには絶対性能重視のCore系列のコアと電力効率重視のAtom系列のコアがあった。これを組み合わせることで特にスタンバイ時の電力を大きく削減することができた。

当初は単に電力効率の向上を掲げて登場したHybrid Technologyだが、絶対性能を求めるデスクトップ市場においても応用された。

将来のCPU

既存のCPUアーキテクチャーの限界を超えようとする試みは続けられている。それぞれの用途目的に特化したCPUであるとか、特化したCPUを組み合わせて新しいコアを作り出そうとする試みは続けられると推測される。それだけでなく、「非同期設計CPU」、「再構成可能 (Reconfigurable) CPU」、さらには「光電子工学」や「光量子技術」を生かしたヘテロジニアス型のマルチコアCPUも将来実現するかも知れない。組み合わせにより既存の限界を超えるという手法は、システム工学における重要な手法でもある。

脚注

^ Energy Aware Scheduling — The Linux Kernel documentation
^ Apple Siliconに求められるもの　Apple Silicon Macのチップはどのような構成になるか：Apple Siliconがやってくる（2/4 ページ） - ITmedia NEWS
^ 後藤弘茂 (2006年8月18日). “■後藤弘茂のWeekly海外ニュース■ 決定的となったヘテロジニアスマルチコアへの潮流”. PC Watch / Impress Watch Corporation. 2013年12月7日閲覧。
^ “Sony Japan | 技術情報｜高性能プロセッサ “Cell（セル）” の半導体技術”. Sony Corporation. 2013年12月7日閲覧。
^ ^a ^b 後藤弘茂 (2005年2月18日). “■後藤弘茂のWeekly海外ニュース■ CPUの新しいトレンド「ヘテロジニアスマルチコア」”. PC Watch / Impress Watch Corporation. 2013年12月7日閲覧。
^ 見えてきたAMDの次世代GPUアーキテクチャ。なぜAMDはVLIWを捨てるのか
^ ^a ^b 株式会社インプレス (2024年1月30日). “【大原雄介の半導体業界こぼれ話】 CPU処理性能向上の歴史というか、苦闘の歴史”. PC Watch. 2024年12月15日閲覧。
^ ASCII. “AMDのプレッシャーに苦しんだNetburst世代のインテル (3/5)”. ASCII.jp. 2024年12月15日閲覧。
^ ASCII. “CPU性能向上のトレンドマルチコアの理論と限界 (4/4)”. ASCII.jp. 2024年12月15日閲覧。
^ クアッドコアCPUの魅力に迫る | 最新・クアッドコア自作の極意 | DOS/V POWER REPORT

概要