スパースモデリング

スパースモデリング（英語: Sparse modeling、スパース sparse とは「すかすか」、「少ない」を意味する）または疎性モデリングとは、少ない情報から全体像を復元しようとする科学的モデリング手法である^[1]。これは、スパース表現あるいはスパース近似という、連立一次方程式のスパース解を扱う理論に基づいている。スパースモデリング技術は、スパース解を見つけて応用するもので、画像処理、信号処理、機械学習、医用画像処理などで広く利用されている。

概要

圧縮センシングの一技法で膨大なビッグデータを解析して大量のデータに埋もれて見えにくくなってしまう有為な情報を抽出したり、法則性を導き出したり、断片的なデータを補完して実状に忠実に再現する^[2]。地球科学、MRIや天文学を含む多くの分野で高分解能化に使用される^[3]^[4]^[5]^[6]。

医用画像に関しての応用は、2002年頃に筑波大学の工藤博幸らのグループによる先駆的研究があり、2007年のカリフォルニア大学バークレー校准教授のMichael Lustigらのグループによる研究を契機として急速に広がった^[3]。

用途

スパースモデリングは、スパース表現（sparse representation）の考え方やアルゴリズムを用いて、信号処理、画像処理、機械学習、医用画像処理、配列処理（英語版）、データマイニングなど、さまざまな分野で広く使用されている。

代表的な用途を次に示す。

医用画像 - MRIやX線CTでの解像度の向上^[7]
地球科学 - 地下構造の推定
天文学 - 解像度の向上
生命科学 - 核磁気共鳴分光法での計測、データ解析、立体構造計算の高速・高精度化^[8]

このように、スパース性に着想を得たモデルの使用は、幅広い用途で最先端の結果をもたらした^[9]^[10]^[11]。最近の研究では、スパース表現モデリングと深層学習の間には密接な関係があることが示唆されている^[12]。

スパース表現

上述した用途の多くでは、関心がある未知の信号は、特定の「辞書」から得たいくつかの基本要素（「アトム」という）のスパースな（疎な）組み合わせとしてモデル化され、これが問題の正則化として用いられている。これらの問題では通常、所与のデータにモデルを最もよく一致させるために辞書 $D$ を適合させることを目的とするスパース辞書学習（英語版）（スパースコーディングともいう）のメカニズムが伴う。

スパース分解

ノイズのない観測

線型方程式系 $x=D\alpha$ を考える。ここで、 $D$ は劣決定（英語版） $m\times p$ 行列 $(m<p)$ であり、 $x\in \mathbb {R} ^{m},\alpha \in \mathbb {R} ^{p}$ である。ここで、行列 $D$ （通常、最大階数と仮定される）は「辞書」と呼ばれ、 $x$ は関心のある信号である。基本的なスパース表現問題は、 $x=D\alpha$ を満たす最もスパースな表現 $\alpha$ を求めることと定義される。 $D$ の列決定性により、この線形システムは一般的に無限に多くの可能な解が認められ、これらの中から非ゼロの数が最も少ないものを探す。形式的に言えば、

\min _{\alpha \in \mathbb {R} ^{p}}\|\alpha \|_{0}{\text{ subject to }}x=D\alpha

を解く。ここで $\|\alpha \|_{0}=\#\{i:\alpha _{i}\neq 0,\,i=1,\ldots ,p\}$ は $\ell _{0}$ 半ノルムで、 $\alpha$ の非ゼロ成分の数を数える。この問題は、組合せ最適化におけるNP完全な部分集合選択問題への還元を伴うNP困難であることが知られている。

$\alpha$ のスパース性とは、その中で少数の成分（ $k\ll m<p$ ）だけが非ゼロであることを意味する。このようなスパース分解（sparse decomposition）を行う潜在的な動機は、 $x$ を $D$ のできるだけ少ない列（アトムとも呼ばれる）の線形結合として、可能な限り単純に説明したいという欲求にある。このように、信号 $x$ は、 $D$ から取り出したいくつかの基本要素（アトム）から構成される分子と見なすことができる。

上記の問題は確かにNP困難であるが、近似アルゴリズムを用いてその解を見つけることができる。そのような選択肢の一つは、 $\ell _{0}$ の代わりに $\ell _{1}$ ノルムを用いて問題を凸緩和 (en:英語版) することで得られる。ここで、 $\|\alpha \|_{1}$ は $\alpha$ 内の要素の絶対値を単純に合計したものである。これは基底追跡（英語版）（basis pursuit、BP）アルゴリズムとして知られており、任意の線型計画法ソルバーを用いて処理することができる。もう一つの近似法は、マッチング追跡（英語版）（matching pursuit、MP）のような貪欲法で、非ゼロの位置を一度に一つずつ見つけてゆくものである。

驚くべきことに、 $D$ に関する穏やかな条件（Spark (数学)（英語版）、相互コヒーレンス（英語版）または制限付等長性（英語版））と、解のスパース性のレベル $k$ の下で、スパース表現問題は一意の解を持つことが示され、BPとMPはそれを完全に見つけることが保証されている^[13]^[14]^[15]。

ノイズの多い観測

多くの場合、観測された信号 $x$ はノイズを含んでいる。等式制約を緩和し、データフィッティング項に $\ell _{2}$ ノルムを課すことで、スパース分解問題は、

\min _{\alpha \in \mathbb {R} ^{p}}\|\alpha \|_{0}{\text{ subject to }}\|x-D\alpha \|_{2}^{2}\leq \epsilon ^{2}

あるいはラグランジュ形式で、

\min _{\alpha \in \mathbb {R} ^{p}}\lambda \|\alpha \|_{0}+{\frac {1}{2}}\|x-D\alpha \|_{2}^{2}

となる。ここで、 $\lambda$ は $\epsilon$ を置換する。

ノイズのない場合と同様に、これらの2つの問題は一般にNP困難であるが、追跡アルゴリズムを用いて近似することができる。より具体的には、 $\ell _{0}$ を $\ell _{1}$ ノルムに変更すると、

\min _{\alpha \in \mathbb {R} ^{p}}\lambda \|\alpha \|_{1}+{\frac {1}{2}}\|x-D\alpha \|_{2}^{2}

が得られ、これは基底追跡ノイズ除去（英語版）として知られている。同様に、マッチング追跡（英語版）も上記問題の解を近似するために使用することができ、誤差しきい値に達するまで、非ゼロの位置を1つずつ見つけていく。ここでも、BPとMPは、 $D$ の特性と解 $k$ のカーディナリティに応じて、ほぼ最適な解を導くことが理論的に保証されている^[16]^[17]^[18]。

もう一つの興味深い理論的結果は、 $D$ がユニタリ行列である場合に言及され、この仮定の下では、上述の問題（ $\ell _{0}$ または $\ell _{1}$ を持つ）は、非線形縮退の形で閉形式解を認める^[16]。

バリエーション

基本的なスパース近似問題にはいくつかのバリエーションがある。

構造化スパース：この問題の元のバージョンでは、辞書に含まれる任意のアトムを選択することができる。構造化（ブロック）スパースモデルでは、個々のアトムを選択する代わりに、アトムのグループを選択する。これらのグループは、互いに重複していたり、大きさが異なる場合がある。その目的は、このブロック構造を強制しながら、スパースになるように $x$ を表現することである^[19]。

協調的（共同）スパースコーディング：この問題の元のバージョンは、単一の信号 $x$ に対して定義されている。協調的（共同）スパースコーディングモデルでは、信号の集合が利用可能であり、それぞれが $D$ からの（ほぼ）同じアトムのセットから生成すると考えられている。この場合、追求タスクの目的は、データを最もよく表す一連のスパース表現を、それらが同じ（または近くの）サポートを共有するように強制しながら再現することである^[20]。

その他の構造：より広義には、スパース近似問題は、 $\alpha$ の非ゼロ位置のパターンに特定の望ましい構造を強制しながら計算することができる。広く研究されている興味深い2つの事例は、ツリーベースの構造と、より一般的にはボルツマン分布サポートである^[21]。

アルゴリズム

上述のように、スパース表現問題

\min _{\alpha \in \mathbb {R} ^{p}}\|\alpha \|_{0}{\text{ subject to }}\|x-D\alpha \|_{2}^{2}\leq \epsilon ^{2}.

を解くために開発されたさまざまな近似（追跡（pursuit）ともいう）アルゴリズムがある。

これらの主な手法のいくつかを以下に示す。

マッチング追跡（英語版）は、上記の問題を近似的に解くための貪欲反復アルゴリズムである。これは、 $\alpha$ 内の非ゼロの位置を一度に1つずつ徐々に見つけてゆく方法である。基本的な考え方は、各ステップで、現在の残余（ $x$ に初期化）と最も相関のある $D$ の列（アトム）を見つけ、新しいアトムとその係数を考慮に入れて残余を更新することである。マッチング追跡では、同じアトムが複数回選択される場合がある。
直交マッチング追跡は、マッチング追跡と非常によく似ているて、大きな違いが一つある。アルゴリズムの各ステップで、すべての非ゼロ係数が最小二乗法によって更新される。その結果、残余はすでに選択されたアトムと直交しているため、1つのアトムを複数回選択することはできない。
段階的貪欲法：上記のアルゴリズムに改良を加えたバージョンが、貪欲に動作するアルゴリズムで、2つの重要な機能が追加されている。(i) 一度に非ゼロのグループを追加する機能（ラウンドごとに1つの非ゼロではなく）と、(ii) 各ラウンドでいくつかのアトムをサポートから刈り込むプルーニングステップを含める。このアプローチの代表的なものに、部分空間追跡アルゴリズムとCoSaMPがある^[22]。
基底追跡（英語版）法は、 $\ell _{0}$ を $\ell _{1}$ ノルムに置き換えることで、問題の凸緩和版を解く。これは新しい目的を定義するだけであり、望ましい解を得るためにどのようなアルゴリズムを使用するかという問題は残されていることに注意すること。このようなアルゴリズムとして一般的に考えられているのは、IRLS（英語版）、LARS（英語版）、および反復ソフトシュリンク法である^[23]。
スパース分解問題を解く方法としては、他にも、ホモトピー法、座標降下法（英語版）、反復ハードしきい値法、上述の反復ソフトシュリンク法に関連する一次近接勾配法（英語版）、ダンツィヒ・セレクタ（Dantzig selector）がある。

脚注

^ “情報科学の名探偵！魔法の数式スパースモデリング”. NHK. 2016年9月19日閲覧。
^ 福島孝治、大森敏明、藤堂眞治. “物理モデリングとスパースモデリングの融合による自然法則の抽出”. 2016年9月19日閲覧。
^ ^a ^b 大関真之. “スカスカのデータから知見を見出す救世主？--「スパースモデリング」とは何か - (page 4)”. ASAHI INTERACTIVE, Inc.. 2016年9月19日閲覧。
^ 駒井武、岡本敦、桑谷立、土屋範芳. “スパースモデリングに基づくデータ駆動解析による地球プロセスモデルの構築”. 2016年9月19日閲覧。
^ 田中利幸、池田思朗、大関真之. “圧縮センシングにもとづくスパースモデリングへのアプローチ”. 2016年9月19日閲覧。
^ 本間希樹、植村誠、加藤太一、野上大作. “スパースモデリングを用いた超巨大ブラックホールの直接撮像”. 2016年9月19日閲覧。
^ “スパースモデリングを用いた新しい医用MRI画像の創生”. 2016年9月19日閲覧。
^ 木川隆則、池谷鉄兵、葛西卓磨. “スパースモデリングによるNMR計測・解析の高速高精度化”. 2016年9月19日閲覧。
^ Baraniuk, R.G. Candes, E. Elad, M. and Ma, Y. (2010). “Applications of sparse representation and compressive sensing”. Proceedings of the IEEE 98 (6): 906–909. doi:10.1109/JPROC.2010.2047424.
^ Elad, M. Figueiredo, M.A.T., and Ma, Y. (2010). “On the role of sparse and redundant representations in image processing”. Proceedings of the IEEE 98 (6): 972–982. doi:10.1109/JPROC.2009.2037655. オリジナルの2018-01-17時点におけるアーカイブ。.
^ Plumbley, M.D. Blumensath, T. Daudet, L. Gribonval, R. and Davies, M.E. (2010). “Sparse representations in audio and music: From coding to source separation”. Proceedings of the IEEE 98 (6): 995–1005. doi:10.1109/JPROC.2009.2030345.
^ Papyan, V. Romano, Y. and Elad, M. (2017). “Convolutional Neural Networks Analyzed via Convolutional Sparse Coding”. Journal of Machine Learning Research 18 (83): 1–52. arXiv:1607.08194. Bibcode: 2016arXiv160708194P.
^ Donoho, D.L. and Elad, M. (2003). “Optimally sparse representation in general (nonorthogonal) dictionaries via L1 minimization”. Proceedings of the National Academy of Sciences 100 (5): 2197–2202. Bibcode: 2003PNAS..100.2197D. doi:10.1073/pnas.0437847100. PMC 153464. PMID 16576749.
^ Tropp, J.A. (2004). “Greed is good: Algorithmic results for sparse approximation”. IEEE Transactions on Information Theory 50 (10): 2231–2242. doi:10.1109/TIT.2004.834793.
^ Donoho, D.L. (2006). “For most large underdetermined systems of linear equations the minimal l1-norm solution is also the sparsest solution”. Communications on Pure and Applied Mathematics 56 (6): 797–829. doi:10.1002/cpa.20132.
^ ^a ^b Elad, M. (2010). Sparse and Redundant Representations: From Theory to Applications in Signal and Image Processing. Springer. doi:10.1007/978-1-4419-7011-4. ISBN 978-1441970107
^ Donoho, D.L., Elad, M. and Templyakov, V. (2006). “Stable recovery of sparse overcomplete representations in the presence of noise”. IEEE Transactions on Information Theory 52 (1): 6–18. doi:10.1109/TIT.2005.860430.
^ Tropp, J.A. (2006). “Just relax: Convex programming methods for identifying sparse signals in noise”. IEEE Transactions on Information Theory 52 (3): 1030–1051. doi:10.1109/TIT.2005.864420.
^ Eldar, Y.C, Kuppinger, P. and Bolcskei, H. (2009). “Block-sparse signals: Uncertainty relations and efficient recovery”. IEEE Transactions on Signal Processing 58 (6): 3042–3054. arXiv:0906.3173. Bibcode: 2010ITSP...58.3042E. doi:10.1109/TSP.2010.2044837.
^ Tropp, J.A., Gilbert, A.C. and Strauss, M.J. (2006). “Algorithms for simultaneous sparse approximation. Part I: Greedy pursuit”. Signal Processing 86 (3): 572–588. doi:10.1016/j.sigpro.2005.05.030.
^ Peleg, T. Eldar, Y.C. and Elad, M. (2012). “Exploiting Statistical Dependencies in Sparse Representations for Signal Recovery”. IEEE Transactions on Signal Processing 60 (5): 2286–2303. arXiv:1010.5734. Bibcode: 2012ITSP...60.2286P. doi:10.1109/TSP.2012.2188520.
^ Needell, D. and Tropp, J.A. (2009). “CoSaMP: Iterative signal recovery from incomplete and inaccurate samples”. Applied and Computational Harmonic Analysis 26 (3): 301–321. arXiv:0803.2392. doi:10.1016/j.acha.2008.07.002.
^ Zibulevsky, M. and Elad, M. (2010). “L1-L2 optimization in signal and image processing”. IEEE Signal Processing Magazine 27 (3): 76–88. Bibcode: 2010ISPM...27...76Z. doi:10.1109/MSP.2010.936023.

参考

岡田真人, 「ハイパフォマンスコンピューティングとスパースモデリング」『ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集』 2014巻 2013年 p.23-24。
永田賢二, 田仲顕至, 「スパースモデリングとデータ駆動科学を実現する計算機アーキテクチャ」『システム／制御／情報』 61巻 4号 2017年 p.152-157, doi:10.11509/isciesci.61.4_152。
新部祐輔、吳湘筠, 渡辺一帆ほか, 「スパースモデリングを目的とした平行座標系表示の拡張」『情報処理学会第』 76 回全国大会 3 (2014)、頁8。
池田思朗, 「計測技術におけるスパースモデリングの応用について」『Medical Imaging Technology』 32巻 3号 2014年 p.176-181, 日本医用画像工学会, doi:10.11409/mit.32.176。
Irina Rish、Genady Grabarnik："Sparse Modeling: Theory, Algorithms, and Applications"、CRC Press、ISBN 978-1439828694 (2014年11月17日)。
岡田真人, 23pAJ-5 スパースモデリングと物性物理学」『日本物理学会講演概要集』 2015年 70.1巻, セッションID 23pAJ-5, p.3115-3116, 日本物理学会, doi:10.11316/jpsgaiyo.70.1.0_3115。
大関真之, 「今日からできるスパースモデリング」京都大学大学院
池田思朗, 本間希樹, 植村誠, 「スパースモデリングと天文学(<特集>スパースモデリング: 情報処理の新しい流れ)」『応用数理』 25巻 1号 2015年 p.15-19, 日本応用数理学会, doi:10.11540/bjsiam.25.1_15。
田中利幸, 「圧縮センシング (特集スパースモデリングの発展: 原理から応用まで)--(全体概要と基本理論)」『電子情報通信学会誌』 99.5 (2016)、p.381-385, NAID 40020842497。
Michael Elad 著、玉木徹訳『スパースモデリング: l1/l0ノルム最小化の基礎理論と画像処理への応用』共立出版、2016年4月。ISBN 9784320123946。
永原正章：「スパースモデリング- 基礎から動的システムへの応用」、コロナ社、ISBN 978-4339032222（2017年10月6日）。
日高昇治：「スパースモデリングって何だ？データ構造を解き明かす先端技法」、カットシステム、ISBN 978-4877834265 (2017年10月25日)。
Irina Rish, Genady Ya. Grabarnik:「スパースモデリング理論、アルゴリズム、応用」、ジャムハウス、ISBN 978-4906768738（2019年12月27日）。

外部リンク

『スパースモデリング』 - コトバンク

[1] “情報科学の名探偵！魔法の数式スパースモデリング”. NHK. 2016年9月19日閲覧。

[2] 福島孝治、大森敏明、藤堂眞治. “物理モデリングとスパースモデリングの融合による自然法則の抽出”. 2016年9月19日閲覧。

[zdnet-3] 大関真之. “スカスカのデータから知見を見出す救世主？--「スパースモデリング」とは何か - (page 4)”. ASAHI INTERACTIVE, Inc.. 2016年9月19日閲覧。

[4] 駒井武、岡本敦、桑谷立、土屋範芳. “スパースモデリングに基づくデータ駆動解析による地球プロセスモデルの構築”. 2016年9月19日閲覧。

[5] 田中利幸、池田思朗、大関真之. “圧縮センシングにもとづくスパースモデリングへのアプローチ”. 2016年9月19日閲覧。

[6] 本間希樹、植村誠、加藤太一、野上大作. “スパースモデリングを用いた超巨大ブラックホールの直接撮像”. 2016年9月19日閲覧。

[7] “スパースモデリングを用いた新しい医用MRI画像の創生”. 2016年9月19日閲覧。

[8] 木川隆則、池谷鉄兵、葛西卓磨. “スパースモデリングによるNMR計測・解析の高速高精度化”. 2016年9月19日閲覧。

[survey1-9] Baraniuk, R.G. Candes, E. Elad, M. and Ma, Y. (2010). “Applications of sparse representation and compressive sensing”. Proceedings of the IEEE 98 (6): 906–909. doi:10.1109/JPROC.2010.2047424.

[survey2-10] Elad, M. Figueiredo, M.A.T., and Ma, Y. (2010). “On the role of sparse and redundant representations in image processing”. Proceedings of the IEEE 98 (6): 972–982. doi:10.1109/JPROC.2009.2037655. オリジナルの2018-01-17時点におけるアーカイブ。.

[survey3-11] Plumbley, M.D. Blumensath, T. Daudet, L. Gribonval, R. and Davies, M.E. (2010). “Sparse representations in audio and music: From coding to source separation”. Proceedings of the IEEE 98 (6): 995–1005. doi:10.1109/JPROC.2009.2030345.

[deeplearning-12] Papyan, V. Romano, Y. and Elad, M. (2017). “Convolutional Neural Networks Analyzed via Convolutional Sparse Coding”. Journal of Machine Learning Research 18 (83): 1–52. arXiv:1607.08194. Bibcode: 2016arXiv160708194P.

[donohoelad2003-13] Donoho, D.L. and Elad, M. (2003). “Optimally sparse representation in general (nonorthogonal) dictionaries via L1 minimization”. Proceedings of the National Academy of Sciences 100 (5): 2197–2202. Bibcode: 2003PNAS..100.2197D. doi:10.1073/pnas.0437847100. PMC 153464. PMID 16576749.

[Tropp2004-14] Tropp, J.A. (2004). “Greed is good: Algorithmic results for sparse approximation”. IEEE Transactions on Information Theory 50 (10): 2231–2242. doi:10.1109/TIT.2004.834793.

[donoho2006most-15] Donoho, D.L. (2006). “For most large underdetermined systems of linear equations the minimal l1-norm solution is also the sparsest solution”. Communications on Pure and Applied Mathematics 56 (6): 797–829. doi:10.1002/cpa.20132.

[Elad2010-16] Elad, M. (2010). Sparse and Redundant Representations: From Theory to Applications in Signal and Image Processing. Springer. doi:10.1007/978-1-4419-7011-4. ISBN 978-1441970107

[DonohoEladTem2006-17] Donoho, D.L., Elad, M. and Templyakov, V. (2006). “Stable recovery of sparse overcomplete representations in the presence of noise”. IEEE Transactions on Information Theory 52 (1): 6–18. doi:10.1109/TIT.2005.860430.

[Tropp2006-18] Tropp, J.A. (2006). “Just relax: Convex programming methods for identifying sparse signals in noise”. IEEE Transactions on Information Theory 52 (3): 1030–1051. doi:10.1109/TIT.2005.864420.

[19] Eldar, Y.C, Kuppinger, P. and Bolcskei, H. (2009). “Block-sparse signals: Uncertainty relations and efficient recovery”. IEEE Transactions on Signal Processing 58 (6): 3042–3054. arXiv:0906.3173. Bibcode: 2010ITSP...58.3042E. doi:10.1109/TSP.2010.2044837.

[20] Tropp, J.A., Gilbert, A.C. and Strauss, M.J. (2006). “Algorithms for simultaneous sparse approximation. Part I: Greedy pursuit”. Signal Processing 86 (3): 572–588. doi:10.1016/j.sigpro.2005.05.030.

[21] Peleg, T. Eldar, Y.C. and Elad, M. (2012). “Exploiting Statistical Dependencies in Sparse Representations for Signal Recovery”. IEEE Transactions on Signal Processing 60 (5): 2286–2303. arXiv:1010.5734. Bibcode: 2012ITSP...60.2286P. doi:10.1109/TSP.2012.2188520.

[22] Needell, D. and Tropp, J.A. (2009). “CoSaMP: Iterative signal recovery from incomplete and inaccurate samples”. Applied and Computational Harmonic Analysis 26 (3): 301–321. arXiv:0803.2392. doi:10.1016/j.acha.2008.07.002.

[23] Zibulevsky, M. and Elad, M. (2010). “L1-L2 optimization in signal and image processing”. IEEE Signal Processing Magazine 27 (3): 76–88. Bibcode: 2010ISPM...27...76Z. doi:10.1109/MSP.2010.936023.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

表話編歴数値線形代数
キー概念	浮動小数点数数値的安定性
問題	線型方程式系行列の分解行列の乗法 (アルゴリズム（英語版）) 行列の分割（英語版）疎問題
ハードウェア	CPUキャッシュ TLB Cache-obliviousアルゴリズム（英語版） SIMD マルチプロセッシング
ソフトウェア	MATLAB BLAS LAPACK 専門のライブラリ多目的ソフトウェア
カテゴリ

概要

用途