コンテンツにスキップ

英文维基 | 中文维基 | 日文维基 | 草榴社区

デミング回帰

出典: フリー百科事典『ウィキペディア(Wikipedia)』
ヨーク回帰から転送)
デミング回帰: 赤線はx,y両方向への誤差を示す。典型的な最小二乗方ではy軸と平行な方向への誤差しか考えないことと対照的である。上図では誤差は垂直に測られており、xyの分散が等しい場合にあたる。

統計学において、デミング回帰(デミングかいき、: Deming regression)とは、W・エドワーズ・デミングにちなんで名付けられた2次元データセットへの直線あてはめ英語版を行う変数誤差モデル英語版である。単純線形回帰英語版とはことなり、x軸およびy軸両方の観測誤差を考慮するモデルで、総最小自乗法英語版の特殊ケースと考えることができる。

デミング回帰は2つの変数の誤差が独立正規分布し、かつその分散の比δが既知の場合の最尤推定である[1]。実用上、この比は関連するデータソースから推定されることもあるが、デミング回帰の手続きにおいてこの比の誤差については考慮しない。

デミング回帰の難易度は単純線形回帰と比較してほとんど上がらない。臨床化学において用いられる統計ソフトウェアパッケージのほとんどはデミング回帰を行うことができる。

δ = 1の場合のこのモデルはAdcock (1878)が導入した。任意のδへの一般化はKummell (1879)によりなされた。しかし、このアイデアは50年以上見過され、Koopmans (1936)が再導入したのちDeming (1943)によりさらに広められた。臨床化学および関連分野においてデミングの著書は特に有名となり、同分野ではこの手法はデミング回帰と呼ばれるようになった[2]

定義

[編集]

回帰直線上の「真の」値(yi*, xi*)の計測値(yi, xi)

のように互いに独立な誤差εおよびηを持ち、分散の比

が既知であるものとする。

実用上、変数xおよびyの分散は未知であることが多く、δの推定は難しい。もしxおよびyの測定方法が同じであればそれらの分散は等しく、δ = 1となる尤度が高い。

このとき、データ点に「もっともよくあてはまる」直線

を求めたい。

デミング回帰では、次の重みつき二乗残差SSRが最小となる直線を求める[3]

完全な導出はJensen (2007)を参照のこと。

[編集]

この問題の解は2次標本モーメントにより表わすことができる。すなわち、まず次の統計量を計算する(和はi = 1 ... nについてとるものとする)。

すると、モデルパラメータの最小二乗推定値は以下のように計算できる[4]

直交回帰

[編集]

誤差分散が等しい、すなわちδ = 1の場合には、デミング回帰は直交回帰と一致する。直交回帰ではデータ点から回帰直線への直交距離の二乗和を最小化する。この場合、各データ点を複素平面上の点zj = xj + iyjと表わし、データ点の幾何中心(すなわちデータ点の横軸および縦軸上の位置の平均を取った点)と各データ点との差の二乗和をと書くことにすると[5]

  • S = 0のとき、幾何中心を通るすべての直線が最適直交回帰直線である。
  • S ≠ 0のとき、直交回帰直線は幾何中心を通り原点からSへのベクトルに平行となる。

直交回帰の三角関数表現は1913年にCoolidgeが発表した[6]

応用

[編集]

平面上に、共線でない3つの点があるとき、これらの点を頂点とする三角形は一意のシュタイナーの内接楕円をもち、この楕円は三角形の各辺にその中点で接する。この楕円の長軸は3つの点の直交回帰直線と一致する[7]。2つのレポーター合成生物学回路英語版のふるまいの観測値をデミング回帰にかけることで細胞の内因ノイズ英語版 を定量化することも行われる[8]

人間が散布図に回帰直線を書くとき、その直線は通常の最小二乗回帰直線よりも直交回帰直線に近い[9]

ヨーク回帰

[編集]

ヨーク回帰は、デミング回帰を拡張してxおよびyの誤差が互いに独立でなく相関を持つ場合を扱えるようにしたものである[10]

関連項目

[編集]

出典

[編集]
  1. ^ Linnet 1993.
  2. ^ Cornbleet & Gochman 1979.
  3. ^ Fuller 1987, Ch. 1.3.3.
  4. ^ Glaister 2001.
  5. ^ Minda & Phelps 2008, Theorem 2.3.
  6. ^ Coolidge 1913.
  7. ^ Minda & Phelps 2008, Corollary 2.4.
  8. ^ Quarton 2020.
  9. ^ Ciccione, Lorenzo; Dehaene, Stanislas (August 2021). “Can humans perform mental regression on a graph? Accuracy and bias in the perception of scatterplots”. Cognitive Psychology 128: 101406. doi:10.1016/j.cogpsych.2021.101406. 
  10. ^ York, Derek; Evensen, Norman M.; Martı́nez, Margarita López; De Basabe Delgado, Jonás (2004-02-12). “Unified equations for the slope, intercept, and standard errors of the best straight line”. American Journal of Physics 72 (3): 367–375. doi:10.1119/1.1632486. ISSN 0002-9505. https://pubs.aip.org/aapt/ajp/article-abstract/72/3/367/1042020/Unified-equations-for-the-slope-intercept-and?redirectedFrom=fulltext. 

参照文献

[編集]