コンテンツにスキップ

英文维基 | 中文维基 | 日文维基 | 草榴社区

利用者:YasuakiH/Weibull distribution

英語版 Weibull distribution の 2021-10-03T15:36:27(UTC)版を翻訳のため転記



ワイブル分布

[編集]
ワイブル (2パラメータ)
確率密度関数
Probability distribution function
累積分布関数
Cumulative distribution function
母数 尺度
形状
確率密度関数
累積分布関数
期待値
中央値
最頻値
分散
歪度
尖度 (see text)
エントロピー
モーメント母関数
特性関数
テンプレートを表示

確率論統計学では、ワイブル分布(ワイブルぶんぷ、: weibull distribution[ˈwbʊl]とは、連続確率分布の一つである。これは、1951年に詳細に記述したスウェーデンの数学者ワロッディ・ワイブルにちなんで名付けられたが、最初にフレシェ(1927年)によって明らかにされ、Rosin & Rammler (1933)粒度分布の記述に初めて適用した。

定義

[編集]

標準的なパラメータ化

[編集]

ワイブル確率変数確率密度関数は次のようになる[1]

ここで、k > 0 は分布の形状パラメータ英語版、λ > 0 は尺度パラメータ英語版である。その相補累積分布関数伸張指数関数英語版である。ワイブル分布は、他の多くの確率分布と関連しており、特に、指数分布k = 1)とレイリー分布k = 2 および [2])の間を補完する。

X が「故障するまでの時間(time-to-failure)」である場合、ワイブル分布は、故障率が時間の累乗に比例する分布を与える。形状パラメータ k は、その累乗に1を加えたものであり、このパラメータは次のように直接解釈することができる[3]

  • の場合、故障率が時間とともに減少することを示している(リンディ効果英語版の場合のように、ワイブル分布ではなくパレート分布に対応する[4])。これは「初期不良率」(infant mortality)が大きい場合や、不良品が早期に故障して、不良品が母集団から除去されるにつれて故障率が時間の経過とともに低下する場合に起こる。普及学の文脈では、これは否定的な口コミを意味する。そのハザード関数は、採用者の割合の単調に減少する関数である。
  • の場合、故障率が時間的に一定であることを示す。 これは、ランダムな外部事象が死亡または故障の原因になっていることを示唆している可能性がある。そのワイブル分布は指数分布になる。
  • の場合、故障率が時間とともに増加することを示す。これは、「経年劣化」のプロセスがある場合、または時間が経つにつれて故障しやすくなる部品がある場合に起こる。普及学の文脈では、これは肯定的な口コミを意味する。そのハザード関数は、採用者の割合が単調に増加する関数である。この関数は、最初は凸型で、次に に変曲点がある凹型となる。

材料科学の分野では、強度分布の形状パラメータ k は、ワイブル係数 (英語版として知られている。普及学の文脈では、ワイブル分布は「純粋な」模倣/不採用モデルである。

代替パラメータ化

[編集]

医療統計学計量経済学の分野では、異なるパラメータ化を採用することが多くある[5][6]。形状パラメータ k は上記と同じであるが、尺度パラメータは である。この場合、 x ≥ 0 に対して、確率密度関数は、

累積分布関数は、

ハザード関数は、

平均は、

となる。また、3番目のパラメータ化も可能である[7][8]。形状パラメータ k は標準的な場合と同じで、尺度パラメータ λ は比率パラメータ β = 1/λ に置き換えられている。そして、 x ≥ 0 に対して、確率密度関数は、

累積分布関数は、

ハザード関数は、

となる。

3つのパラメータ化すべてにおいて、ハザードは k < 1では減少し、k > 1 では増加し、k = 1 では一定であり、この場合、ワイブル分布は指数分布に減少する。

特性

[編集]

密度関数

[編集]

ワイブル分布の密度関数の形状は、k の値によって大きく変化する。0 < k < 1の場合、密度関数は x が高から 0 へと近づくにつれて ∞ になり、忠実に減少する。k = 1 の場合、密度関数は x が高から0へと近づくにつれて 1/λ に近づき、忠実に減少する。k > 1の場合、密度関数は x が高から0に近づくにつれて0になり、最頻値までは増加し、最頻値以降は減少する。この密度関数は、0 < k < 1 の場合は x = 0 で無限の負の勾配を持ち、1 < k < 2 の場合は x = 0 で無限の正の勾配を持ち、k > 2 の場合は x = 0 で無の勾配を持つ。k = 1 の場合、密度は x = 0 で有限の負の勾配を持つ。k = 2 の場合、密度は x = 0 で有限の正の勾配を持つ。k が無限大になると、ワイブル分布は x = λ を中心とするディラックのデルタ分布に収束する。さらに、歪度と変動係数は形状パラメータにのみ依存する。ワイブル分布の一般化は、タイプIIIの極値分布英語版である。

累積分布関数

[編集]

ワイブル分布の累積分布関数は、x ≥ 0の場合は

x < 0 の場合は、F(x; k; λ) = 0 となる。

x = λ の場合、すべての k の値に対して F(x; k; λ) = 1 − e−1 ≈ 0.632 を満たす。逆に、F(x; k; λ) = 0.632 のとき、x ≈ λ となる。

ワイブル分布の分位点関数(逆累積分布)は、0 ≤ p < 1 の場合、

となる。

故障率 h(またはハザード関数)は、

で与えられる。

平均故障間隔 MTBFは、

である。

モーメント

[編集]

ワイブル分布の確率変数対数モーメント母関数は、

で与えられ[9]、ここに Γガンマ関数である。同様に、log X特性関数は、

で与えられる。

特に、Xn 番目の素モーメントは、

で与えられる。

ワイブル確率変数平均分散は、

で表される。

歪度は、

で与えられ、平均は μ 、標準偏差は σ で表される。

過剰尖度は、

で与えられ、ここで である。また、過剰尖度は、

と書くこともできる。

モーメント母関数

[編集]

X 自身のモーメント母関数には、さまざまな式がある。冪級数として、素モーメントはすでにわかっているので、

となる。

あるいは、積分

を直接扱うこともできる。パラメータ k を、k = p/q (ここで pq は整数)と表わされる有理数と仮定すれば、この積分は解析的に評価することができる[10]t を −t に置き換えると、

が得られる。ここで GマイヤーのG関数英語版である。

特性関数は、Muraleedharan et al. (2007)によっても得られている。また、Muraleedharan & Soares (2014)は、3パラメータワイブル分布の特性関数とモーメント母関数を直接法で導出した。

シャノンエントロピー

[編集]

情報エントロピーは、

で与えられ、ここで オイラー・マスケローニ定数である。ワイブル分布は、xk の固定期待値が λk に等しく、ln(xk) の固定期待値が ln(λk) −  に等しい非負の実確率変量の最大エントロピー分布英語版である。

パラメータ推定

[編集]

最大尤度

[編集]

が与えられた時の パラメータの最尤推定量は、

である。

の最尤推定量は、次の式

k の解となる[11]

この式は を陰伏的に定義しているので、一般には数値的に を解く必要がある。 が、 個以上のサンプルからなるデータセットからの 個の最大の観測サンプルである場合、に対する パラメータの最尤推定量は

となる[11]

また、この条件では、 の最尤推定値は、

となる[要出典]

繰り返すが、これは陰関数であるため、一般的には数値的な手段で を解かなければならない。

ワイブルプロット

[編集]

ワイブル分布のデータへの適合性は、ワイブルプロットを用いて視覚的に評価することができる[12]。ワイブルプロットは、データの経験累積分布関数英語版 の、Q-Qプロットのような特別な軸上へのプロットである。その軸は、 である。この変数変換の理由は、累積分布関数を線形化できるためである。

このように、標準的な直線の形になることがわかる。したがって、データがワイブル分布であれば、ワイブルプロットでは直線が期待できる。データから経験分布関数を得るには、さまざまな方法がある。1つの方法は、 を使って各点の垂直座標を求めるもので、ここに はデータ点のランク、 はデータ点の数である[13]

線形回帰を使用して、適合度を数値的に評価し、ワイブル分布のパラメータを推定することもできる。勾配から形状パラメータ を直接知ることができ、尺度パラメータ も推測できる。

カルバック・ライブラー情報量

[編集]
[14]

応用

[編集]

ワイブル分布を用いた応用を以下に示す。[要出典]

CumFreqを用いて累積ワイブル分布を1日の最大降水量に適合させた。分布フィット英語版も参照。[15]
石油生産量の時系列データのフィッティング曲線。[16]
  • 電気工学において、電気システムで発生する過電圧を表す。
  • 情報検索において、ウェブページの滞在時間をモデル化する[18]
  • 技術的変化の予測(Sharif-Islamモデルとも呼ばれる)[19]
  • 水文学では、ワイブル分布は、1日の最大降雨量や河川流量などの極端な事象に適用される。
  • 粉砕、製粉破砕操作によって発生する粒子のサイズを記述するのに、2パラメータのワイブル分布が使用される。これらの用途では、ロジン・ラムラ-分布として知られる[要出典]。この文脈では、対数正規分布よりも微細粒子を予測し、一般的には狭い粒度分布に対して最も正確である。累積分布関数の解釈としては、 より小さい直径を持つ粒子の質量分率英語版である[20]。ここに は平均粒子径、 は粒子径の広がりの尺度である。
  • ランダムな点群(理想気体中の粒子の位置など)を記述する場合:特定の粒子から距離xにある最近接粒子を見つける確率は、 で、粒子の密度に等しい を持つワイブル分布で与えられる[21]

関連する分布

[編集]
  • 変形されたワイブル分布(または3パラメータワイブル)には、追加パラメータが含まれている[9] の場合は確率密度関数

    で、 の場合は となり、ここに 形状パラメータ英語版尺度パラメータ英語版 は分布の位置パラメータ英語版である。 の値は、通常のワイブルプロセスが始まる前の初期故障のない時間を設定する。 の場合は、2パラメータ分布になる。
  • ワイブル分布は、確率変数

    が強度1の標準指数分布であるような確率変数 の分布として特徴づけることができる[9]
  • このことは、ワイブル分布が一様分布の観点からも特徴づけられることを意味している。 上の一様分布である場合、確率変数 はパラメータ を持つワイブル分布となる。なお、ここでの は先ほどの と同等である。これにより、ワイブル分布をシミュレートするための数値計算スキームが簡単に実装できる。
  • ワイブル分布は、 の時の強度 指数分布と、 の時のモード レイリー分布の間を補完するものである。
  • ワイブル分布は、一般化極値分布の特殊なケースある。 この点について、この分布は、1927年にモーリス・フレシェによって初めて特定された[23]。この研究にちなんで名付けられた密接に関係するフレシェ分布は、確率密度関数

    を持つ。
  • それぞれが異なるワイブル分布を持つ複数の確率変数の最小値として定義される確率変数の分布をポリ・ワイブル分布英語版という。
  • ワイブル分布は、Rosin & Rammler (1933) によって粒子径分布を記述するために初めて適用された。それは、選鉱工程において、粉砕 (en:英語版プロセスにおける粒径分布英語版を記述するために広く使用されている。この文脈では、累積分布は

    で与えられ、ここに、
    • は粒子径、
    • は粒子径分布の80パーセンタイル、
    • は分布の広がりを表すパラメータである。
  • の場合、 (指数分布)
  • kの値が同じ場合、ガンマ分布は同様の形状を採るが、ワイブル分布はより広幅な分布になる。
  • 安定計数分布英語版の観点から、 は Lévy の安定性パラメータと見なすことができる。ワイブル分布は、カーネル密度の積分に分解することができる。このカーネルは、ラプラス分布 またはレイリー分布 のいずれかで、

    ここに、 は安定計数分布、安定vol分布英語版である。

関連項目

[編集]

脚注

[編集]
  1. ^ Papoulis, Athanasios Papoulis; Pillai, S. Unnikrishna (2002). Probability, Random Variables, and Stochastic Processes (4th ed.). Boston: McGraw-Hill. ISBN 0-07-366011-6 
  2. ^ Rayleigh Distribution – MATLAB & Simulink – MathWorks Australia”. www.mathworks.com.au. 2021年11月7日閲覧。
  3. ^ Jiang, R.; Murthy, D.N.P. (2011). “A study of Weibull shape parameter: Properties and significance”. Reliability Engineering & System Safety 96 (12): 1619–26. doi:10.1016/j.ress.2011.09.003. 
  4. ^ Eliazar, Iddo (November 2017). “Lindy's Law”. Physica A: Statistical Mechanics and Its Applications 486: 797–805. Bibcode2017PhyA..486..797E. doi:10.1016/j.physa.2017.05.077. 
  5. ^ Collett, David (2015). Modelling survival data in medical research (3rd ed.). Boca Raton: Chapman and Hall / CRC. ISBN 978-1439856789 
  6. ^ Cameron, A. C.; Trivedi, P. K. (2005). Microeconometrics : methods and applications. p. 584. ISBN 978-0-521-84805-3 
  7. ^ Kalbfleisch, J. D.; Prentice, R. L. (2002). The statistical analysis of failure time data (2nd ed.). Hoboken, N.J.: J. Wiley. ISBN 978-0-471-36357-6. OCLC 50124320 
  8. ^ Therneau, T. (2020年). “A Package for Survival Analysis in R.”. Template:Cite webの呼び出しエラー:引数 accessdate は必須です。
  9. ^ a b c Johnson, Kotz & Balakrishnan 1994
  10. ^ See (Cheng, Tellambura & Beaulieu 2004) for the case when k is an integer, and (Sagias & Karagiannidis 2005) for the rational case.
  11. ^ a b Sornette, D. (2004). Critical Phenomena in Natural Science: Chaos, Fractals, Self-organization, and Disorder .
  12. ^ 1.3.3.30. Weibull Plot”. www.itl.nist.gov. Template:Cite webの呼び出しエラー:引数 accessdate は必須です。
  13. ^ Wayne Nelson (2004) Applied Life Data Analysis. Wiley-Blackwell ISBN 0-471-64462-5
  14. ^ Bauckhage, Christian (2013). "Computing the Kullback-Leibler Divergence between two Weibull Distributions". arXiv:1310.3713 [cs.IT]。
  15. ^ CumFreq, Distribution fitting of probability, free software, cumulative frequency”. Template:Cite webの呼び出しエラー:引数 accessdate は必須です。
  16. ^ a b Lee, Se Yoon; Mallick, Bani (2021). “Bayesian Hierarchical Modeling: Application Towards Production Results in the Eagle Ford Shale of South Texas”. Sankhya B. doi:10.1007/s13571-020-00245-8. 
  17. ^ Wind Speed Distribution Weibull – REUK.co.uk”. www.reuk.co.uk. 2021年11月7日閲覧。
  18. ^ Liu, Chao; White, Ryen W.; Dumais, Susan (2010-07-19). Understanding web browsing behaviors through Weibull analysis of dwell time. ACM. pp. 379–386. doi:10.1145/1835449.1835513. ISBN 9781450301534 
  19. ^ Sharif, M.Nawaz; Islam, M.Nazrul (1980). “The Weibull distribution as a general model for forecasting technological change”. Technological Forecasting and Social Change 18 (3): 247–56. doi:10.1016/0040-1625(80)90026-8. 
  20. ^ Austin, L. G.; Klimpel, R. R.; Luckie, P. T. (1984). Process Engineering of Size Reduction. Hoboken, NJ: Guinn Printing Inc.. ISBN 0-89520-421-5 
  21. ^ Chandrashekar, S. (1943). “Stochastic Problems in Physics and Astronomy”. Reviews of Modern Physics 15 (1): 86. 
  22. ^ System evolution and reliability of systems”. Sysev (Belgium) (2010年1月1日). Template:Cite webの呼び出しエラー:引数 accessdate は必須です。
  23. ^ Montgomery, Douglas (2012-06-19). Introduction to statistical quality control. [S.l.]: John Wiley. p. 95. ISBN 9781118146811 
  24. ^ Chatfield, C.; Goodhardt, G.J. (1973). “A Consumer Purchasing Model with Erlang Interpurchase Times”. Journal of the American Statistical Association 68 (344): 828–835. doi:10.1080/01621459.1973.10481432. 

参考書目

[編集]

外部リンク

[編集]

Template:ProbDistributions