確率と分布関数(3)(確率変数の関数,特殊分布(離散))
確率と分布関数の続きです。
Xを(Ω,F,P)の確率変数とするとき,
∀y∈Rに対して{ω∈Ω|g(X(ω))≦y}∈Fが成り立つならば,
Y≡g(X)もまた確率変数です。
この確率変数Xの関数Yの確率変数としての分布を考えます。
[例4-1]:X,Y=g(X)の分布関数,および確率密度関数を,
それぞれFX(X),FY(Y),およびfX(X),fY(Y)とします。
Xの分布:FX(X),fX(X)は既知とします。
(ⅰ)g(x)=ax+b (a≠0)の場合
分布関数はFY(Y)=P(Y≦y)=P(g(X)≦y)
=P(aX+b≦y)です。
そこで,これは
a>0 ならFY(Y)=P(X≦(y-b)/a)=FX((y-b)/a),
a<0 ならFY(Y)=P(X≧(y-b)/a)=1-FX((y-b)/a)
です。
密度関数は,fY(Y)=dFY/dYより,
a>0 ならfY(Y)=(1/a)fX((y-b)/a),
a<0ならfY(Y)=-(1/a)fX((y-b)/a) です。
(ⅱ)g(x)=x2,つまりY=X2の場合
FY(Y)=P(X2≦y)より,分布関数は,
y≧0 なら,
FY(Y)=P(-y1/2≦X2≦y1/2)=FX(y1/2)-Fx(-y1/2),
y<0 なら,FY(Y)=0
となります。
そこで,密度関数は,
y≧0 ならfY(Y)=dFY/dY=(1/2){fX(y1/2)+fX(-y1/2)},
y<0 ならfY(Y)=0 です。
[定理4-2]:gが連続関数で狭義単調関数,かつ微分可能なら,
確率変数Y=g(X)の確率密度関数(p.d.f.):fY(y)は,
fY(y)=fX(g-1(y))|dg-1(y)/dy|で与えられる。
(y=g(x)が狭義単調関数というのは,逆関数の値x=g-1(y)が確定しない停留点が存在しないという意味です。) (証明略)
※(注);先の例のg(x)=x2,つまりY=X2の場合:
gは狭義単調関数ではないので,狭義単調な区間への場合分けが必要でした。※
[例4-3]:Xのp.d.f.fX(x)が,
0<x<∞に対してはfX(x)=[1/{2n/2Γ(n/2)}xn/2-1exp(-x/2),
それ以外のxに対してはfX(x)=0 ,つまり,自由度nのχ2分布(カイ二乗分布)の場合,
Y=X1/2のp.d.fを求めます。
y=g(x)=x1/2の逆関数はx=g-1(y)=y2です。
そしてdg-1(y)/dy=dx/dy=2yです。
これをfy(y)=fx(g-1(y))|dg-1(y)/dy|に代入すると,
0<y<∞に対してfY(y)=[2/{2n/2Γ(n/2)}yn-1exp(-y2/2),
それ以外のyに対してfY(y)=0 です。
[例4-4]:Xのp/d.f.がfX(x)=(2π)-1/2exp(-x2/2) ])(-∞<x<∞) (標準正規分布:N[0,1])の場合を考えます。
(ⅰ)Y=X2のp.d.f.を求める。
y>0 のときy=g(x)=x2とおけば,
xの区間(-∞,0)に対応するものはx=g-1(y)=-y1/2で,
dx/dy=-(1/2)y-1/2,
xの区間(0,∞)に対応するものはx=g-1(y)=y1/2で,
dx/dy=(1/2)y-1/2 です。
これらは共にy~y+dyに対応する密度関数に寄与するため,両者の寄与の和を取れば,
fY(y)=(2π)-1/2{|-(1/2)y-1/2|exp(-y/2)+|(1/2)y-1/2|exp(-y/2)}=(2π)-1/2y-1/2exp(-y/2)となります。
y<0 のときはfY(y)=0 です。
また,y=0 のときは,分布関数がFY(0)=P(X2≦0)=0,
そして,Δy>0 ならFY(Δy)=FY(Δy)=FX((Δy)1/2)-FX(-(Δy)1/2)=(2π)-1/2exp(-Δy/2)(Δy)1/2 ~(2π)-1/2(Δy)1/2
です。
そこで,FY(y)のy=0 における右導関数が存在して,
それは[dFY/dy]y=+0=limΔy→+0{(2π)-1/2(Δy)-1/2}Δy=+0→ ∞
です。一方,左導関数はゼロです。
結局,fY(y)=(2π)-1/2y-1/2exp(-y/2)(y>0),
fY(y)=0 (y<0)です。
y=0 では,分布関数はゼロで有限ですが密度関数は定義できません。
これは後述する自由度が1のχ2分布です。
(ⅱ)Y=|X|のp.d.f.
y≧0 のとき,y=g(x)=|x|とおけば,
xの区間(-∞,0)に対応するものは
x=g-1(y)=-yで,dx/dy=-1,
xの区間[0,∞)に対応するものは
x=g-1(y)=yで,dx/dy=1 です。
y ~y+dyに対応する密度関数への寄与の和として,
fY(y)=2(2π)-1/2exp(-y2/2)を得ます。
y<0 のときはfY(y)=0 です。
[定理4-6]:同時確率密度関数(j.p.d.f.)としてf(x1,x2,..,xn)を持つn個の連続確率変数X1,X2,..,Xn.の関数:Y1,Y2,..,Yn
;Yj=gj(X1,X2,..,Xn)(j=1,2,..,n)
のj.p.d.f.は,
fY1..Yn (y1,..,yn)=f(g1-1(y1,..,yn),..,gn-1(y1,..,yn))|J|によって与えられる。
ここでJは次式で定義されるJacobian(ヤコービアン):J≡det{∂(g1-1,g2-1,..,gn-1)/∂(y1,y2,..,yn)}である。
※(注):定理はn個の連続確率変数X1,X2,..,Xnのr≦n個の関数Y1,Y2,..,Yr;Yj=gj(X1,X2,..,Xn)(j=1,2,..,r)のr=nの場合のみに対するものです。
しかし,もしもr<nに対してのj.p.d.f.を求めたい場合には残りの(n-r)個の変数としてYr+1=Xr+1,..Yn=Xnを加えてn個の変数にすれば上記の定理を使えます。
すなわち,密度関数はf(x1,x2,..,xn)dx1dx2..dxn=f(x1,x2,..,xn){∂(x1,x2,..,xn)/∂(y1,y2-1,..,yn)}dy2..dyn=fY1..Yn(y1,..,yn)dy1dy2..dynを満たします。
r<nでyr+1=xr+1,..yn=xnなら,
f(x1,x2,..,xn)dx1dx2..dxn=f(x1,x2,..,xn){∂(x1,x2,..,xn)/∂(y1,y2-1,..,yn)}dy1dy2..dyrdxr+1..dxnより,
f(x1,x2,..,xn)dx1dx2..dxr=f(x1,x2,..,xn){∂(x1,x2,..,xn)/∂(y1,y2,..,yn)}dy1dy2..dyr=fY1..Yr(y1,..,yr)dy1dy2..dyr です。
このとき,det{∂(x1,x2,..,xn)/∂(y1,y2,..,yn)}
=det{∂(x1,x2,..,xr)/∂(y1,y2,..,yr)}となります。
(注終わり)※
[例4-7]:Xのpd.f.が.偶関数fX(x)のとき,Y=aX2(a>0)のp.d.f.fY(y)を求めます。
まず,∀x∈Rについてy=ax2≧0 なので,
y<0のときfY(y)=0です。
そして,y>0 のとき,
fX(x)=yとなるxはx=±(y/a)1/2,dx/dy=±(1/2)(ay)-1/2 (複号同順)です。
x1=-(y/a)1/2,x2=(y/a)1/2とおけば,
dx1=-(ay)-1/2dy,dx2=(ay)-1/2dyより,
fY(y)dy=fX(-(y/a)1/2)dx1+fX((y/a)1/2)dx2=(ay)-1/2{fX(-(y/a)1/2)+fX((y/a)1/2)}dyを得ます。
ここではfX(x)が偶関数なのでfY(y)=2(ay)-1/2{fX((y/a)1/2)}となります。
[例4-8]:確率変数:X,Yのj.p.d.f.が,
f(x,y)=1 (0<x<1,0<y<1),f(x,y)=0 (それ以外)のとき,
Z=X+Yのp.d.f.fZ(z)を求めます。
そのために,まずZ=X+Y,T=Yとおいて,
ZとTのj.p.d.f.fZT(z,t)を求めます。
z=x+y,t=yと置けば,x=z-t,y=tです。
Jacobianは|J|=det{∂(x,y)/∂(z,t)}=1ですから,
fzT(z,t)=f(z-t,t)です。
そこで,fZT(z,t)=1 (0<t<1,0<z-t<1),
fzT(z,t)=0 (それ以外)です。
そこで,fZ(z)=∫-∞∞fZT(z,t)dtにより,周辺分布関数としてfZ(z)を得ます。
結局,z≦0,またはz≧2ならfZ(z)=0,
0≦z≦1ならfZ(z)=∫0zdt=zです。
また,1≦z≦2ならfZ(z)=∫z-11dt=2-zです。
さて,よく使われる実用的な特殊確率分布を考察します。
まず,代表的な離散分布を挙げます。
[定義5-1]:超幾何分布(hypergeometric distribution)
px=P(X=x)=(kCx・N-kCn-x)/(NCn)(x=0,1,2,..,min(k,n))なる式で与えられる確率分布を超幾何分布といい,H(x,n,k,N)で表わす。
これは,例えば中にk個の赤球と(N-k)個の白球の合計N個の球が入っている1つの壷からn個の球を取り出すとき,その中に含まれる赤球の個数を表わす確率変数をXとすれば,X=xである確率pxが従う確率分布です。
[定理5-2]:超幾何分布:H(x,n,k,N)=(kCx・N-kCn-x)/(NCn)においてp≡k/Nが一定の要素(例えばN個の製品の中にk個の不良品がある不良品率:pが一定)では,N→ ∞とすればH(x,n,k,N) → nCxpx(1-p)n-x (2項分布)となる。
(証明) H(x,n,k,N)=[k!/{x!(k-x)!}][(N-k)!/{(n-x)!(N-k-n+x)![n!(N-n)!/N!]=nCx[k(k-1)..(k-x+1)][(N-k)(N-k-1)..(N-k-n+x+1)]/[N(N-1)..(N-n+1)]です。
右辺はnCx[p(p-1/N)..(p-(x-1)/N)][(1-p)(1-p-1/N)..(1-p-(n-x+1)/N)/[(1-1/N)..(1-(n-1)/N)] → nCxpx(1-p)n-x as N → ∞です。(証明終わり)
※ラプラス(Laplace)の近似式:ラプラスによれば離散的な2項分布(以下参照)はΣx=ab nCxpx(1-p)n-x ≒(2π)-1/2∫exp(-y2/2)dyと連続的な正規分布で近似できます。
ただし右辺のyの積分区間は,(a-np-1/2)/{np(1-p)}1/2≦y≦(b-np+1/2)/{np(1-p)}1/2で与えられます。※
[定義5-3]:2項分布(binomal distribution)
確率変数X'の取り得る値が 0,または 1のみであるとき,p=P(X'=1),q=P(X'=0)=1-pとする。
分布関数はF(x)=0 (x<0),q (0<x<1),1 (x≧1)である。これをベルヌーイ(Beronoulli)分布という。
例えば硬貨を投げて裏が出ると0,表が出ると1を対応させる関数として上述の確率変数X'を得る。このように硬貨をn回投げるようなゲームの試行をベルヌーイ試行,または独立試行という。
正確なベルヌ-イ試行は次の3つの条件を持つ試行と定義される。
(1) 各試行の結果として排反事象T,Hのどちらか1つが起きる。
(2) 各試行の結果は他のそれと独立である。
(3) 各試行でHが起こる確率pは試行ごとに変わらない。
この試行列の標本空間Ωの元:ωはω=(ω1,ω2,..,ωn);ωj=H or T (j=1,2,..,n)で表現される。
このnベルヌーイ試行でHが出る回数をXと表わせば,px≡P(X=x)=nCxpxqn-x (x=0,1,2,..,n;q=1-p)である。これを2項分布といいb(x,n,p)と書く。
これは,確率変数X=X1'+X2'+..Xn'の分布になっている。
[定理5-4]:np=λ(一定)の下でn→ ∞(p→ 0)とすれば2項分布b(x,n,p)はP(x;λ)=λxexp(-λ)/x! (=ポアソン(Poisson)分布)に近づく。
(証明) b(x,n,p)=nCxpxqn-x=n(n-1)..(nーx+1)(λ/n)x(1-λ/n)n-x/x!=λx(1-1/n)..{1-(x-1)/n}(1-λ/n)n(1-λ/n)-x/x!→λxexp(-λ)/x!(n→∞)です。(証明終わり)
※(注):Σx=0d nCxpx(1-p)n-x≒exp(-np)Σx=0d(np)x/x!をポアソン近似といいます。
そこで,ポアソン分布:P(x;λ)はHが出る回数の期待値がλ(=(np)n→∞=一定)の条件下で,Hの出る回数がxである確率を表わすと考えられます。(注終わり)※
[定理5-5]:時刻t=1,2,3,..においてそれぞれ1個の硬貨を投げる。各時刻tで表(H),裏(T)の出る確率をそれぞれp,q(p+q=1)とし,確率変数YtはH,Tに応じて1,-1を取るとする。すなわち,P(Yt=1)=p,P(Yt=-1)=qである。
このとき,X(j)≡Σt=0jYt=と置けばX(0)=0 の下でP(X(j)=n)=jC(j+n)/2p(j+n)/2q(j-n)/2 (-j≦n≦j)が成り立つ。ただし,(j+n)が偶数のnしか実現不可能である。
(証明)このケースでは標本はω=(HHTHHHTHT..)のような形を取ります。X(j) ≡Σt=0jYt=nのとき,表の回数をk,裏の回数をlとするとk+l=j,k-l=nです。
そこで,2k=j+n,2l=j-nより(j+n),(j-n)は偶数でk=(j+n)/2,l=(j-n)/2です。そこで,P(X(j)=n)=jCkpkql=jC(j+n)/2p(j+n)/2q(j-n)/2を得ます。(証明終わり)
※この種の現象をランダム・ウォーク(酔歩)といいます。
つまり,酔っ払いが原点Oから右に一歩(+1)か左に一歩(-1)のどちらかの蛇行を繰り返してj歩だけ歩いた後,Oから右にn歩の位置にいる確率が上記のP(X(j)=n)です。(2006年9/14のブログ記事「酔歩(ランダム・ウォーク」を参照)※
さて,改めてポアソン分布を次のように定義します。
[定義5-6]:P(X=j)=λjexp(-λ)/j!(j=0,1,2,..)のときXはパラメータλのポアソン分布を持つという。
※(注):ポアソン過程によるポアソン分布の導出
ある事象の発生が時間的にランダムであるとき,一定時間内にそれが発生する個数を考察します。
すなわち,次のような3つの仮定を満たす過程を考察します。これをポアソン過程といいます。
(A1):任意の時間内の発生個数はそれと重ならない時間内の発生個数と独立である。
(A2):微小時間をΔtとするとP({Δt内には発生しない})=1-λΔt+o((Δt)2),P({Δt内に1個発生する})=λΔt+o((Δt)2),P({Δt内に2個以上発生する})=o((Δt)2)である。(λ>0)
(A3):時間間隔(0,t)内にj個が発生する確率をPj(t)で表わすとき,j≧0 の全てのjに関してPj(t)はtに関して微分可能である。
以上の仮定の下で,Pj(t)=(λt)jexp(-λt)/j! (j=0,1,2,..)が成り立つ
(証明) 0≦t1<t2に対して(t1,t2)内にj個が発生するという事象をNj(t1,t2)で表わします。
積事象を積で表現すれば,N0(0,t+Δt)=N0(0,t)N0(t,t+Δt),j≧1ならNj(0,t+Δt)=Nj(0,t)N0(t,t+Δt)+Nj-1(0,t)N1(t,t+Δt)+Σk=2jNj-k(0,t)Nk(t,t+Δt)です。
そこで,Pj(t)=P[Nj(0,t)]ですから確率としては,P0(t+Δt)=P0(t){1-λΔt+o((Δt)2)},かつPj(t+Δt)=Pj(t){1-λΔt+o(((Δt)2))+Pj-1(t){λΔt+o((Δt)2)}+o((Δt)2)(j≧1)です。
Δt→ 0 とするとdP0/dt=-λP0(t),dPj/dt=-λPj(t)+λPj-1(t))(j≧1)なる連立1階常微分方程式系を得ます。
これらを初期条件P0(0)=1,Pj(0)=0(j≧1)の下で解けばPj(t)が得られるわけです。
解くべき方程式は定係数の線形方程式で係数が二重対角の三角行列の簡単なものです。計算の詳細は省いて結果だけ書くとPj(t)=(λt)jexp(-λt)/j! !(j=0,1,2,..)です。(証明終わり)(注終わり)※
[定義5-7]:幾何分布(geometrical distribution)
無限回のベルヌーイ試行列において初めて裏(T)が出るまでの試行回数(最後の裏の出た回も含める)をXと表わせばj≧1に対してpj≡P(X=j)=pj-1q (p=P(H),q=1-p=P(T))が成り立つ。
この離散的確率分布{pj;j=1,2,..}を幾何分布,またはパスカル(Pascal)分布という。
[定理5-8]:幾何分布{pj;j≧1}を持つ確率変数Xは関係式:P(X=n+j|X>n)=pj (j≧1) (=マルコフ(Markov)性)を満たす。
(証明)P(X=n+j|X>n)=P(X=n+jかつX>n)/P(X>n)=P(X=n+j)/P(X>n)=pn+j/(Σk=n+1∞pk)=pn+j-1q/(Σk=n+1∞pk-1q)=pj-1q=pjです。(証明終わり)
[定理5-9]:確率分布pj≡P(X=j)が等式:pj=P(X=n+j|X>n) (n,j=1,2,..)を満たすなら,pj=pj-1q (j=1,2,..,q=1-p)である。
(証明)pj=pj+n/(Σk=n+1∞pk)においてn=1と置けばpj=pj+1/(Σk=2∞pk)です。故にpj+1/pj=Σk=2∞pk=1-p1です。
そこで,p≡1-p1と置くとpj+1=ppj(等比数列)です。
したがってpj=pj-1p1=(1-p)pj-1=pj-1q (j=1,2,..,q=1-p)を得ます。(証明終わり)
今日はここで終わります。
次回は特殊な連続確率分布の例に入ります。(つづく)
参考文献:藤沢武久 著「新編 確率・統計」(日本理工出版会)
PS:カナダの冬季オリンピックスピード・スケート500m。。地元のジェレミー・ウォザースプーンは泣いていました。残念でした。
かつてのアメリカのダン・ジャンセン(最後1000mでは勝ったが。。)を思い出してしまいました。。。
ノルディック複合で当時無敵だった荻原健司も五輪の個人では勝てなかったなあ。。。
国母くんのことについての私の感想。。中学,高校の髪の毛の色や服装の検査じゃあるまいし。。オリンピックにも校則のようなものがあるんかい?。。ファッションなんて変遷するもんです。
| 固定リンク
「309. 確率・統計」カテゴリの記事
- 確率と分布関数(補遺)(2010.04.03)
- 確率と分布関数(11)(区間推定)(終了)(2010.03.24)
- 確率と分布関数(10)(線形回帰の基礎)(2010.03.23)
- 確率と分布関数(9)(推定2)(2010.03.18)
- 確率と分布関数(8)(推定1)(2010.03.12)
この記事へのコメントは終了しました。
コメント
ども,明男さん。。TOSHIです。
テンション低くて怠け者でコレしかないのにヤル気が起きずほぼ一ヶ月遅れた遅レスです。すみません。
スポーツ大会ではその競技自体にはルールがあってもその外での地球人同士のつきあいでは表向きはマナーというか相手への思いやり程度があれば主役の選手としては十分で以下は自由でしょう。
実力ないのに品格云々言う資格なし。下品も品のうちとかね。ルールは嫌いだ。。
また酔っ払いオヤジですみません。。
TOSHI
投稿: TOSHI | 2010年3月15日 (月) 01時21分
こんにちは、明男です。
国母選手へのJOCやマスコミの風当たりは的外れな上に情けない気がします。これが日本人らしさ、と言うなら、なんて度量の狭い粋でない国民性かとため息が出ます。オリンピックに出るのは何にしても類まれな才能と努力をしてきていることは疑いないのに、尊敬と尊重の微塵も感じられないし、自分の価値観に貶めようとする行為ですね。昔の日本人はそうではなかったと思います。今はやりの前田慶次のようなかぶき者や河原者に対しても寛容だったはずですから、明治以降かもしれませんが。
「あー、辛気臭い」。母ならこう言うと思いますね。
投稿: 明男 | 2010年2月18日 (木) 23時22分