« 2010年1月 | トップページ | 2010年3月 »

2010年2月

2010年2月27日 (土)

遅延選択実験(タイムマシン?)(5)

 γ-崩壊の理論について書くための準備として2月6日に「電磁力学と解析力学」という記事を書き,次いで本題の記事を書いている最中に,昔の会社の先輩から確率・統計と重回帰の関連の質問を受けたので2月12日から今まで「確率と分布関数」シリーズを書いていました。(まだ途中です。)

 しかし,途中で「遅延選択実験」の続きを早く書けという旨のリクエストがありましたので,取り合えず,前に書くと約束していたウォルボーン他による"量子消しゴム"の実験についての論文:

S.P.Walborn,M.O.Terra Cunba,S.Padua and C.H.Monken「Double-slit quantum eraser(二重スリット量子消しゴム)」Phys.Rev.A,Vol.65(3)(2002),pp033818-1-033818-6 の翻訳をします。 

記事のページ数の関係もあって,今日載せるのはほぼ直訳のただの機械的翻訳だけですが次回「遅延選択実験(6)」で内容の詳細な解釈等を述べる予定です。

 

以下翻訳文です

 

Abstract: 干渉を生み出すヤング(Young)の二重スリットを実際に用いた量子消しゴムの実験の報告です。

 

 この実験はScully,Englert,Waltherによって提案された実験[Nature(London)351,111(1991)]の光学的アナロジーとして考察されました。

エンタングルしたペア光子のうちの1つが離れた検知領域に干渉パターンを創り出すような適当な大きさのヤング(Young)の二重スリットに入射します。

 

子がどちらの経路を通ったかをチェックするマーカーとして作用するように軸が直交するような向きに取った1/4-波長板を各スリットの前に設置します。

 

1/4-波長板は干渉する光子の偏光をマークします。それ故,干渉パターンを破壊します。その後,干渉を回復するために他方のエンタングルした光子の偏光を測定します。

 

さらに"遅延消去"環境の下で実験を行ないます。(了) ※

.Introduction(序)

波動と粒子の二重性,相補性原理の発現は,干渉計中の粒子の挙動について多くの疑問をもたらしてきました。

 

長い間に,どちらの経路を通ったか?の情報を得ることと干渉縞が見えなくなることは相補的な事柄であることが知られてきています。

如何なる干渉計でも経路の区別を可能にすることは干渉性の破壊(干渉縞が見えなくなること)を引き起こします。

いずれの経路を通ったか?という情報を得ることと干渉効果の発現が両立できないという性質は,種々の著者により不等式を用いて量化されています。[文献1-6]。

 

不確定性原理は,元々こうした経路測定のために干渉縞が消失することに責任があるメカニズムであると考えられていました。

このアイデアの最初のそして恐らくは最も有名な例はブリュッセルでの第5回ソルヴェイ会議における"Einsteinの「反跳二重スリット思考実験」と関連したEinsteinとBohrの対話です。

 

この思考実験は,入射粒子から二重スリットへの運動量遷移の測定が粒子の"軌道"を決定するというものです。

 

しかし,Bohrは二重スリットの初期位置に関する知識の不確定さが干渉の最小と最大の間の距離の大きさと同じオーダーであることを示し否定しました。干渉縞は不確定性原理によって洗い消されるのです。[7]

より近年では,ScullyとDruhlはあるケースにはこうした干渉の損失の責任は不確定性原理ではなく粒子と測定装置間の量子エンタングルメント(量子もつれ)に帰することを示しました。

例えば,内部自由度を無視して干渉計を励起させる粒子状態を次のケットで代表させます。

  

すなわち,|Ψ>=(1/√2)[|ψ1()>+|ψ2()>] (1)です。

 

ここで,ケット:|ψ1()>,|ψ2()>は,それぞれ粒子が経路1,経路2を取る確率振幅を表現するものです。これから,1粒子が位置に検知される確率密度が|<|Ψ>|2で与えられます。

  

これのクロス項は,<ψ1()|><2()>と<ψ2()|><1()>です。これらの存在が干渉の原因です。

1()>,or|ψ2()>を乱すことなく粒子が取る経路をマークすることを可能にする測定措置:Mの導入は,次のように系のヒルベルト空間を拡張することで記述されます。

すなわち,|Ψ>=(1/√2)[|ψ1()>|M1>+|ψ2()>|M2>] (2)です。|Mj>は経路j(j=1,2)を通過する確率に対応する経路マーカーの状態です。

 

100%有効な経路マーカ-は,|M1>が|M2>と直交するようになっています。このケースでは測定Mは粒子の経路1,2の通過に対して|Ψ>を適切な状態へとreduce(収縮?)させます。しかし,干渉パターンの消失はそうした測定とは独立です。

 

それでも,経路マーカーの存在は,式(2)の右辺の2つの干渉項を直交させるのには十分です。

 

実際,直交性:<M1|M2>=<M2|M1>=0 故,|<|Ψ>|2にクロス項はありません。したがって,経路情報の獲得が干渉を破壊することを説明するにはこれで十分です。

しかし,もしも|ψ1()>と|ψ2()>が観測者によって有意に乱されることがないなら,経路マーカー上の経路情報を消して適切な測定と粒子の検知を相関させることにより干渉を回復することが可能です。

 

この測定は"量子消去(quantum erasus)"として知られています。

さらに,もし経路マーカーに情報をストアする能力があれば,消去は粒子検知の後でさえ遂行可能です。

 

遅延消去の可能性は,過去の[11,12]の後に,その"合理性=それが可能であるという論拠"に関して議論を引き起こしました。

 

この論拠は量子力学の定式化の誤った解釈の上で発見されました。[13,14] 

 

近年では,干渉する粒子への有意な摂動を起こすことなく経路情報を受容することが可能であるという実行された,あるいは提案されたいくつかのアイデアや実験があります。[10,9,15-30]

我々は,そのオリジナリティと教育的内容の故に,これらの提案の中で特にScully,Druhlによる[9]とScully,Englert,Waltherによる[10]を区別します。

自発的なパラメータ下方転移によって生成された光子対は,その運動量,時間,偏光の相関性の故に量子消去の実験的デモにおいて重要な役割を果たします。[17,18,20,21,28,29]。

 

量子消去の現象は全ての報告された実験の中に存在しますが,唯一[28]だけが元のScully,Druhl[9]のアナロジーです。

本論文では干渉を生ぜしめるヤングの二重スリットを実際に用いた量子消しゴムの実験をレポートします。

 

この実験はScully,Englert,Walther(SEW)[10,31]の提案と関連して解析されました。知るところでは,これが実際の二重スリットを通過した粒子から干渉が得られる量子消しゴムの最初のデモです。

Sec.ⅡではSEWの量子消しゴムの短かい要約を与えます。我々の量子消しゴムの背後にある理論はSec.Ⅲで,実験設定と結果はそれぞれSec.ⅣとⅤで与えます。

.Scully-Englert-Walther Quantum Eraser

 ここで報告する実験はScully,Englert,Walther[10]の提案によって鼓舞されたものです。この[10]は次のように要約されます。

 励起状態のRydberg原子のビームが離れたスクリーンにヤングの干渉パターンを形成するには十分に小さい二重スリットに入射します。

 

 各スリットの前には経路マーカーが置かれます。これは放出原子が空洞を走る確率が1であるような適切な長さのミクロメーザーの空洞から成り立っています。

どちらの空洞にあるか?ということで対応するスリットを通った原子の通過をマークします。それ故,干渉パターンを破壊します。

 

なぜなら,今の場合は経路情報の方がわかるからです。空洞による原子の波動関数の空間部分への摂動は無視できます。[10,13,31]

 

空洞の状態を|0>(光子ゼロ)と|1>(光子1個あり)の対称(反対称)の線形結合の上へ射影する測定が干渉の消去を実行し,相関した検出の中で干渉パターンが回復されます。

.An Optical Bell-State Quantum Eraser(光学的ベル状態量子消しゴム)

 次のような実験設定を考えます。

 

 光子の線形偏光ビームが二重スリットに入射します。もしも二重スリットが適切な広がりを持つなら離れたスクリーンでの1光子検出の確率分布はヤングの干渉パターンで与えられます。

 

 各スリットの前に光子の偏光方向と角度45度(または-45度)の1/4波長板(quarter-wave plate)を置きます。波長板のいずれかの1つを横切ると光子は円偏光になりwell-definedな角運動量を獲得します。[32]

 

 波動板(=1/4波長板)が回転自由とすると,それは光子のそれと正反対の角運動量を獲得するはずです。板は光子のカイラリティに応じて左右に回転します。光子の波動板を量子回転子として扱えば,光子がΔl=±1の遷移を誘導すると言えます。

 波動板はビ-ムの伝播を有意には変えないので,原理的に量子消しゴムとしての必要な特性を持つ経路マーカーを得ることになります。

 

 しかし,このスキームは実現には程遠いものです。回転自由な波動板の設置のむずかしさと同様,質量と大きさを持つ回転子のエネルギー準位間の隔たりは10-40eVのオーダーです。

 さらに,"デコヒーレンス効果"がマクロな量子回転子を光子経路のマークには使えないようにします。

   

※(訳注1):2006年10/23の記事「観測の問題(デコヒーレンス)」※

 

 このアイデアはGreenbergerとYasin[33]の"幽霊測定(haunted measurement)"のそれに似ています。

 しかし,系を大きくすることによって十分な経路検出装置を創ることができます。二重スリットに入射する光子たちのビームを他の検知装置を自由に伝播する第二のビームとエンタングルさせます。いわゆるベルの状態です。

|Ψ>=(1/√2)(|x>S|y>P+|y>S|x>P)(3)なる状態です。ここで添字sとpは2つのビームを表わし,xとyは直交する線形偏光を表わします。(sはslit,pはplateの頭文字です。)

もしビームsが(波動板でなく)二重スリットに入射するなら,(3)は次のように変換されます。

 すなわち,|Ψ>=(1/√2)(|ψ1>+|ψ2>) (4)です。ただし,|ψ1>=(1/√2)(|x>S1|y>P+|y>S1|x>P) (5),|ψ2>=(1/√2)(|x>S2|y>P+|y>S2|x>P) (6)です。

 添字s1,s2は,それぞれスりット1とスリット2で生成されるビームの意味です。ビームs1とs2が重なり合う遠方の領域のスクリーン上での1光子検出の確率分布は通常の干渉パターンであるS(δ)=1+cosδ(7)を示します。

 

 ただし,δは(slit:1)→(screen)と(slit:2)→(screen)の経路間の位相差です。

※(訳注2):2007年12/3の記事「ヤングの干渉実験(1)(古典論)」では,次のように述べています。

"観測スクリーンの位置における時刻tでの輻射の全電場の偏光成分をE(,t)とします。この電場は光速cによって定まるtより前の時刻t1,t2におけるスリット,またはピンホ-ル:1,2での電場の1次の重ね合わせです。

 

すなわち,形式的にはE(,t)=u1(1,t1)+u2(2,t2)と書けます。

ここにt1,t2は,それぞれ,1,s2を光が第1スクリーン上の1,2から第2スクリーンまで到達するまでの距離としてt1≡t-s1/c,t2≡t-s2/cで指定される時刻です。

 

そしてu1,u2は球面波に対応して1,s2に反比例する量です。

2006年10/3の「ホイヘンスの原理の正当性」では次のような内容の記事を書きました。

 

"ホイヘンス・フレネルの原理(Huygens-Fresnel)"によれば,1次球面波:ψ(,t)=(A/r)exp{-i(ωt-2πr/λ)}は,"キルヒホッフ(Kirchhoff)の積分表示"により,2次波の包絡面として,={iπA/(λr)}exp{-i(ωt-2πr'/λ)}r-r'r+r'dR(1+cosχ)exp{i(2πR/λ)}と表現できます。

そこで,"スリット=ピンホール"からの2次波は"1/4-波長=π/2"だけ位相がずれていてu1,u2は純虚数になります。

  

(,t)の右辺の係数の最初のiがi=exp(π/2)によって"1/4-波長=π/2"の位相変化を意味します。)

 

結局,光の強度Iは(,t)=(1/2)ε0c<|E(,t)|2c=(1/2)ε0c[|1|2<|E(1,t1)|2c+|2|2<|E(2,t2)|2c+21*2Re<E*(1,t1)(2,t2)>cとなります。

 

(< >cは電磁波の周期ごとのサイクル(cycle)平均です。)

ヤングの干渉実験での記録時間Tはコヒーレンス時間τcよりずっと長いので,"時間平均=統計平均:< >"をI()=<I(,t)で表わせば,I()=(1/2)ε0c[|1|2<|E(1,t1)|2>+|2|2<|E(2,t2)|2>+21*2Re<E*(1,t1)(2,t2)>となります。

この実験では,第1スクリーンにおける1次波の(1,t1)と(2,t2)はレンズによってスクリーンに向かってz方向に直進する平面波となるので,(,t)=E(z,t)=E(t-z/c)と表わされます。

 

そこで,<E*(1,t1)(2,t2)>は<E*(z1,t1)(z2,t2)>=<E*(t1-z1/c)(t2-z2/c)>となります。

通常の電場の自己相関関数:<E*(1,t1)(2,t2)>=<E*(1,t)(2,t+τ)>のτが単純な時間差τ=t2-t1ではなく,τ≡t2-z2/c-(t1-z1/c)に変わることを除けば,これまでの議論でのそれと本質的に違いはありません。

 

((注)"これまでの議論”というのは,事前にカオス光源からの光の減衰と自己相関関数の関係について論じている内容を指します。)

  

そこで,ν個の励起原子からの光なら,<E*(z1,t1)(z2,t2)>=νE02exp(-iω0|τ|-γ'|τ|)と書けます。

これを第2スクリーン上での光ビームの強さ()を表わす式に代入すると,I()=<I(,t)>=(1/2)ε0νE02[|1|2+|2|2+21*2 exp(γ'|τ|)cos(ω0τ)]となります。

光源のカオス性は指数因子exp(γ'|1-s2|/c)を通して干渉縞の鮮明度に影響します。そのためs1とs2が十分異なるときには原則的に縞は全く消えてしまいます。

しかし,ω0>>γ'のような幅の狭い発光源の場合には,τ=(s1-s2)/cが十分大きくて指数因子により縞がぼやける前に余弦の項cos(ω0τ)により非常に多くの縞が作り出されます。

ω0はビームの光の平均周波数です。δ≡ω0τと置くとこれは到達経路の位相差です。γ'は輻射本来が持つ"自発輻射=蛍光"による輻射広がりγにカオス光源の衝突広がりγcollの効果を加えたもので,強度の減衰因子:exp(-2γ't)を与えるパラメータ:γ'≡γ+γcollです。

減衰のない1光子(ν=1)で重ね合わせが完全に対等:u121/√2なら,スクリーン上での光強度は()=(1/2)ε002(1+cosδ)となります。 (訳注2終わり) ※

各スリットの前にx方向へと角度45度と-45度の速い軸を持つλ/4プレート(=1/4波長板)を導入すると,状態|ψ1>,|ψ2>は次のように変換されます。

すなわち,|ψ1>=(1/√2)(|L>S1|y>P+i|R>S1|x>P) (8),|ψ2>=(1/√2)(|R>S2|y>P-i|L>S2|x>P) (9)です。R,Lはそれぞれ右,左の円偏光を表わします。

1>と|ψ2>は直交する偏光なので,干渉の可能性はゼロです。

 

干渉を回復するためには系の状態を経路検知装置の対称状態と反対称状態に射影させます。これは,|ψ1>と|ψ2>をそれぞれ偏光の対称結合と反対称結合に変換させることと同等です。

例えば,|x>=(1/√2)(|+>+|->) (10),|y>=(1/√2)(|+>-|->) (11),および|R>={(1-i)/2}(|+>+i|->) (12),|L>={(1-i)/2}(i|+>+|->) (13)です。

 

+,-はそれぞれxに対して+45度,-45度の偏光を示す記号です。

完全な状態;|Ψ>を書き直すと,|Ψ>=(1/2)[(|+>S1-i|+>S2>)|+>P+i(|->S1+i|->S2>)|->P] (14)となります。

上の表現を見ると,光子p(=plate)の状態を|x>P,または|->Pに射影すれば干渉を回復できることがわかります。これは実験的にはビームpの経路と向きを+45度にして|+>Pを選択,向きを-45度にして|->Pを選択するように配置すればいいだけです。

干渉パターンはsとpの光子の一体検出で回復されます。2つのケースで得られる縞は逆位相であることに着目します。それらは共に縞(fringes)と逆縞(antifringes)と呼ばれます。

.Obtaining which-path information(経路情報の獲得)

 経路情報は光子sとpの両方の偏光を考慮すれば得られます。

 

 情報を得るプロセスはsの前にpを検知するか?pの前にsを検知するか?の2つのスキームに分割されます。これを遅延消去(delayed erasure)と呼びます。

 これはビームsとpの経路長さを変化させることでなされます。一方の光子が,他方の光子が測定装置に到着するよりはるかに早く検知されると仮定します。

まず,第一の可能性を考えます。光子pが,例えば偏光xで検知されれば,λ/4波長板と二重スリットをヒットする前には光子sの偏光はyであることが既知です。

 式(4)|Ψ>=(1/√2)(|ψ1>+|ψ2>)と,(8)|ψ1>=(1/√2)(|L>S1|y>P+i|R>S1|x>P),および(9)|ψ2>=(1/√2)(|R>S2|y>P-i|L>S2|x>P)を見ると,

 

 光子sは(二重スリットの後では)sがスリット1を通過したときにのみ偏光Rと,スリット2を通過したときにのみ偏光Lと両立できることは明らかです。

これは実験によって確かめることができます。

 

通常の量子力学の言葉では,光子sを検知するより前に光子pを検知することは光子sをある状態に準備するということです。

.Delayed erasure(遅延消去)

 光子sを検知するより前にその経路情報を得ることの可能性は遅延選択へと導かれます。[14]

 

 遅延選択は量子力学の物理的意味を明確に知るために重要な状況を生み出します。文献:[11-14]には良い論旨が見出されます。

 

 我々の量子消しゴムは,経路情報を観測するか?,または光子sの検知より後の干渉パターンを観測するか?を選択する実験が許されないのと同じ感覚で,光子pの検知より前での光子sの検知に対して"それ=(経路情報を観測するか,光子sの検知より後の干渉パターンを観測するか選択の実験)を許します。こうした状況を遅延消失と呼びます。

 ここで生じる疑問は,"2つの光子を検知する順序が実験結果に影響するか?"ということです。

.Experimental Setup and Procedure(実験の設定と手順)

 ある伝播方向に対して,非線形結晶中のタイプⅡの自発的パラメータ下方転移は次の状態を生成します。

すなわち,|ψ>=(1/√2)(|o>S|e>P+exp(iφ)|e>S|o>P) (15)です。

ここでo,sは,それぞれ通常偏極(ordinary polarization),異常偏極(extraordinary polarization)を意味します。φは結晶の複屈折による相対的な位相のずれです。φがゼロまたはπなら,これに応じてベル状態|Ψ+>,|Ψ->を得ます。

 前節で記述された干渉計内でのこの状態を用いると,一体化され光子を検知する確率は,1/2+[1/2-sin2(θ+α)cos2(φ/2)-2-sin2(θ-α)sin2(φ/2)]sinδ (16)です。

 

 δは表式(7)PS(δ)=1+cosδの右辺で定義されるものです。θは1/4波長板の速い(遅い)軸とo軸の間の最小角,αはo軸に関する経路pの偏光角です。

 実験設定は下図1に示します。 

      

               

 

 自発的パラメータ下方転移によって702.2nmのエンタングル光子を生成する1mmの長さのBBO(β-BaB2O4)結晶のポンプにアルゴン・レーザー(351.1nm at ~ 200mW)が用いられます。

このBBO結晶はタイプⅡの位相にマッチするようにカットされます。ポンプのビームは二重スリットでの横波コヒーレンス長さを増加させるため,焦点距離が1mのレンズを用いて結晶面の上に集光されます。

 

焦点におけるポンプのビームの幅は0.5mmです。[15]

 直交する偏光のエンタングル光子はBBO結晶の各々がポンプのビームと約3度の角度を持つようにさせておきます。光子pの経路には量子消去実行のために偏光体(POL1)が挿入できます。

 

 二重スリットと1/4波長板を経路s内のBBO結晶から42cmの位置に置きます。検知装置Dp,DsはそれぞれBBO結晶から125cm,98cmに位置するようにします。OWP1,OWP2は角度45度の速い軸を有する1/4波長板です。

 環状の1/4波長板は二重スリットの前でフィットするように(接線状に)sandされます。二重スリットの開口は幅が200μmであり,200μmの距離で離れています。

 

 検知装置はEG&G SPCM 200 光検知装置です。これは干渉フィルター(帯域幅1nm)と300μm×5mmの矩形集光スリットを携えています。検知装置Dsをスキャンするために段階回転式モーターが用いられます。

 

 遅延消去の設定も(ⅰ)検知装置DpとPOL1がBBO結晶から2mに位置する,(ⅱ)検知装置Dp上の集光絞りが600μm×5mmの大きさを持つ,という2つの変更の他は同じです。

.Experimental Results(実験結果)

 量子消しゴム実験の実行以前に,エンタングル状態が検知されることを証明するために"ベルの不等式テスト"が実行されました。

 

※(訳注3):2007年2/16の記事「ベルの不等式(量子論と実在)」参照※

 

 下図2は検知装置Dpに1/4波長板OWP1,OWP2や偏光体(POL1)が無いときに,光子sの経路内の二重スリットで標準的ヤングの干渉パタ-ンが得られることを示しています。

 

    

  

 次に,二重スリットの前に1/4波長板OWP1,OWP2を置くことにより光子sの経路をマークします。下図3は1/4波長板のせいで干渉がなくなることを示しています。

 

  

  

 この図3では図2のほとんど全ての干渉は破壊されています。残りの干渉は1/4波長板の僅かな調整誤差によるものです。

 

 検知装置Dpの前に線形偏光装置POL1を置くと経路選択情報が消されて干渉が回復されます。

 

 干渉を回復するにはPOL1の偏光角(α)は1/4波長板OWP1の速い軸の角θにセットします。下図4に示す干渉縞が得られました。

 

 POL1による一体化のカウントの減少の補償のため,検知時間を2倍の長さに取ります。

  

   

 

 下図5ではPOL1がOWP2の速い軸の角θ+π/2にセットされています。これは干渉-逆縞のパターンを生ぜしめます。これら2つの干渉パターンの平均和はラフには図3に等しいパターンを与えます。

   

   

 遅延消失状況に対して図6~図9を生成するため同じ手順が用いられました。実験結果は光子pが光子sの前に検知される場合と同じです。

 

   

 

   

 

   

 

   

 

 この実験では光子sの検知後と光子pの検知前の期間に観測者が"選択"できないという意味で"遅延選択"なる言葉をルーズに用いていますが,文献[13,14]と同じく単に検知の順序が重要ではないことを表現したいだけです。

.Conclusion(結論)

 我々は干渉を生成するためにヤングの二重スリットを用いた量子消しゴムを与えました。実験中の1/4波長板は干渉を破壊する経路マーカーとして働きました。

 

 そして光子sとpのエンタングルメントを用いて干渉を回復させました。我々の量子消しゴムはScully,Englert,Walther[10]の実験にとてもよく似ています。

 

 干渉は干渉する光子の経路をマークすることで破壊され,他方のエンタングル光子について適切な観測をすることで回復されました。

 

 また,光子pの検知前に干渉する光子sを検知する遅延消去の条件下でもこの実験を調べました。

これまでの多くと同様,我々の実験は光子sが検知された後と光子pの検知前に観測者が偏光角を選択することを許すものではありません。

 

結果は光子sの検知による波動関数の崩壊は予測結果の観測を妨げるものではないことを示しています。

 

我々の実験データはScully,Englert,Waltherの提案[10]に一致して,量子消しゴムは干渉粒子が検知された後に実行できます。

 Acknowledgement(謝辞):(略)

   

※(訳注4):この論文では,結果図を見ればわかるように干渉縞といってもオリジナルのヤングの実験のように,実際のスクリーン上の縞の映像や写真感光上に直接視覚化されたものがあるわけではありません。

 

 干渉図も偏光を利用して到達個数をカウントした観測結果やエンタングルによって片割れの個数から計算した結果をプロットしたものに過ぎないことに注意してください。

   

 もっとも,今どきであれば数データであっても容易にコンピュータでVirtualに画像として視覚化できますが。。

  

 本ブログでのその他の関連記事としては,2006年5/4「公開キー暗号(神はサイコロ遊びをなさる)」,および「量子通信(神はサイコロ遊びをなさる「つづき」))もあるのでよかったら参照してください。 ※

 

References(参考文献):

 

[1] W.K.Wooters and W.H.Zurek,Phys.Rev.D19,473(1979)

[2] D.M.Grenberger and A.Yasin,Phys.Lett.A128,391(1988)

[3] L.Mandel,Opt.Lett.16,1882(1991)

[4] G.Jaeger,A.Shimony and J.Vaidman,Phys.Rev,A51,54(1995)

[5] B.G.Englert,Phys.Rev.Lett.77,2154(1996)

 

[6] G.Bjork and A.Karlsson,Phys.Rev.A58,3477(1998)

[7] M.Jammer,"The philosophy of Quantum Mechanics"(Wiley New York,1974)

[8] F.Belinfante,"Measurement and Time Reversal in Objective Quantum Mechanics"(Pergemon,New York.1975)

[9] M.O.Sculty and K.Druhl,Phys.Rev.A25,2208(1982)

[10] M.O.Sculty,B.G.Englert and H.Walther,Nature(London)351,111,(1991)

 

[11] U.Mohrhoff,Am.J.Phys.64,1468(1996)

[12] U.Mohrhoff,Am.J.Phys.67,330(1999)

[13] M.O.Sculty and H.Walther,Found.Phys.28,5229(1998)

[14] B.G.Englert,M.O.Sculty and H.Walther,Am.J.Phys.67,325(1999)

[15] M.O.Sculty and H.Walther,Phys.Rev.A39,5229(1989)

  

[16] M.O.Sculty,B.G.Englert and J.Swinger,Phys,Rev.A40,1775(1989)

[17] A.G.Zajonc,L.W.Wang,X.Ou and L.Mandel.Nature(London),353,507(1991)

[18} P.G.Kwiat,A.Steinberg and R.Chiao,Phys.Rev.A45,7729(1992)

[19] P.G.Kwiat,A.Steinberg and R.Chiao,Phys.Rev.A49,61(1994)

[20] T.J.Herzog,P.G.Kwiat,H.Weinfurter and A.Zeilinger,Phys.Rev.Lett.75,3034(1995)

   

[21] C.H.Monken,D.Braning.and I.Mandel,in CQQ7-Proceeding of the Seventh Rochester Conference in Coherence and Quantum Optics,edited by I.Mandel and J.Eberty(Plenum,New York.1996),P.701

[22] C.C.Gerry,Phys.Rev.A53,1179(1996)

[23] Z.Y.Ou,Phys.Lett.A226,323(1997)

[24] S.B.Zheng and G.C.Guo,Physics.A251,507(1998)

[25] G.Hackenbroich,B.Rosenow and H.A.Weidenmuller,Europhys.Lett.44.693(1998)

 

[26] S.Durr,T.Nonn and G.Rempe,Nature(London),395,333(1998)

[27] S.Durr,T.Nonn and G.Rempe,Phys.Rev.Lett.81,5705(1998)

[28] Y.Kim,R.Yu,S,Kulik,Y.Shih and M.Sculty,Phys.Rev.Lett.84,1(2000)

[29] P.Kwiat,P.Schwingerand B.G.Englert,in Workshop on Mysteries,Puzzles and Paradoxes in Quantum Mechanics,edited by R.Bonifacio(AIP,Woodbury,NY,1998)

[30} U.Eichmann et.al.,Phys.Rev.Lett.70,2339(1993)

 

[31] M.O.Sculty and M.S.Zubairy,Quantum Optics (Cambridge University Press,Cambridge,England.1997)

[32] R.A.Beth,Phys.Rev.50,115(1936)

[33] D.M.Greenberger and A.Ya'sin,Found Phys.19,679(1989)

[34] J.A.Wheeler,in Mathematical Foundation of  Quantum Theory,edited by A.R.Marlow (Academic,New York,1978),P.183

 

[35] P.S.Ribeiro,C.Monken and G.Bardosa,Appl.Opt.33,352(1994)

[36] P.G.Kwiat et al.,Phys.Rev.Lett.75,4337(1995)

 

翻訳対象の論文:

 

S.P.Walborn,M.O.Terra Cunba,S.Padua and C.H.Monken「Double-slit quantum eraser」Phys.Rev.A,Vol.65(3)(2002),pp033818-1-033818-6

    

 

ブックオフオンライン 

iconオンライン書店 boople.com(ブープル)

| | コメント (12) | トラックバック (0)

2010年2月23日 (火)

確率と分布関数(6)(特性関数,極限定理)

 確率と分布関数の続きです。

 前回の離散変数中心の話題から連続変数を主とする話題に移ります。 

[定義9-1]:確率変数Xの積率母関数(moment generating function)を,

 MX(θ)≡E[exp(θX)] で定義する。

 ただし,E[exp(θX)]は∀θ∈Rについて常に存在するとは限らないので,この定義は右辺が存在するときに限られる。

 そこで,MX(θ)=E[exp(θX)]においてθをit(t∈R)に置き換えたもの:Xの特性関数(characteristic function)を,

 

 φ(t)≡E[exp(itX)](-∞<t<∞) で定義する。

 iは虚数:√-1を表わす。

  

 この定義では,E[exp(itX)]は∀t∈Rに対し絶対収束する。

 

(注1):特性関数の定義によれば,特にXが離散確率変数で前記事で定義した確率母関数:G(z)=E[zX]を持つなら,

 

 φ(t)=E[exp(itX)]=E[exp(it)X]=G(exp(it)) です。

 

また,Xが正値確率変数,つまりx<0 ならP(X≦x)=0 で,確率密度関数f(x)を持つ連続型変数のとき,

 

f(x)のLaplace変換は,

 

{f(x)}≡∫0exp(-sx)f(x)dx

 

で定義されます。

 

そこで,{f(x)}=E[exp(-sx)]ですが,右辺は

 

[exp(-sx)]=Σj=0{(-s)j}/j!}E[Xj]

 

のように,sのベキ級数に展開されます。

 

故に,[d{f(x)}/ds]x=0=-E[X],

 [d2{f(x)}/ds2]x=0=E[X2],etc.が成立します。

 

他方,Xが正値とは限らず一般の確率密度関数f(x)を持つ連続変数のとき,特性関数は,

 

φ(t)=E[exp(itX)]=∫-∞exp(itx)f(x)dx です。

 

これは,f(x)のFourier変換:{f(x)}ですね。私にはこちらの方がLaplace変換より馴染み深いです。※

 

[例9-2]:確率密度関数(p.d.f)が正規分布:N[μ,σ2]:

 

 f(x)=(2π)-1/2σ-1exp{-(x-μ)2/(2σ2)}(-∞<x<∞)

 

のとき,

 E[exp(-sx)]=∫-∞exp(-sx)f(x)dx を求める。

 

(解): E[exp(-sx)]

=(2π)-1/2σ-1-∞exp{-(x-μ)2/(2σ2)-sx}dx

=π-1/2-∞exp{-(u2+21/2σsu+μs)}du

 

=π-1/2exp(σ22/2-μs)∫-∞exp{-(u+21/2σs/2)2}du

=exp(σ22/2-μs)

 

です。

 

(注2):E[exp(-sx)]=exp(σ22/2-μs)に,s=-itを代入するとE[exp(itX)]=exp(iμt-t2σ2/2)を得ます。

 

 よってN[μ,σ2]の特性関数はφ(t)=exp(iμt-t2σ2/2) です。

 

 特に標準正規分布N[0,1]ならφ(t)=exp(-t2/2)です。 ※

 

[定理9-3]:(特性関数の性質)

 

(1)  φ(0)=1

(2)|φ(t)|≦1.

 

(3)φ(k)(0)=ikE(Xk) 

(4)Y=aX+bの特性関数はexp(itb)φ(at)である。

 

(5)確率密度関数f(x)が存在して偶関数:f(-x)=f(x)なら,

 φ(t)は実関数である。

 

(証明):(1)φ(0)=E(1)=∫-∞dF=1 です。

  

(2)|φ(t)|=|E[exp(itX)]=|∫-∞exp(itX)dF|です。

 

 そして,|∫-∞exp(itX)dF|≦∫-∞|exp(itX)|dF=∫-∞dF=1 です。

 

(3)φ(t)=E[exp(itX)]=E[Σk=0ikkk/k!]=Σk=0ikkE[Xk]/k!です。そこで,φ(k)(0)=ikE[Xk]が成立します。

 

(4)φY(t)=E[exp(itY)]=E[exp{it(aX+b)}]

=exp(itb)E[exp{i(at)X}]=exp(itb)φ(at) です。

 

(5)φ(t)=E[exp(itX)]=∫-∞exp(itx)f(x)dx

=(1/2)∫0{exp(itx)f(x)+exp(-itx)f(-x)}dxです。

 

 故にf(-x)=f(x)なら,φ(t)=∫0f(x)[{exp(itx)f(x)+exp(-itx)}/2]dx=∫0f(x)∫0f(x)cos(tx)dxです。

 

 cos(tx)も密度関数f(x)も実関数ですから,φ(t)も実関数と結論できます。(証明終わり)

 

(注3):この定理における性質(3)φ(k)(0)=ikE(Xk)から,

 

 E[X]=-iφ'(0),Var[X]=E[X2]-E[X]2=-φ"(0)+{φ'(0)}2によって特性関数によるXの平均,分散の表現が得られます。 ※

 

[定理9-4]:確率変数Xの分布関数F(x)は特性関数φ(t)によって一意的に決定される。

 

(証明)φ(t)≡E[exp(itX)]なる定義から,F(x)=P(X≦x)=∫-∞xf(x)dxを満たす確率密度関数f(x)が存在すればφ(t)=∫-∞exp(itx)f(x)dx={f(x)}と書けます。

 

これのFourier逆変換から,逆に特性関数φ(t)が与えられれば密度関数はf(x)=(2π)-1-∞exp(-itx)φ(t)dtによって一意的に決まります。

 

そして,-∞<x1<x2<∞なる任意の2実数x1,x2に対してF(x2)-F(x1)=P(x1<X≦x2)=∫x1x2f(x)dx=-(2πi)-1-∞[{exp(-itx2)-exp(-itx1)}φ(t)/t]dtと書けます。

 

証明は省略しますが,密度関数が存在するとは限らない一般のφ(t)=∫-∞exp(itx)dFなる表現の場合でも,

 

F(x)の連続点x1<x2においてF(x2)-F(x1)=P(x1<X≦x2)=-(2πi)-1-∞{φ(t)/t}{exp(-itx2)-exp(-itx1)}dtが成立します。(証明終わり)

 

[定義9-5]:k次元確率変数=(X1,X2,..,Xk)に対して

 

 の特性関数を,φ()≡E[exp(itX)]=E[exp(iΣj=1kjj)],

  

 t=(t1,t2,..,tk)によって定義する。

 

(注4):上記のφ()に対しても,1変数の式:

P(x1<X≦x2)=-(2πi)-1-∞{φ(t)/t}{exp(-itx2)-exp(-itx1)}dtを拡張した,

 

P(X∈)=(-2πi)-kΠj=1k-∞[{exp(-itbj)-exp(-itaj)}/tj]φ()が成立します。

 

ここに,{=(x1,x2,..,xk)|aj<xj≦bj;1≦j≦k},∫-∞≡∫-∞dt1-∞dt2d..∫-∞dtkです。

 

特にX1,X2,..,Xkが全て独立な確率変数で,それぞれ特性関数:

 

φX1(t),φX2(t),..,φXk(t)を持つなら,

 

φ()=φX1(t1X2(t2)..φXk(tk)です。

 

 逆に,φ()=φX1(t1X2(t2)..φXk(tk)なら,X1,X2,..,Xkは独立です。※

 

[定理9-6]:X1,X2が独立で共に標準正規分布:N[0,1]を持つとき,

 Y=X1-X2,Z=X1+X2は独立で共に正規分布:N[0,2]を持つ。

 

(証明)定義によって(Y,Z)の特性関数は,

φ(Y,Z)(t1,t2)=E[exp(it1Y+it2Z)]=E[exp{i(t1+t2)X1+(t1-t2)X2}]です。

 

ところがX1,X2は独立で特性関数は

φXj(t)=exp(-t2/2)(j=1,2)ですから,

 

E[exp{i(t1+t2)X1+(t1-t2)X2}]=E[exp{i(t1+t2)X1}]E[exp{i(t1-t2)X2}]です。

 

そこで(Y,Z)(t1,t2)=φX1(t1+t2X2(t1-t2)=exp{-(t1+t2)2/2}exp{-(t1-t2)2/2}=exp(-t12)exp(-t22)です。

 

つまり,φ(Y,Z)(t1,t2)=E[exp(it1Y+it2Z)]=exp(-t12)exp(-t22)となりt1だけの関数とt2だけの関数の積に分解されます。

 

これは,E[exp(it1Y+it2Z)]=E[exp(it1Y)]E[exp(it2Z)]であって,E[exp(it1Y)]=exp(-t12),E[exp(it2Z)]=exp(-t22)を意味します。

 

 したがって,Y=X1-X2,Z=X1+X2は独立で共に正規分布:N[0,2]を持つことが示されました。(証明終わり)

 

※次に極限定理(limit theorem)をいくつか与えます。

 

[定理9-7]:ベルヌーイの大数の法則(Bernoulli's law of large numbers)

  

 P(Xj=1)=p,P(Xj=0)=q=1-pのベルヌーイ試行(独立試行):X1,X2,..において,n≡X1+X2+..Xnとおけば,

 

 ∀ε>0 に対してlimn→∞P(|(Sn/n)-p|<ε)=1が成り立つ。

 

(証明)この各試行XjではE[Xj]=p,Var[Xj]=(1-p)2p+(0-p)2q=pq=p(1-p)(j=1,2,..,n)です。

 

 そして,ベルヌーイ試行=独立試行ですから

E[Sn]=E[X1+X2+..Xn]=np,Var[Sn]=Var[X1+X2+..Xn]=np(1-p)です。

 

 そこで,E[Sn/n]=E[(X1+X2+..Xn)/n]=p,

 Var[Sn/n]=Var[(X1+X2+..Xn)/n]=p(1-p)/n です。

 

先に示したチェビシェフの不等式: 

P(|X-μ|≧kσ)≦1/k2において,

 

X=Sn/n,μ=p,σ={p(1-p)/n}1/2, 

k=ε/σ=εn1/2-1/2(1-p)-1/2とすると,

 

P(|Sn/n-p|≧ε)≦p(1-p)/(nε2)≦1/(4nε2)

 となります。

 

それ故,limn→∞P(|(Sn/n)-p|≧ε)=0,

 

あるいはlimn→∞P(|(Sn/n)-p|<ε)=1-limn→∞P(|(Sn/n)-p|≧ε)=1 得ます。(証明終わり)

 

[定理9-8]:大数の法則(大数の弱法則)(weak law of large numbers)

 

 {Xn}n=1,2,.は互いに独立な確率変数列で各Xnが有限な分散:σn2=Var[Xn](n=1,2,..)を持ち,

 

lim n→∞j=1nσj2/n2)=0 なら,変数Sn≡Σj=1nj=X1+X2+..Xnに対して,∀ε>0 について,

  

lim n→∞P(|(Sn/n)-E[Sn/n]|<ε)=1 が成り立つ。

 

(証明) Var[Σj=1nj/n]=Σj=1nσj2/n2です。

 

 そこでチェビシェフの不等式:P(|X-μ|≧kσ)≦1/k2において,

 

 X=Sn/n,μ=E[Sn/n],σ=(Σj=1nσj2/n2)1/2,

 k=ε/σとすると,

 

 P(|Sn/n-E[Sn/n]|≧ε)≦(Σj=1nσj2)/(n2ε2)を得ます。

  

 そこで,lim n→∞j=1nσj2/n2)=0 なら

 lim n→∞P(|(Sn/n)-E[Sn/n]|≧ε)=0,

 

 あるいは,

 

 lim n→∞P(|(Sn/n)-E[Sn/n]|<ε)=1-limn→∞P(|(Sn/n)-E[Sn/n]|≧ε)=1 です。(証明終わり)

 

[定理9-9]:中心極限定理(central limit theorem)

  

 X1,X2,..,Xnは,それぞれ分布関数F1(x),F2(x),..,Fn(x)を持つ互いに独立な確率変数で,

 

 有限な平均μj=E[Xj],有限な分散σj2=Var[Xj](j=1,2,..,n)

 

 を持つと仮定する。

 

n2Var[X1+X2+..Xn]=σ12+σ22+..σn2 (Sn>0)は,

 

:"ε>0 に対してlimn→∞(1/Sn2j=1n|x-μj|≧εSn(x-μj)2dFj(x)=0 "

 

というLindbergの条件を満たすと仮定する。

 

このとき,Yn{(X1+X2+..Xn)-E[X1+X2+..Xn]}/Snの分布は

 

n→∞ の極限で正規分布:N[0,1]に収束する。

 

(証明) j≡Xj-E[Xj]=Xj-μjとおけば,

 E[Uj]=0,Var[Uj]=σj2です。

 以下では,

 

 Ujの分布関数をF~j(u)≡Fj(x-μj)と書くことにします。

 

 さて,Yn={Σj=1nj}/Snの特性関数を

 

 φYn(t)=E[exp(itYn)] と書きます。

 

 Uj(1≦j≦n)は全て独立なので,φYn(t)はUjの特性関数φj(t)=E[exp(itUj)]の積として

 

 φYn(t)=Πj=1nφj(t/Sn)と書けます。

 

 対数表現ではlog{φYn(t)}=Σj=1nlog{φj(t/Sn)}です。

 

 さらに,log{φj(t/Sn)}={φj(t/Sn)-1}-(1/2){φj(t/Sn)-1}2+(1/3)){φj(t/Sn)-1}3-..なる級数展開から,

|log{φj(t/Sn)}-{φj(t/Sn)-1}|≦(1/2)|φj(t/Sn)-1|2/{1-|φj(t/Sn)-1|} なる評価式を得ます。

 

 そこで,|log{φYn(t)}-Σj=1nj(t/Sn)-1}|

≦(1/2)max(1≦j≦n)j(t/Sn)-1|/{1-|max(1≦j≦n)j(t/Sn)-1|}Σj=1nj(t/Sn)-1| です。

 

 ところで,φj(t)=E[exp(itUj)]

 =∫-∞exp(itu)dF~j(u)Σj=1nj(t/Sn)-1|

 =Σj=1n|∫-∞{exp(itu/Sn)-1}dF~j(u)| です。

 

 そして,exp(itu/Sn)はTaylor展開と平均値の定理から,

 exp(itu/Sn)=1+itu/Sn+θt22/(2Sn2) (|θ|≦1)

  

 と書けます。

  

 故に,Σj=1nj(t/Sn)-1|

=Σj=1n |(it/Sn)∫-∞udF~j+t2/(2Sn2))∫-∞θu2dF~j|

 

≦{t2/(2Sn2)}Σj=1n-∞2dF~j|≦t2n2/(2Sn2) です。

 

 すなわち,Σj=1nj(t/Sn)-1|≦t2/2です。

 

  Lindbergの条件から,n→ ∞の極限で∀ε>0 に対して

Σj=1n|x-μj|≧εSndFj(x)≦{1/(ε2n2)}[Σj=1n|x|≧εSn2dFj ] → 0 です。

 

 つまり,十分大きい正整数n1を取れば,n≧n1を満たす正整数nに対して,常にΣj=1n|x-μj|≧εSndFj(x)<εが成り立ちます。

 

これはUjの言葉ではΣj=1n|u|≧εSndF~j(u)<εです

  

 また,|exp(itu/Sn)-1|≦2,|exp(itu/Sn)-1|≦|tu|/Snですから,

 

j(t/Sn)-1|≦|∫|u|>εSn{exp(itu/Sn)-1}dF~j(u)|+|∫|u|≦εSn{exp(itu/Sn)-1}dF~j(u)|

 

≦2∫|u|>εSndF~j(u)+(|t|/Sn|)(εSn)∫|u|≦εSndF~j(u)

 

 です。

  

 そこで,r>0 に対し|t|<rなら

 

j(t/Sn)-1|≦2∫|u|>εSndF~j(u)+rε が成立します。

  

 つまり,n≧n1,かつ|t|<rなら,max(1≦j≦n)j(t/Sn)-1|<(2+r)εです。

  

 これはn→∞ のとき,|t|<rで一様にmax(1≦j≦n)j(t/Sn)-1|→ 0 となることを意味します。

 

 それ故,n→∞では,log{φj(t/Sn)}→{φj(t/Sn)-1},あるいはlog{φYn(t)}→Σj=1nj(t/Sn)-1}となることがわかります。 

  

 さらに,exp(itu/Sn)=1+itu/Sn-t22/(2Sn2)+θ't33/(6Sn3)(|θ'|≦1)であり,

 σj2-∞2dF~j(u)です。

 

 これと先の2次までの展開近似:

  

 exp(itu/Sn)=1+itu/Sn-θt22/(2Sn2)(|θ|≦1)

 を併用してΣj=1nj(t/Sn)-1}の極限値を評価します。

  

 Σj=1nj(t/Sn)-1}

=Σj=1n-∞{exp(itu/Sn)-1}dF~j(u)

=Σj=1n[-t2σj2/(2Sn2)+(1-θ)t2/(2Sn2)∫|u|>εSn2dF~j(u)+∫|u|≦εSn{-t22/(2Sn2)+θ't33/(6Sn3)}dF~j(u)]

 

と書けます。

 

 Lindbergの条件:limn→∞(1/Sn2j=1n|u|>εSn2dF~j(u)=0 によれば,

 

 ∀ε>0 に対してn≧n1,かつ|t|<rなら|Σj=1nj(t/Sn)-1}+t2/2|=|Σj=1nj(t/Sn)-1+(t2σj2)/(2Sn2)}|<εr2/2+ε22/2+ε33/6 が成立します。

 

 ε>0,r>0 は任意ですから,n→ ∞で

 

 Σj=1nj(t/Sn)-1}→ (-t2/2)より,

 

 log{φYn(t)}→ (-t2/2),

 あるいはφYn(t)→ exp(-t2/2)を得ます。

   

 そして,exp(-t2/2)は標準正規分布:[0,1]の特性関数です。

 

 以上から,

 

 分布に対する特性関数の一意性により定理の結論が従います。(証明終わり)

 

まあ,ここでの確率の母関数とか特性関数とかいうのは,物理学での統計物理学における分配関数,または状態和と呼ばれる関数と同じく,

 

それ自身の明確な意味はいま一つわからないが,その中に実際上必要な情報がほとんど含まれているようなものですね。

 

今日はここまでにします。(つづく)

 

参考文献:藤沢武久 著「新編 確率・統計」(日本理工出版会),

 ヒンチン(河野繁雄 訳)「統計力学の数学的基礎」(東京図書), 

 清水良一 著「中心極限定理」(教育出版)

 

PS:女子フィギュアのSP見ました。

 

 キム・ヨナも19歳の割りに色っぽくてよかったけど,私の中ではアメリカの高校生:レイチェル・フラットが最高でした。

 

 フィギアスケートの演技というよりダンスとして見てました。。。

 

 真央ちゃんは,まだ親方に連れられた角兵衛獅子?というか子供の軽業師(差別語?)というか?

 

 まだ大人の女性という感じがしません。

 

 女子の体操競技であれば,昔の子供だったコマネチのように技術だけあれば十分で芸術という側面は小さいのでしょうが。。。 

 

↑(何見とるんじゃ?>エロオヤジ 

 女子フィギュアスケートはストリップ・ショーじゃないぞ。。)

 

ブックオフオンライン 

iconオンライン書店 boople.com(ブープル)

| | コメント (0) | トラックバック (0)

2010年2月22日 (月)

確率と分布関数(5)(積率,母関数)

 確率と分布関数の続きです。期待値,分散などの積率を求めるための母関数の項目に入ります。

[定義7-1]:確率変数Xが離散型ならその確率分布{pj}はΣj|xj|pj<∞を満たし,Xが連続型なら分布関数は絶対連続で密度関数f(x)が存在して∫-∞|x|f(x)dx<∞を満たすとする。

 

 この条件下でXが離散型ならE[X]をE[X]≡Σjjj,Xが連続型ならE[X]≡∫-∞xf(x)dxと定義し,これを確率変数Xの期待値(expectation value)と呼ぶ。

より一般的には,スティルチェス積分を用いて∫-∞|x|dF<∞の条件下でE[X]≡∫-∞xdFと定義することもできます。

以下では,Xが連続型確率変数のときには確率密度関数f(x)が存在する場合を仮定します。

[例7-2]:Xが∫-∞|x|f(x)dx<∞を満たす連続型変数でx<0 ならF(x)=P(X≦x)=0 の正値確率変数のとき,Xの期待値はE[X]=∫0xf(x)dx=∫0{1-F(x)}dxを満たす。

(証明) ∫0xf(x)dx=limα→∞0αxf(x)dx=limα→∞[αF(α)-∫0αF(x)dx]=limα→∞[-α{1-F(α)}+∫0α{1-F(x)}dx]です。

ところが,∫0|x|f(x)dx=∫0α|x|f(x)dx+∫α|x|f(x)dx<∞ よりlimα→∞α|x|f(x)dx=0 です。

 

したがって,0≦α{1-F(α)}=α∫αf(x)dx≦∫α|x|f(x)dx → 0です。

以上から,∫0xf(x)dx=∫0{1-F(x)}dx]を得ます。(証明終わり)

[例7-3]:集合A∈Fの指示関数(定義関数)IAの期待値はE(IA)=1・P(A)+0・P(Ac)=P(A)です。

[例7-4]:特殊な離散分布の期待値 

(ⅰ)幾何分布:P(X=j)=pqj-1 (j=1,2,..;p>0,q=1-p>0) (j=0,1,2,..;p>0,q=1-p>0)の場合

 

 E[X]=Σj=1jpqj-1ですからqE[X]=Σj=1jpqj=Σj=1jpqj=Σj=2(j―1)pqj-1です。

 

 故に,(1-q)E[X]=pE[X]=p+Σj=2pqj-1=p+(1-p)=1であり,したがってE[X]=1/pを得ます。

(ⅱ)2項分布:P(X=j)=njjn-jの場合

  

 E[X]=Σj=0njjn-j=npΣj=1[(n-1)!/{(j-1)!(n-j)!}pj-1n-j=np

(ⅲ)ポアソン(Poisson)分布:P(X=j)=λjexp(-λ)/j! (j=0,1,2,..;λ>0)の場合

 

 E[X]=Σj=0jλjexp(-λ)/j!=λΣj=1λj-1exp(-λ)/(j-1)!=λ

[例7-5]:確率変数Xが正規分布:N[μ,σ2]を持つなら,その期待値はE[X]=μである。

(証明) 正規分布:N[μ,σ2]の確率密度関数はf(x)=(2π)-1/2σ-1exp{-(x-μ)2/(2σ2)}(-∞<x<∞)です。

 これについては,∫-∞|x|f(x)dx=(2π)-1/2σ-1-∞|x|exp{-(x-μ)2/(2σ2)}dx=(2π)-1/2σ-10xdx[exp{-(x-μ)2/(2σ2)}+xexp{-(x+μ)2/(2σ2)}です。

 

 変数置換すると,∫-∞|x|f(x)dx=π-1/2-μ/(√2σ)(√2σy+μ)exp(-y2)dy+π-1/2μ/(√2σ)(√2σz-μ)exp(-z2)dzより,∫-∞|x|f(x)dx<∞ です。

 そして,E[X]=∫-∞xf(x)dx=(2π)-1/2σ-1-∞xexp{-(x-μ)2/(2σ2)}dx=(2π)-1/2-∞yexp(-y2)dy+(2π)-1/2μ∫-∞exp(-y2)dy=μです。(証明終わり)

[例7-6]:特殊な連続分布の期待値

(ⅰ)指数分布:p.d.f:f(x)=λexp(-λx) (0≦x<∞;λ>0),f(x)=0 (x<0)の場合

 

 E[X]=∫-∞xf(x)dx=∫0λxexp(-λx)dx=[-xexp(-λx)] 0+∫0exp(-λx)dx=1/λ

(ⅱ)χ2分布:p.d.f:f(x)=[1/{2n/2Γ(n/2)}xn/2-1exp(-x/2) (x>0),f(x)=0 (x≦0)の場合

 

 E[X]=∫-∞xf(x)dx=[1/{2n/2Γ(n/2)}∫0n/2exp(-x/2)dx={2/Γ(n/2)}∫0n/2exp(-t)dt=2Γ(n/2+1)/Γ(n/2)=n

(ⅲ)ベータ分布:β(x;p,q):p.d.f:f(x)=Β-1(p,q)xp-1(1-x)q-1 (0<x<1,p,q>0),f(x)=0 (その他)の場合

 

 E[X]=∫-∞xf(x)dx=Β-1(p,q)∫01p(1-x)q-1dx=Β(p+1,q)/Β(p,q)=Γ(p+1)Γ(q)Γ(p+q)/[Γ(p+1+q)Γ(p)Γ(q)]=p/(p+q)

※(注1):確率変数Xの関数g(X)が確率変数となるとき,その期待値はXが離散型ならE[g(X)]=Σjg(xj)pj<∞,連続型ならE[g(X)]=∫-∞g(x)f(x)dxです。

 

 これらをまとめると,E[g(X)]=∫-∞g(x)dFです。

確率変数Xの関数g1(X),g2(X)が共に確率変数のとき,ag1(X)+bg2(X)も確率変数であり,E[ag1(X)+bg2(x)]=aE[g1(X)]+bE[g2(x)]です。

 

これを,期待値の線形性(linearity)といいます。特に,E[aX+b]=aE[X]+bです。

(証明)g1(X),g2(X)が共に確率変数のとき,ag1(X)+bg2(X)も確率変数となることは自明です。

 

 そして,E[ag1(X)+bg2(X)]=∫(ag1(x)+bg2(x))dF=a∫g1(x)dF+b∫g2(x)dF=aE[g1(X)]+bE[g2(x)]です。(証明終わり) ※

[定義7-7]:確率変数Xの関数Xk(k=1,2,..)の期待値:E[Xk]をXのk次の積率(moment)といい,これをμk'と表わす。特に,μ1'=E[X]は単にμと表記し,これをXの平均(mean)と呼ぶ。

[定義7-8]:確率変数Xの関数:(X-μ)k(k=1,2,..)の期待値μk≡E[(X-μ)k]を,Xの平均の周りのk次の積率という。

 

 特にσ2≡μ2=E[(X-μ)2]をXの分散(variance)と呼ぶ。これをVar[X]と表記することもある。さらに,σ=E[(X-μ)2]1/2=(Var[X])1/2を標準偏差(standard deviation)と呼ぶ。

※(注2):Xの分散はσ2=E[(X-μ)2]=E[X2-2μX+μ2]=E[X2]-2μE[X]+μ2=E[X2]-μ2=μ2'-μ2と表わせます。 ※

[定理7-9]:チェビシェフの不等式(Chebyshev's inequality)

 確率変数Xが平均μ,分散σ2を持つなら,任意の正の数kに対して,不等式:P(|x-μ|≧kσ)≦1/k2,あるいはP(|x-μ|≧k)≦σ2/k2が成り立つ。

(証明)σ2=E[(X-μ)2]=∫-∞(x-μ)2dF=∫-∞μ-kσ(x-μ)2dF+∫μ-kσμ+kσ(x-μ)2dF+∫μ+kσ(x-μ)2dF≧∫|x-μ|≧kσ(x-μ)2dF≧k2σ2|x-μ|≧kσdF=k2σ2P(|x-μ|≧kσ)です。

 そこで,P(|x-μ|≧kσ)≦1/k2が成立します。

 

 この式で,k=K/σと置けばP(|x-μ|≧K)≦σ2/K2を得ます。(証明終わり)

※(注3):確率変数X,Yの関数g(X,Y)が確率変数となる場合

 

 X,Yが離散型で同時確率分布がp(xi,yj)≡P(X=xi,Y=yj)で与えられるなら,g(X,Y)の期待値はE[g(X,Y)]=ΣiΣjg(xi,yj)p(xi,yj)です。

一方,X,Yが連続型で同時確率密度関数:f(x,y)が存在するとき,E[g(X,Y)]=∫-∞-∞g(x,y)f(x,y)dxdyです。

 

離散型と連続型をまとめた表現では,E[g(X,Y)]=∫g(x,y)dFと書けます。特に,E[aX+bY]=∫(ax+by)dF=aE[X]+bE[Y]です。

 

これを拡張して,一般にX1,X2,..,Xn をn個の確率変数とするとき,任意の定数:a1,a2,..,anに対して,E[Σjjj]=ΣjjE[Xj]が成立します。

また,E[XY]=∫xydF=ΣiΣjijp(xi,yj)(離散型),E[XY]=∫xydF=∫-∞-∞xyf(x,y)dxdy(連続型)と書けます。

特に,XとYが独立の場合には,X,Yが連続型のときを例に取ると,f(x,y)=fX(x)fY(y)によって,E[XY]=∫xydF=∫-∞-∞xyf(x,y)dxdy=∫-∞-∞xyfX(x)fY(y)dxdy=E[X]E[Y]となります。

 

実際にはX,Yが連続型,離散型によらずXとYが独立ならE[XY]=E[X]E[Y]が成立します。 ※

[定義7-10]:X,Yが連続型確率変数で同時確率密度関数f(x,y)が存在してfY(y)=∫-∞f(x,y)dx>0 のとき,Y=yの下でのXの条件付確率密度をf(x|y)≡f(x,y)/fY(y)とする。

 

 このとき,Y=yの下でのXの条件付期待値をEX|Y=y[X]=E[X|Y=y]≡∫-∞xf(x|y)dxで定義する。

(X,Yが離散型のときには,p(xi|yj)≡p(xi,yj)/{Σip(xi,yj)},EX|Y=yj[X]=E[X|Y=yj]=Σiip(xi|yj)である。)

 

※(注4):E[XY]=∫xydF=∫-∞-∞xyf(x,y)dxdy=∫-∞-∞xyf(x|y)fY(y)dxdy=∫-∞dyfY(y)[∫-∞xyf(x|y)dx]=∫-∞X|Y=y[XY]fY(y)dyです。

 

 すなわち,E[XY]==EY[EX|Y=y[XY]]を得ます。

一般に,E[g(X,Y)]=EY[EX|Y=y[g(X,Y)]が成立します。

 

条件付期待値については,2007年7/7の記事「条件付確率と条件付期待値」に詳述してあるのでこれ以上深入りしません。 ※

[定理7-11]:シュワルツの不等式(Schwarz's inequality)

 ,Yが2次の積率:E[X2],E[Y2]を持てば,E[XY]も存在してE[XY]2≦E[X2]E[Y2]である。

(証明)E[X2]<∞,E[Y2]<∞ ならE[X2+Y2]<∞ です。そして,|ab|≦(a2+b2)なので,E[XY]も存在します。

 

 そして,∀t∈Rについて(tX+Y)2≧0 よりE[(tX+Y)2]=t2E[X2]+2tE[XY]+E[Y2]≧0 が成立します。

 

 故に,左辺をtの2次式と見たときの判別式は非正:D/4=E[XY]2-E[X2]≦0 です。等号の成立は,確率1でY=-tXとなる,つまり確率1でXとYが比例関係にある場合だけです。(証明終わり)

[定義7-12]:E[X],E[Y],E[XY]が存在するとき,Cov[X,Y]≡E[(X-E[X])(Y―E[Y])]=E[XY]-E[X]E[Y]をXとYの共分散(covariance)という。

 

※(注5):特に,XとYが独立ならE[XY]=E[X]E[Y]なので,共分散:Cov[X,Y]=E[XY]-E[X]E[Y]=0 です。

確率変数X,YについてVar[X+Y]=E[(X+Y)2]-E[X+Y]2=E[X2]+2E[XY]+E[Y2]-{E[X]2+2E[X]E[Y]+E[Y]2}=Var[X]+Var[Y]-2Cov[X,Y]です。

一般に,n個の確率変数X1,X2,..,Xn と任意定数a1,a2,..,anに対して,Var[Σj=1njj]=Σj=1nj2Var[Xj]+2Σi>jnijCov[Xi,Xj]が成立します。

 

特に,X1,X2,..,Xn が全て独立変数なら,Var[Σj=1njj]=Σj=1nj2Var[Xj]となります。

ここで,E[Xj]=μ,Var[Xj]=σ2(j=1,2,..,n)の場合,<X>≡(X1+X2+..+Xn)/nと置けばE[<X>]=μですが,aj=1/n(j=1,2,..,n)とすれば上の等式はVar[<X>]=σ2/nを意味します。

[定義7-13]:XとYがそれぞれ平均の周りの2次の積率:Var[X]≠0,Var[Y]≠0を持つとき,ρ≡Cov[X,Y]/{Var[X]Var[Y]}1/2をXとYの相関係数(correlation coefficient)という。

ここで,XとYが独立ならCov[X,Y]=0 よりρ=0 です。これをXとYは無相関であると言うこともあります。

[定理7-14]:XとYの相関係数:ρは-1≦ρ≦1を満たす。等号はXとYの間に1次関係が存在するときに限られる。

(証明)X1=X-E[X],Y1=Y-E[Y]と置けば,Var[X]=E[X12],Var[Y]=E[Y12],Cov[X,Y]=E[X11]です。

 

 そして,[定理7-11]のシュワルツの不等式からE[X11]2≦E[X12]E[Y12]なので,Cov[X,Y]2≦Var[X]Var[Y]です。

 

 よって,Var[X]≠0,Var[Y]≠0 なら,ρ2≦1 or -1≦ρ≦1です。

[定理7-11]より,等号はX1=X-E[X]とY1=Y-E[Y]が比例関係にあるとき,つまり,aX1+bY1=0,or aX+bY=aE[X]+bE[Y]のときだけです。

 

そして,aX+bY=kなら,常にaE[X]+bE[Y]=kとなりますから,X1とY1が比例関係にあることはXとYがaX+bY=kなる1次関係を有することと同値です。(証明終わり)

[定義8-1]:実数列{aj}j=0,1,..の母関数(generating function)A(z)は次のzのベキ級数の右辺が収束するときA(z)≡Σj=0jj (|z|<R0;R0は適当な正の実数)によって定義される。

そして,離散型確率変数Xの確率分布をpj=P(X=xj)とするときG(z)=Σj=0jj=E(zX)(|z|≦1)をXの確率母関数という。

 

※(注6):(確率母関数の性質)

 

明らかに,G(1)=Σj=0j=1です。また,pj=[djG/dzj]z=0/j!=G(j)(0)/j!です。

  

G'(1)=Σj=1jpj=E[X]です。

 

さらに,G"(1)=Σj=2j(j-1)pj=Σj=02j-Σj=0jpj=E[X2]-E[X]です。それ故,E[X2]=G"(1)+G'(1),Var[X]=G"(1)+G'(1)-[G'(1)]2です。 ※

[定理8-2]:離散型確率変数Xの確率分布:pj=P(X=xj)において,{xj}j=0,1,..がx1≦x2≦..と順序付けられているとする。

 

 このとき,Qr≡P(X>x)=Σj=r+1jと定義すると{Qr}r=0,1,..の母関数Q(z)=Σr=0rrと,確率母関数G(z)=Σj=0jjの間に式:Q(z)={1-G(z)}/(1-z)が成り立つ。

(証明):Q(z)=Σr=0rr=Σr=0rj=r+1j)=Σj=1r=0j-1r)pj=(1-z)-1Σj=1(1-zj)pj={1-G(z)}/(1-z)です。(証明終わり)

[定理8-2の系]:E[X]=G'(1)=lim z→1{G(z)-G(1)}/(z-1)=limz→1Q(z)である。

 

※(注7):1,X2,..,Xkが互いに独立な確率変数なら,X≡X1+X2+..+Xkの確率母関数G(z)はG(z)=E[zX]=E[zX1+X2+..+Xk]=E[zX1]E[zX2]..E[zXk]=Πj=1kXj(z)となります。

 

 特に,X1,X2,..,Xkが全て同一の分布を持つ独立変数列ならGX1(z)=GX2(z)=..=GXk(z)より,G(z)=[GX1(z)]kです。 ※

[例8-3]:X1,X2,..,Xkが互いに独立で,次の同一分布pjを持つ確率変数のとき,X≡Σj=1kj=X1+X2+..+Xkの確率母関数:G(z),および確率分布:Pjを求めます。

(ⅰ)pj=pj1-j(j=0,1;0<p<1,q=1-p),pj=0 (その他)

(解)GXj(z)=q+pz,故に,G(z)=(q+pz)kkjjk-jj,sこで確率分布はPjkjjk-j=b(x;k,p)(2項分布)

(ⅱ)pj=exp(-λ)λj/j! (j=0,1,2,..)のポアソン分布(パラメータλ>0) 

(解)GXj(z)=exp(-λ)Σj=0λjj/j!=exp(-λ)exp(λz)=exp{-λ(1-z)},故にG(z)=exp{-kλ(1-z)}=exp(-kλ)Σj=0(kλ)jj/j!です。

 

 そこで,Xの確率分布はPj=exp(-kλ)(kλ)j/j!(パラメータkλのポアソン分布)になります。

(ⅲ)pj=pqj (j=0,1,2,..;p>0,q=1-p>0) (幾何分布) 

(解)GXj(z)=pΣj=0jj=p/(1-qz),故にG(z)=pk(1-qz)-k=Σj=0{(k-1+j)..(k+1)k/j!}pkjj,

 

 そこで,Xの確率分布はPjk-1+jkkjです。

[例8-4]:(複合分布){Xj,1≦j≦N}を共通な確率分布:pi;i=0,1,2,..,および確率母関数:GX(z)を持つ独立離散確率変数とする。

 

 Nは全てのXjと独立な離散確率変数で確率分布:φ(n),n=1,2,..,と確率母関数GN(z)を持つとき,Y≡X1+X2+..+XNの確率母関数:GY(z),およびE[Y],Var[Y]を求める。

(解)p(k,n)≡P(Y=k,N=n)と置けば,p(k|n)=p(k,n)/φ(n),or p(k,n)=p(k|n)φ(n)です。故にP(Y=k)=Σn=1p(k,n)=Σn=1p(k|n)φ(n)です。

 ところが,p(k|n)=P(X1+X2+..+Xn=k)なので,P(Y=k)=Σn=1P(X1+X2+..+Xn=k)φ(n)です。

それ故,GY(z)=E[zY]=ΣkkP(Y=k)=Σn=1ΣkkP(X1+X2+..+Xn=k)φ(n)=Σn=1E[zX1+X2+..Xn]φ(n)です。

 

ところが,{Xj,1≦j≦n}は独立確率分布なので,(注7)で述べたようにE[zX1+X2+..Xn]={E[zX1]}n={GX(z)}nです。

 したがって,結局,GY(z)=E[zY]=E[zX1+X2+..XN]=Σn=1{GX(z)}nφ(n)=GN[GX(z)]なる合成確率母関数が得られます。

 これから,GY'(z)=dGY/dz=(dGY/dGx)(dGX/dz)=GN'[GX(z)]GX'(z)です。

 

 GX(1)=GN(1)=1,GN'(1)=E[N],GX'(1)=E[X]ですから,E[Y]=GY'(1)=GN'(1)GX'(1)=E[N]E[X]が得られます。

 さらに,GY"(z)=GN"[GX(z)]{GX'(z)}2+GN'[GX(z)]GX"(z)より,GY"(1)=GN"(1){GX'(1)}2+GN'(1)GX"(1)です。

そして,Var[Y]=GY"(1)+GY'(1)-{GY'(1)}2です。

 

右辺=GN"(1){GX'(1)}2+GN'(1)GX"(1)-{GN'(1)GX'(1)}2=[GN"(1)+GN'(1)-{GN'(1)}2]{GX'(1)}2+GN'(1)[GX"(1)+GX'(1)]-{GX'(1)}2]です。

 

以上から,Var[Y]=Var[N]{E[X]}2+E[N]Var[X]を得ます。

ここでまた一休みします。(つづく)

参考文献:藤沢武久 著「新編 確率・統計」(日本理工出版会)

  

ブックオフオンライン 

iconオンライン書店 boople.com(ブープル)

| | コメント (2) | トラックバック (0)

2010年2月19日 (金)

確率と分布関数(4)(特殊分布(連続))」

 確率と分布関数の続きです。重要な連続確率分布の例を考えます。

[定義6-1]:一様分布(uniform distribution)

 

 確率密度(p.d,f)がf(x)=1/(b-a)(a≦x≦b),f(x)=0 (その他),分布関数(d.f)F(x)=∫-∞xf(x)dxがF(x)=0 (x<a),F(x)=(x-a)/(b-a) (a≦x≦b),F(x)=1 (x>b)で与えられる確率分布を一様分布という。

[例6-2]:確率変数X,Yのj.p.d.fがf(x,y)=1 (0≦x≦1,0≦y≦1),f(x,y)=0 (それ以外)であるとき,

同時分布関数(m.d.f)はF(x,y)=∫-∞xdu∫-∞ydvf(u,v)より,F(x,y)=1 (x≧1,y≧1),F(x,y)=y (x≧1,0≦y≦1),F(x,y)=x (0≦x≦1,y≧1),F(x,y)=xy (0≦x≦1,0≦y≦1), F(x,y)=0 (その他)です。

 周辺分布関数はFX(x)=limy→∞F(x,y),FY(y)=limx→∞F(x,y)より,FX(x)=1(x≧1),FX(x)=x (0≦x≦1),FX(x)=0 (その他),およびFY(y)=1(y≧1),FY (y)=y (0≦x≦1),FY(y)=0 (その他)です。

[定義6-3]:正規分布(normal distribution),またはガウス分布(Gaussian distribution)

確率密度(p.d,f)がf(x)=(2π)-1/2σ-1exp{-(x-μ)2/(2σ2)}(-∞<x<∞,σ>0 とμは定数)で,分布関数(d.f)がF(x)=(2π)-1/2σ-1-∞xexp{(y-μ)2/(2σ2)}dyで与えられる連続確率分布を正規分布といい,N[μ,σ2]で表わす。

特にμ=0,σ2=1の正規分布:N[0,1]を標準正規分布という。これのp.d,f:φ(u)はφ(u)=(2π)-1/2exp(-u2/2)である。

確率変数Xが分布N[μ,σ2]を持つなら,U≡(X-μ)/σは分布N[0,1]を持ちます。

[定理6-4]:x>0 のとき,標準正規分布関数:Φ(x)=(2π)-1/2-∞xexp(-u2/2)duは(2π)-1/2(1/x-1/x3)exp(-x2/2)<1-Φ(x)<(2π)-1/2(1/x)exp(-x2/2)なる不等式を満たす。

(証明) (d/dx){(1/x)exp(-x2/2)}=-(1+1/x2)exp(-x2/2)なので(1/x)exp(-x2/2)=∫x(1+1/u2)exp(-u2/2)du>∫xexp(-u2/2)duです。

また,(d/dx){(1/x3)exp(-x2/2)}=-(1/x2+4/x4)exp(-x2/2)より,(d/dx){(1/x-1/x3)exp(-x2/2)}=-(1-4/x4)exp(-x2/2)です。

 

故に,(1/x-1/x3)exp(-x2/2)=∫x(1-4/u4)exp(-u2/2)du<∫xexp(-u2/2)duです。

(2π)-1/2xexp(-u2/2)du=1-Φ(x)ですから,(2π)-1/2(1/x-1/x3)exp(-x2/2)<1-Φ(x)<(2π)-1/2(1/x)exp(-x2/2)が得られます。(証明終わり)

この定理からxが大きいときには,1-Φ(x)≒(2π)-1/2(1/x)exp(-x2/2)と近似できることがわかります。

正規分布N[μ,σ2]では,p.d.fが偶関数なのでP(-u0≦U≦u0)=2P(0≦U≦u0)(u0>0)です。この式でu0→∞とすると,P(U>0)=P(U≧0)=1/2を得ます。

 

一方,総確率が1であるという性質からP(U≦u)=1-P(U>u)なので,P(U≦0)=1/2も得られます。

そこで,P(U≦u0)=P(U≦0)+P(0≦U≦u0)=1/2+P(0≦U≦u0),すなわちP(0≦U≦u0)=P(U≦u0)-1/2です。

標準正規分布N[0,1]を持つ確率変数(random variable):Uに対してはΦ(u0)=P(U≦u0)ですから,P(0≦U≦u0)=(2π)-1/20u0 exp(-u2/2)du=Φ(u0)-1/2です。これの近似値を表示したものは正規分布表として種々の資料に載っています。 

それによると,特にP(-1≦U≦1)≒0.683,P(-2≦U≦2)≒0.954,P(-3≦U≦3)≒0.997であることがわかります。

[定義6-5]:関数:erf(x)≡(2π)-1/20x exp(-v2)dvを誤差関数(error function)という。

erf(x)=(2π)-1/20x exp(-v2)dv=(2π)-1/22-1/20√2xexp(-u2/2)du=2{Φ(21/2x)-1/2}=2Φ(21/2x)-1です。

[定義6-6]:指数分布(exponential distribution)

確率変数:Xのp.d,fがf(x)=λexp(-λx)(0≦x<∞),f(x)=0 (x≦0)で,d.fF(x)=∫-∞xf(t)dtがF(x)=1-exp(-λx)(0≦x<∞),F(x)=0 (x≦0)で与えられるとき,Xはパラメータλの指数分布を持つという。

[定理6-7]:確率変数:Xが指数分布を持つとき,P(X>(x+y)|X>x)=P(X>y)(マルコフ(Markov)性)が成り立つ。

(証明)P(X>(x+y)|X>x)=P(X>(x+y),X>x)/P(X>x)=P(X>(x+y))/P(X>x)=∫x+yλexp(-λt)dt/∫xλexp(-λt)dt=exp{-λ(x+y)}/ exp(-λx)=exp(-λy)=∫yλexp(-λt)dt=P(X>y) (証明終わり)

[定理6-8]:確率変数:Tの分布関数:F(t)=P(T≦t)がP(T>(t+s)|T>s)=P(T>t)を満たすなら,t≧0 においてはある定数λ>0が存在してF(t)=1-exp(-λt)である。

(証明) P(T>(t+s)|T>s)=P(T>t)を分布関数F(t)で表わすせば1-F(t+s)={1-F(t)}{1-F(s)}です。

(t)≡log{1-F(t)}と置けばz(0)=0 でz(t+s)=z(t)+z(s)で 0≦F(t)≦1ですからz(t)≦0 です。t≧0 においてこれを満たす連続関数z(t)はz(t)=-λt(λ=-z(1)>0)だけです。

故にF(t)=1-exp(-λt) (λ>0)が得られます。(証明終わり)

[定理6-9]:確率変数:XがlimΔx→0P(x<X<x+Δx|X>x)/Δx=η(x),P(X>0)=1を満たすなら,Xの分布関数F(x)はF(x)=1-exp{-∫0xη(t)dt} (x>0),F(x)=0 (x≦0)である。

(証明)η(x)=limΔx→0[{F(x+Δx)-F(x)}/Δx]/{1-F(x)}=(dF/dx)/1-F(x)}=-d[log{1-F(x)}/dx,そしてF(0)=1-P(X>0)=0です。

 

 それ故,log{1-F(x)}=-∫0xη(t)dtを得ます。したがって,x>0 のとき,F(x)=1-exp{-∫0xη(t)dt}です。(証明終わり)

 上述の確率変数:Xを部品の寿命と見なすときにはη(x)を故障率関数と呼びます。η(x)=f(x)/{1-F(x)}ですから,Xの分布がパラメータλの指数分布ならη(x)=λ(一定)(x>0)となります。

[例6-10]:Xのp.d,fとしてf(x)=αλxα-1exp(-λxα) (x>0,α>0,λ>0),f(x)=0 (その他)を持つ分布をワイブル分布(Weibull distribution)といいます。

これのd.fはF(x)=∫-∞xf(t)dt=1-exp(-λxα) (x>0),F(x)=0 (x≦0)です。

このワイブル分布では,故障率関数は一般に一定ではなくて,η(x)=f(x)/1-F(x)}=αλxα-1です。

しかし,もしもα=1ならワイブル分布は指数分布に一致しますから,η(x)=λ(一定)です。また,α>1なら故障率η(x)は増加関数で, 0<α<1なら減少関数です。

[定理6-11]:ある事象εの発生がパラメータλのポアソン(Poisson)分布(離散分布の1つ)を持つとき,発生間隔Tは同じパラメータλの指数分布を持つ。

 

 (これは単位時間当たりの平均発生個数がλのポアソン過程です。)

(証明)前記事でのポアソン過程の考察において,時刻 0≦t1<t2に対し(t1,t2)内にj個が発生する事象をNj(t1,t2)と定義しました。

 

 このとき,時間間隔(0,t)内にj個が発生する確率はPj(t)=P[Nj(0,t)]であってPj(t)=(λt)jexp(-λt)/j! (j=0,1,2,..)とポアソン分布で与えられることを見ました。

そこで,発生間隔Tがxより大きい確率はP(T>x)=P(N0(0,x))=P0(x)=exp(-λx)となります。

 

したがって,発生間隔:Tのp.d.fをf(x)とすると,d.fがF(x)=P(T≦x)=1-P(T>x)=1-exp(-λx)なのでf(x)=dF/dx=λexp(―λx)です。(証明終わり)

[定義6-12]:ガンマ分布:γ(x;α,λ) 

 確率変数Xのp.d,fがf(x)={1/Γ(α)}λαα-1exp(-λx) (x>0,α>0,λ>0),f(x)=0 (その他)で与えられるとき,Xはパラメータ(α,λ)のガンマ分布を持つといい, γ(x;α,λ)で表わす。

ここに,Γ(α)はEulerのガンマ関数でΓ(α)≡∫0exp(-t)tα-1dt(α>0)で定義されます。

ガンマ分布はα=n/2,λ=1/2のときは後述する自由度nのχ2分布(カイ二乗分布)のp.d,fになります。

[定理6-13]:X1,X2,..,Xαが互いに独立な確率変数であり,これらが共通のパラメータλの指数分布を持つなら,Σk=1αk=X1+X2+..+Xαはパラメータ(α,λ)のガンマ分布を持つ。

(証明) まず,α=1のときX1はパラメータλの指数分布を持ちますが,これはパラメータ(1,λ)のガンマ分布です。

 いま,αまで定理が成立するとしてZ≡Σk=1αk+Xα+1と置き,これのp.d.fを求めます。X=Xα+1,Y=Σk=1αkと置くと仮定によってYのp.d.fはfY(y)={1/Γ(α)}λαα-1exp(-λy)です。

 Z=X+Y,T=YとしてZ,Tのj.p.d.fを求めるとX=Z-T,Y=Tかつ|J|=1であり,XとYは独立なのでfZT(z,t)=fX(x)fY(y)=fX(z-t)fY(t)です。

 

 そこで,fZ(z)=∫-∞X(z-t)fY(t)dtです。

これを計算すると,fZ(x)=∫0xλexp{-λ(x―t)}fY(t)dt=∫0x{1/Γ(α)}λα+1α-1exp(-λx)dt={1/Γ(α+1)}λα+1αexp(-λx)を得ます。

以上から,帰納法によって全てのαについて定理の結論の成立することが示されました。(証明終わり)

確率変数Xがガンマ分布を持つとき,そのp.d,fはf(x)={1/Γ(α)}λαα-1exp(-λx) (x>0)です。u=λxと置けば確率変数U=λxのp.d.fはf(u)={1/Γ(α)}uα-1exp(-u) ) (u>0)となります。

[定義6-14]:χ2分布(chi-squared distribution)

 .d.fがf(x)=[1/{2n/2Γ(n/2)}xn/2-1exp(-x/2) (x>0),f(x)=0 (x≦0)で与えられる連続確率分布を自由度nのχ2分布(カイ二乗分布)という。

 これは,先のガンマ分布のp.d,f:f(x)={1/Γ(α)}λαα-1exp(-λx)(x>0),f(x)=0 (x≦0)において,α=n/2,λ=1/2としたものと同じです。つまりγ(x;n/2,1/2)ですね。

[定理6-15]:X1,X2,..,Xnが全て標準正規分布を持つn個の独立確率変数ならば,χ2≡Σj=1nj2=X12+X22+..+Xn2は自由度nのχ2分布を持つ。

(証明)X12のp.d.fをp1(y)と書けば,y>0 のときはy=x2,x=±y1/2,|dx/dy|=1/(2y1/2)を(2π)-1/2exp(-x2/2)に代入してp1(y)=(2π)-1/2-1/2exp(-y/2)(y>0),p1(y)=0 (y≦0)なる陽な表式を得ます。

 

 Γ(1/2)=π1/2によって,これは自由度1のχ2分布です。

 また,X12+X22のp.d.fをp2(x)と置けばp2(x)=∫-∞1(x-y)p1(y)dy=(2π)-10x(x-y)-1/2exp{-(x-y)/2}y-1/2exp(-y/2)dyです。

 

 すなわち,p2(x)=(2π)-1exp(-x/2)∫0x(xy-y2)-1/2dyです。ところが,∫0x(xy-y2)-1/2dy=∫0x{x2/4-(y-x)2}-1/2dy=πです。

 

 そこで,p2(x)=2-1exp(-x/2) (x>0),p1(x)=0 (x≦0)を得ますが,Γ(1)=1によりこれは自由度2のχ2分布です。

 次に,(ⅰ)n=2kのとき,m=1,2,..,kについて,p2m(x)=[1/{2mΓ(m)}xm-1exp(-x/2) (x>0)が全て成立すると仮定します。

 

 すると,p2k+2(x)=∫-∞2(x-y)p2k(y)dy=[1/{2k+1Γ(k)}exp(-x/2)∫0xk-1dy=[1/{2k+1Γ(k+1)}xkexp(-x/2)(x>0)を得ます。

 

 m=(k+1)でもp2m(x)=[1/{2mΓ(m)}xm-1exp(-x/2) (x>0)が示されたわけです。

 一方,(ⅱ)n=2k-1のときにも,m=1,2,..,kについてp2m-1(x)=[1/{2m-1/2Γ(m-1/2)}xm-3/2exp(-x/2) (x>0)が成立すると仮定します。

 

 すると,p2k+1(x)=∫-∞2(x-y)p2k-1(y)dy=[1/{2k+1/2Γ(k-1/2)}exp(-x/2)∫0xk-3/2dy=[1/{2k+1/2Γ(k+1/2)}xk-1/2exp(-x/2)(x>0)を得ます。やはり,帰納法の仮定からm=(k+1)でも同じ式の成立することが導かれます。(証明終わり)

上記の証明で用いた式pn(x)=[1/{2n/2Γ(n/2)}xn/2-1exp(-x/2) (x>0)についてP(χ2>χα,n2)=∫χα,n^2∞pn(x)dx=αを満たすχα,n2の値の数表をχ2分布表といいます。

[定理6-15の系]:X1,X2,..,Xnが全て正規分布N[μ,σ2]を持つn個の独立確率変数ならばΣj=1n{(Xj-μ)22}は自由度nのχ2分布を持つ。(証明は略:Uj≡(Xj-μ)/σがN[0,1]に従うので自明)

[定義6-16]:t分布,またはStudent分布(W.Goset(1908)による)

 .d.fがf(t)=[Γ((n+1)/2)/{(nπ)1/2Γ(n/2)}](1+t2/n)-(n+1)/2 (-∞<t<∞)の確率分布を自由度nのt分布という。

[定理6-17]:確率変数XとYが独立でXがN[0,1],Yが自由度nのχ2分布を持つならばT≡X/(Y/n)1/2は自由度nのt分布を持つ。

(証明)Z≡(Y/n)1/2と置くとfY(y)=[1/{2n/2Γ(n/2)}]yn/2-1exp(-y/2) (y>0)でz=(y/n)1/2よりy=nz2,dy/dz=2nzなのでZのp.d.fはfZ(z)=[nn/2/{2n/2-1Γ(n/2)}]zn-1exp(-nz2/2) (z>0)となります。

さらにT≡X/ZよりW≡Zと置けば(X,Z)=(WT,W)でJ≡∂(x,z)/∂(t,w)=wです。

XZ(x,z)=f(x)f(z)=(2π)-1/2exp(-x2/2)[nn/2/{2n/2-1Γ(n/2)}]zn-1exp(-nz2/2) (-∞<x<∞,z>0)ですからfTW(t,w)=(2π)-1/2exp{-(tw)2/2}[nn/2/{2n/2-1Γ(n/2)}]wnexp(-nw2/2) (-∞<t<∞,w>0)を得ます。

それ故,fT(t)=∫0 (2π)-1/2exp{-(tw)2/2}[nn/2/{2n/2-1Γ(n/2)}]wnexp(-nw2/2)dw=[1/{2(n-1)/2π1/2Γ(n/2)}]∫0(n1/2w)nexp{-w2(n+t2)/2}dwです。

u=w2(n+t2)/2と置換すればdu=w(n+t2)dwでw=(2u)1/2(n+t2)-1/2です。dw=(2u)-1/2(n+t2)-1/2duですね。

 

そこで,fT(t)=[1/(nπ)1/2Γ(n/2)]](1+t2/n)-(n+1)/20(n+1)/2-1exp(-u)du=[Γ((n+1)/2)/{(nπ)1/2Γ(n/2)}](1+t2/n)-(n+1)/2 (-∞<t<∞)を得ます。(証明終わり)

t分布のp.d.f:fT(t)=[Γ((n+1)/2)/{(nπ)1/2Γ(n/2)}](1+t2/n)-(n+1)/2はオイラーのベータ関数Β(p,q)≡Γ(p)Γ(q)/Γ(p+q)を用いると,fT (t)=n-1/2Β-1(1/2,n/2)(1+t2/n)-(n+1)/2と表わすこともできます。

T(-t)=fT(t)(偶関数)ですから,分布関数ではP(T>-t)=P(T≦t)ですが,P(T>-t)=1-P(T≦-t)ですからP(T≦-t)=1-P(T≦t)です。

 

そこで,P(|T|≦t)=P(―t≦T≦t)=P(T≦t)-P(T≦-t)=2P(T≦t)-1です。

通常,資料に載っているt分布表では自由度nとα=P(|T|>t*)を与えたときのt*値が与えられています。

[定義6-18]:ベータ分布:β(x;p,q)

 .fがF(x)=Β-1(p,q)∫0xp-1(1-u)q-1du (0<x<1,p,q>0),F(x)=0 (その他)であるような確率分布をベータ分布といいβ(x;p,q)で表わす。

Β(p,q)はオイラー(Euler)のベータ関数:Β(p,q)≡Γ(p)Γ(q)/Γ(p+q)ですが,これはΒ(p,q)=∫01p-1(1-u)q-1du (p,q>0)と表わすこともできます。(証明略)

[定理6-19]:独立な確率変数X,Yがそれぞれp.d.fとしてパラメータ(p,λ),(q,λ)のベータ分布を持つならZ≡X/(X+Y)はベータ分布β(z;p,q)を持つ。(証明略)

[定義6-20]:F分布(スネデカー(Snedecor,G.W)の分布)

確率変数Xのp.d.fがfU(x)=Β-1(m/2,n/2)(m/n)m/2-1m/2-1[1+(m/n)x]-(m+n)/2 (x>0),fU(x)=0 (x≦0)の場合,この分布を自由度(m,n)のF分布という。

[定理6-21]:確率変数X,Yがそれぞれ自由度m,nのχ2分布を持てばU≡(X/m)/(Y/n)は自由度(m,n)のF分布を持つ。

(証明)u=(x/m)/(y/n),v=yと置けば(x,y)=(muv/n,v)であり,∂(x,y)/∂(u,v)=mv/nです。

 

 また,f(x)=[1/{2m/2Γ(m/2)}]xm/2-1exp(-x/2) (x>0),fY(y)=[1/{2n/2Γ(n/2)}]yn/2-1exp(-y/2) (y>0)でx>0,y>0 はv>0 に対応します。

UVの同時確率密度はfV(u,v)=f(x)fY(y)|∂(x,y)/∂(u,v)|=[1/{2(m+n)/2Γ(m/2)Γ(n/2)}](m/n)m/2-1(uv)m/2-1n/2-1exp{-muv/(2n)-v/2}(mv/n) (v>0)です。

故に,f(u)=[(m/n)m/2/{2(m+n)/2Γ(m/2)Γ(n/2)}um/2-10(m+n)/2-1exp{-(1+mu/n)v/2}]dvです。

t=(1+mu/n)v/2と置けば,dt=(1+mu/n)dv/2です。以下略..でfU(u)=Β-1(m/2,n/2)(m/n)m/2-1m/2-1[1+(m/n)u]-(m+n)/2 (u>0)を得ます。(証明終わり)

※F分布はベータ分布β(x;p,q)=Β-1(p,q)xp-1(1-x)q-1においてp=m/2,q=n/2と置いたβ(x;m/2,n/2)=Β-1(m/2,n/2)xm/n-1(1-x)n/2-1 (x>0)で,u=(n/m)x/(1-x) or x=(m/n)u/{1+(m/n)u}と変換したものに一致します。

また,自由度が1のχ2分布は標準正規分布[0,1]ですから,U=(X/1)/(Y/n)は,[定理6-17]でXとYが独立でXがN[0,1],Yが自由度nのχ2分布を持つならT≡X/(Y/n)1/2がt分布を持つとしたときのT2に一致しています。

 

つまり,T2=(X/1)/(Y/n)ですが,今の定理からこれは自由度(1,n)のF分布を持つことがわかります。※

[定理6-22]:確率変数:Uが自由度(m,n)のF分布を持つなら変数:1/Uは自由度(n,m)のF分布を持つ。

(証明)Uのp.d.fがfU(u)=Β-1(m/2,n/2)(m/n)m/2-1m/2-1[1+(m/n)u]-(m+n)/2 (u>0)のとき,V≡1/Uとおくとv=1/uよりu=1/vでdu=dv/v2です。

 

 そこで,fV(v)=fU(1/v)/v2=Β-1(n/2,m/2)(m/n)m/2-1-m/2-1[1+m/(nv)]-(m+n)/2=Β-1(n/2,m/2)(n/m)m/2-1n/2-1[1+(n/m)v]-(n+m)/2 (v>0)を得ます。

 これは自由度(n,m)のF分布のp.d.fです。(証明終わり)

[定理6-22の系]:X,およびYがそれぞれ自由度(m,n),および(n,m)のF分布を持つとき,任意のx>0 に対してP(X≦x)=1-P(Y<(1/x))が成り立つ。

(証明)Yは自由度(n,m)のF分布を持つので1/Yは自由度(m,n)のF分布を持ちます。故にP((1/Y)>x)=P(X>x)です。したがってP(X≦x) =1-P(X>x)=1-P(Y<(1/x))です。(証明終わり)

※F分布:fU(u)=Β-1(m/2,n/2)(m/n)m/2-1m/2-1[1+(m/n)u]-(m+n)/2 (u>0)において,特にm=1,u=t2と置けばdu/dt=2tよりTのp.d.fはf(t)=2Β-1(1/2,n/2)n1/2(1+t2/n)-(n+1)/2とt分布になります。

 

 ただし,u=t2>0 にはt=u1/2>0 とt=-u1/2<0 の2つのtが対応するため,t>0 の分布とすれば余分な因子2があります。※

[定理6-23]:自由度nのt分布のp.d.fをfn(x)と表わすと,nが大きい極限ではlimn→∞n(x)=(2π)-1/2exp(-x2/2)(=標準正規分布N[0,1])となり,t分布は正規分布N[0,1]に収束する。(これは中心極限定理の一例です。)

(証明)fn(x)=[Γ((n+1)/2)/{(nπ)1/2Γ(n/2)}](1+x2/n)-(n+1)/2=π-1/2[Γ((n+1)/2)/{n1/2Γ(n/2)}]{(1+x2/n)n/x^2}-(n+1)x^2/(2n)→π-1/2exp(-x2/2) as n→∞は明らかです。(証明終わり)

なんかこう教科書を読んで定義,定理,証明とやっていると,行間を埋めながらもブログというより全部書き写しているという感があって大丈夫かな?とも考えます。

しかし,(応用)数学の教科書というのは歴史的に得られた既知の知見の羅列(ある意味ではパクリの連続)であって,それを公開とはいえ個人の日記でかいつまんで紹介しているだけのことですからこれもアリかなと思います。

今日はここで終わります。(つづく)

参考文献:藤沢武久 著「新編 確率・統計」(日本理工出版会)

PS:藤田まことさんが死んだから言うわけじゃないが,地球の大多数の人にとっては明日もまたほぼ確実に太陽が昇って日常が始まるのでしょうが,ある人々にとっては明日はもう太陽は昇らないかも知れません。

 

 少なくともある程度の未来への展望が開けていて明日もまた太陽が昇ると信じられるからこそ,精神の矜持が保たれるのだと思います。

 

 これまで続いてきた人生が明日にも突然途絶えるかも知れないという心境であれば,普通人の心境はどうなるのでしょう。もしも病気か寿命でわずかしかない余命をハッキリ宣告されたとしたら,私だったらどういう心境になるでしょうか?

 

 私事では,不摂生な私への脅かしや冗談もあるのでしょうが,これまで病院へ行って持病の診察を受けるといつ死んでもおかしくない体であると言われたり,入院など医者の勧めを断るとその旨を書いたカルテにサインを要求されたりもしてきています。

 

 現実には3年前の手術のときから,前記のように明日の太陽が昇るかどうか?が結構気になって,あるかもわからない将来についてあくせく考えることが少なくなり,今日明日の1日や2日の取るに足りない程度のことなら真面目に悩むことも比較的少なくなりました。

 

 生き物としては生命力の喪失だし悲しいことです。無常ですね。。

  

 藤田まことさんに。。合掌 

ブックオフオンライン 

iconオンライン書店 boople.com(ブープル)

| | コメント (5) | トラックバック (0)

2010年2月16日 (火)

確率と分布関数(3)(確率変数の関数,特殊分布(離散))

 確率と分布関数の続きです。

 Xを(Ω,,P)の確率変数とするとき,

∀y∈Rに対して{ω∈Ω|g(X(ω))≦y}∈が成り立つならば,

Y≡g(X)もまた確率変数です。

 

この確率変数Xの関数Yの確率変数としての分布を考えます。

[例4-1]:X,Y=g(X)の分布関数,および確率密度関数を,

それぞれFX(X),FY(Y),およびfX(X),fY(Y)とします。

 

 Xの分布:FX(X),fX(X)は既知とします。

(ⅰ)g(x)=ax+b (a≠0)の場合

分布関数はFY(Y)=P(Y≦y)=P(g(X)≦y)

=P(aX+b≦y)です。

そこで,これは

 

a>0 ならFY(Y)=P(X≦(y-b)/a)=FX((y-b)/a),

a<0 ならFY(Y)=P(X≧(y-b)/a)=1-FX((y-b)/a)

 

です。

 密度関数は,fY(Y)=dFY/dYより,

 a>0 ならfY(Y)=(1/a)fX((y-b)/a),

 a<0ならfY(Y)=-(1/a)fX((y-b)/a) です。

(ⅱ)g(x)=x2,つまりY=X2の場合

 

Y(Y)=P(X2≦y)より,分布関数は, 

y≧0 なら,

Y(Y)=P(-y1/2≦X2≦y1/2)=FX(y1/2)-Fx(-y1/2), 

y<0 なら,FY(Y)=0

 

となります。

そこで,密度関数は,

 

y≧0 ならfY(Y)=dFY/dY=(1/2){fX(y1/2)+fX(-y1/2)},

y<0 ならfY(Y)=0 です。

[定理4-2]:gが連続関数で狭義単調関数,かつ微分可能なら,

確率変数Y=g(X)の確率密度関数(p.d.f.):fY(y)は,

Y(y)=fX(g-1(y))|dg-1(y)/dy|で与えられる。

(y=g(x)が狭義単調関数というのは,逆関数の値x=g-1(y)が確定しない停留点が存在しないという意味です。) (証明略)

(注);先の例のg(x)=x2,つまりY=X2の場合:

gは狭義単調関数ではないので,狭義単調な区間への場合分けが必要でした。※

[例4-3]:Xのp.d.f.fX(x)が,

 0<x<∞に対してはfX(x)=[1/{2n/2Γ(n/2)}xn/2-1exp(-x/2),

それ以外のxに対してはfX(x)=0 ,つまり,自由度nのχ2分布(カイ二乗分布)の場合,

 

Y=X1/2のp.d.fを求めます。

y=g(x)=x1/2の逆関数はx=g-1(y)=y2です。

そしてdg-1(y)/dy=dx/dy=2yです。

これをfy(y)=fx(g-1(y))|dg-1(y)/dy|に代入すると,

 

0<y<∞に対してfY(y)=[2/{2n/2Γ(n/2)}yn-1exp(-y2/2),

それ以外のyに対してfY(y)=0  です。

[例4-4]:Xのp/d.f.がfX(x)=(2π)-1/2exp(-x2/2) ])(-∞<x<∞) (標準正規分布:N[0,1])の場合を考えます。

(ⅰ)Y=X2のp.d.f.を求める。

y>0 のときy=g(x)=x2とおけば,

 

xの区間(-∞,0)に対応するものはx=g-1(y)=-y1/2で,

dx/dy=-(1/2)y-1/2,

 

xの区間(0,∞)に対応するものはx=g-1(y)=y1/2で,

dx/dy=(1/2)y-1/2 です。

これらは共にy~y+dyに対応する密度関数に寄与するため,両者の寄与の和を取れば,

 

Y(y)=(2π)-1/2{|-(1/2)y-1/2|exp(-y/2)+|(1/2)y-1/2|exp(-y/2)}=(2π)-1/2-1/2exp(-y/2)となります。

 

y<0 のときはfY(y)=0 です。

また,y=0 のときは,分布関数がFY(0)=P(X2≦0)=0,

 

そして,Δy>0 ならFY(Δy)=FY(Δy)=FX((Δy)1/2)-FX(-(Δy)1/2)=(2π)-1/2exp(-Δy/2)(Δy)1/2 ~(2π)-1/2(Δy)1/2

です。

そこで,FY(y)のy=0 における右導関数が存在して,

それは[dFY/dy]y=+0=limΔy→+0{(2π)-1/2(Δy)-1/2}Δy=+0→ ∞

です。一方,左導関数はゼロです。

結局,fY(y)=(2π)-1/2-1/2exp(-y/2)(y>0),

Y(y)=0 (y<0)です。

 

y=0 では,分布関数はゼロで有限ですが密度関数は定義できません。

 

これは後述する自由度が1のχ2分布です。

(ⅱ)Y=|X|のp.d.f.

y≧0 のとき,y=g(x)=|x|とおけば,

xの区間(-∞,0)に対応するものは

x=g-1(y)=-yで,dx/dy=-1,

 

xの区間[0,∞)に対応するものは

x=g-1(y)=yで,dx/dy=1 です。

y ~y+dyに対応する密度関数への寄与の和として,

Y(y)=2(2π)-1/2exp(-y2/2)を得ます。

y<0 のときはfY(y)=0 です。

[定理4-6]:同時確率密度関数(j.p.d.f.)としてf(x1,x2,..,xn)を持つn個の連続確率変数X1,X2,..,Xn.の関数:Y1,Y2,..,Yn

;Yj=gj(X1,X2,..,Xn)(j=1,2,..,n)

 のj.p.d.f.は,

Y1..Yn (y1,..,yn)=f(g1-1(y1,..,yn),..,gn-1(y1,..,yn))|J|によって与えられる。

 ここでJは次式で定義されるJacobian(ヤコービアン):J≡det{∂(g1-1,g2-1,..,gn-1)/∂(y1,y2,..,yn)}である。

(注):定理はn個の連続確率変数X1,X2,..,Xnのr≦n個の関数Y1,Y2,..,Yr;Yj=gj(X1,X2,..,Xn)(j=1,2,..,r)のr=nの場合のみに対するものです。

 

 しかし,もしもr<nに対してのj.p.d.f.を求めたい場合には残りの(n-r)個の変数としてYr+1=Xr+1,..Yn=Xnを加えてn個の変数にすれば上記の定理を使えます。

 すなわち,密度関数はf(x1,x2,..,xn)dx1dx2..dxn=f(x1,x2,..,xn){∂(x1,x2,..,xn)/∂(y1,y2-1,..,yn)}dy2..dyn=fY1..Yn(y1,..,yn)dy1dy2..dynを満たします。

r<nでyr+1=xr+1,..yn=xnなら,

 

f(x1,x2,..,xn)dx1dx2..dxn=f(x1,x2,..,xn){∂(x1,x2,..,xn)/∂(y1,y2-1,..,yn)}dy1dy2..dyrdxr+1..dxnより,

 

f(x1,x2,..,xn)dx1dx2..dxr=f(x1,x2,..,xn){∂(x1,x2,..,xn)/∂(y1,y2,..,yn)}dy1dy2..dyr=fY1..Yr(y1,..,yr)dy1dy2..dyr です。

このとき,det{∂(x1,x2,..,xn)/∂(y1,y2,..,yn)}

=det{∂(x1,x2,..,xr)/∂(y1,y2,..,yr)}となります。

 

(注終わり)※

[例4-7]:Xのpd.f.が.偶関数fX(x)のとき,Y=aX2(a>0)のp.d.f.fY(y)を求めます。

 

 まず,∀x∈Rについてy=ax2≧0 なので,

 y<0のときfY(y)=0です。

そして,y>0 のとき,

X(x)=yとなるxはx=±(y/a)1/2,dx/dy=±(1/2)(ay)-1/2 (複号同順)です。

1=-(y/a)1/2,x2=(y/a)1/2とおけば,

dx1=-(ay)-1/2dy,dx2=(ay)-1/2dyより,

 

Y(y)dy=fX(-(y/a)1/2)dx1+fX((y/a)1/2)dx2=(ay)-1/2{fX(-(y/a)1/2)+fX((y/a)1/2)}dyを得ます。

ここではfX(x)が偶関数なのでfY(y)=2(ay)-1/2{fX((y/a)1/2)}となります。

[例4-8]:確率変数:X,Yのj.p.d.f.が,

 f(x,y)=1 (0<x<1,0<y<1),f(x,y)=0 (それ以外)のとき,

 Z=X+Yのp.d.f.fZ(z)を求めます。

 そのために,まずZ=X+Y,T=Yとおいて,

 ZとTのj.p.d.f.fZT(z,t)を求めます。

 z=x+y,t=yと置けば,x=z-t,y=tです。

 

Jacobianは|J|=det{∂(x,y)/∂(z,t)}=1ですから,

 zT(z,t)=f(z-t,t)です。

 

 そこで,fZT(z,t)=1 (0<t<1,0<z-t<1),

 fzT(z,t)=0 (それ以外)です。

そこで,fZ(z)=∫-∞ZT(z,t)dtにより,周辺分布関数としてfZ(z)を得ます。

結局,z≦0,またはz≧2ならfZ(z)=0,

 0≦z≦1ならfZ(z)=∫0zdt=zです。

 

また,1≦z≦2ならfZ(z)=∫z-11dt=2-zです。

さて,よく使われる実用的な特殊確率分布を考察します。

まず,代表的な離散分布を挙げます。

[定義5-1]:超幾何分布(hypergeometric distribution)

 px=P(X=x)=(kxN-kn-x)/(Nn)(x=0,1,2,..,min(k,n))なる式で与えられる確率分布を超幾何分布といい,H(x,n,k,N)で表わす。

これは,例えば中にk個の赤球と(N-k)個の白球の合計N個の球が入っている1つの壷からn個の球を取り出すとき,その中に含まれる赤球の個数を表わす確率変数をXとすれば,X=xである確率pxが従う確率分布です。

[定理5-2]:超幾何分布:H(x,n,k,N)=(kxN-kn-x)/(Nn)においてp≡k/Nが一定の要素(例えばN個の製品の中にk個の不良品がある不良品率:pが一定)では,N→ ∞とすればH(x,n,k,N) → nxx(1-p)n-x (2項分布)となる。

(証明) H(x,n,k,N)=[k!/{x!(k-x)!}][(N-k)!/{(n-x)!(N-k-n+x)![n!(N-n)!/N!]=nx[k(k-1)..(k-x+1)][(N-k)(N-k-1)..(N-k-n+x+1)]/[N(N-1)..(N-n+1)]です。

右辺はnx[p(p-1/N)..(p-(x-1)/N)][(1-p)(1-p-1/N)..(1-p-(n-x+1)/N)/[(1-1/N)..(1-(n-1)/N)] → nxx(1-p)n-x as N → ∞です。(証明終わり)

※ラプラス(Laplace)の近似式:ラプラスによれば離散的な2項分布(以下参照)はΣx=ab nxx(1-p)n-x ≒(2π)-1/2∫exp(-y2/2)dyと連続的な正規分布で近似できます。

ただし右辺のyの積分区間は,(a-np-1/2)/{np(1-p)}1/2≦y≦(b-np+1/2)/{np(1-p)}1/2で与えられます。※

[定義5-3]:2項分布(binomal distribution)

 

 確率変数X'の取り得る値が 0,または 1のみであるとき,p=P(X'=1),q=P(X'=0)=1-pとする。

 

 分布関数はF(x)=0 (x<0),q (0<x<1),1 (x≧1)である。これをベルヌーイ(Beronoulli)分布という。

 例えば硬貨を投げて裏が出ると0,表が出ると1を対応させる関数として上述の確率変数X'を得る。このように硬貨をn回投げるようなゲームの試行をベルヌーイ試行,または独立試行という。

正確なベルヌ-イ試行は次の3つの条件を持つ試行と定義される。

(1)  各試行の結果として排反事象T,Hのどちらか1つが起きる。

(2)  各試行の結果は他のそれと独立である。

(3)  各試行でHが起こる確率pは試行ごとに変わらない。

この試行列の標本空間Ωの元:ωω=(ω12,..,ωn);ωj=H or T (j=1,2,..,n)で表現される。

このnベルヌーイ試行でHが出る回数をXと表わせば,px≡P(X=x)=nxxn-x (x=0,1,2,..,n;q=1-p)である。これを2項分布といいb(x,n,p)と書く。

これは,確率変数X=X1'+X2'+..Xn'の分布になっている。

[定理5-4]:np=λ(一定)の下でn→ ∞(p→ 0)とすれば2項分布b(x,n,p)はP(x;λ)=λxexp(-λ)/x! (=ポアソン(Poisson)分布)に近づく。

(証明) b(x,n,p)=nxxn-x=n(n-1)..(nーx+1)(λ/n)x(1-λ/n)n-x/x!=λx(1-1/n)..{1-(x-1)/n}(1-λ/n)n(1-λ/n)-x/x!→λxexp(-λ)/x!(n→∞)です。(証明終わり)

(注):Σx=0d nxx(1-p)n-x≒exp(-np)Σx=0d(np)x/x!をポアソン近似といいます。

 そこで,ポアソン分布:P(x;λ)はHが出る回数の期待値がλ(=(np)n→∞=一定)の条件下で,Hの出る回数がxである確率を表わすと考えられます。(注終わり)※

[定理5-5]:時刻t=1,2,3,..においてそれぞれ1個の硬貨を投げる。各時刻tで表(H),裏(T)の出る確率をそれぞれp,q(p+q=1)とし,確率変数YtはH,Tに応じて1,-1を取るとする。すなわち,P(Yt=1)=p,P(Yt=-1)=qである。

 このとき,X(j)≡Σt=0jt=と置けばX(0)=0 の下でP(X(j)=n)=j(j+n)/2(j+n)/2(j-n)/2 (-j≦n≦j)が成り立つ。ただし,(j+n)が偶数のnしか実現不可能である。

(証明)このケースでは標本はω=(HHTHHHTHT..)のような形を取ります。X(j) ≡Σt=0jt=nのとき,表の回数をk,裏の回数をlとするとk+l=j,k-l=nです。

そこで,2k=j+n,2l=j-nより(j+n),(j-n)は偶数でk=(j+n)/2,l=(j-n)/2です。そこで,P(X(j)=n)=jkklj(j+n)/2(j+n)/2(j-n)/2を得ます。(証明終わり)

※この種の現象をランダム・ウォーク(酔歩)といいます。

  

 つまり,酔っ払いが原点Oから右に一歩(+1)か左に一歩(-1)のどちらかの蛇行を繰り返してj歩だけ歩いた後,Oから右にn歩の位置にいる確率が上記のP(X(j)=n)です。(2006年9/14のブログ記事「酔歩(ランダム・ウォーク」を参照)※

さて,改めてポアソン分布を次のように定義します。

[定義5-6]:P(X=j)=λjexp(-λ)/j!(j=0,1,2,..)のときXはパラメータλのポアソン分布を持つという。

(注):ポアソン過程によるポアソン分布の導出

 ある事象の発生が時間的にランダムであるとき,一定時間内にそれが発生する個数を考察します。

すなわち,次のような3つの仮定を満たす過程を考察します。これをポアソン過程といいます。

(A1):任意の時間内の発生個数はそれと重ならない時間内の発生個数と独立である。

(A2):微小時間をΔtとするとP({Δt内には発生しない})=1-λΔt+o((Δt)2),P({Δt内に1個発生する})=λΔt+o((Δt)2),P({Δt内に2個以上発生する})=o((Δt)2)である。(λ>0)

(A3):時間間隔(0,t)内にj個が発生する確率をPj(t)で表わすとき,j≧0 の全てのjに関してPj(t)はtに関して微分可能である。

 以上の仮定の下で,Pj(t)=(λt)jexp(-λt)/j! (j=0,1,2,..)が成り立つ

(証明) 0≦t1<t2に対して(t1,t2)内にj個が発生するという事象をNj(t1,t2)で表わします。

 

 積事象を積で表現すれば,N0(0,t+Δt)=N0(0,t)N0(t,t+Δt),j≧1ならNj(0,t+Δt)=Nj(0,t)N0(t,t+Δt)+Nj-1(0,t)N1(t,t+Δt)+Σk=2jj-k(0,t)Nk(t,t+Δt)です。

 そこで,Pj(t)=P[Nj(0,t)]ですから確率としては,P0(t+Δt)=P0(t){1-λΔt+o((Δt)2)},かつPj(t+Δt)=Pj(t){1-λΔt+o(((Δt)2))+Pj-1(t){λΔt+o((Δt)2)}+o((Δt)2)(j≧1)です。

 Δt→ 0 とするとdP0/dt=-λP0(t),dPj/dt=-λPj(t)+λPj-1(t))(j≧1)なる連立1階常微分方程式系を得ます。

 

 これらを初期条件P0(0)=1,Pj(0)=0(j≧1)の下で解けばPj(t)が得られるわけです。

解くべき方程式は定係数の線形方程式で係数が二重対角の三角行列の簡単なものです。計算の詳細は省いて結果だけ書くとPj(t)=(λt)jexp(-λt)/j! !(j=0,1,2,..)です。(証明終わり)(注終わり)※

[定義5-7]:幾何分布(geometrical distribution)

 無限回のベルヌーイ試行列において初めて裏(T)が出るまでの試行回数(最後の裏の出た回も含める)をXと表わせばj≧1に対してpj≡P(X=j)=pj-1q (p=P(H),q=1-p=P(T))が成り立つ。

この離散的確率分布{pj;j=1,2,..}を幾何分布,またはパスカル(Pascal)分布という。

[定理5-8]:幾何分布{pj;j≧1}を持つ確率変数Xは関係式:P(X=n+j|X>n)=pj (j≧1) (=マルコフ(Markov)性)を満たす。

(証明)P(X=n+j|X>n)=P(X=n+jかつX>n)/P(X>n)=P(X=n+j)/P(X>n)=pn+j/(Σk=n+1k)=pn+j-1q/(Σk=n+1k-1q)=pj-1q=pjです。(証明終わり)

[定理5-9]:確率分布pj≡P(X=j)が等式:pj=P(X=n+j|X>n) (n,j=1,2,..)を満たすなら,pj=pj-1q (j=1,2,..,q=1-p)である。

(証明)pj=pj+n/(Σk=n+1k)においてn=1と置けばpj=pj+1/(Σk=2k)です。故にpj+1/pj=Σk=2k=1-p1です。

 

 そこで,p≡1-p1と置くとpj+1=ppj(等比数列)です。

 

 したがってpj=pj-11=(1-p)pj-1=pj-1q (j=1,2,..,q=1-p)を得ます。(証明終わり)

今日はここで終わります。

 

次回は特殊な連続確率分布の例に入ります。(つづく)

参考文献:藤沢武久 著「新編 確率・統計」(日本理工出版会)

 

PS:カナダの冬季オリンピックスピード・スケート500m。。地元のジェレミー・ウォザースプーンは泣いていました。残念でした。

 

 かつてのアメリカのダン・ジャンセン(最後1000mでは勝ったが。。)を思い出してしまいました。。。

  

 ノルディック複合で当時無敵だった荻原健司も五輪の個人では勝てなかったなあ。。。

  

 国母くんのことについての私の感想。。中学,高校の髪の毛の色や服装の検査じゃあるまいし。。オリンピックにも校則のようなものがあるんかい?。。ファッションなんて変遷するもんです。

 

ブックオフオンライン 

iconオンライン書店 boople.com(ブープル)

| | コメント (2) | トラックバック (0)

2010年2月13日 (土)

確率と分布関数(2)(分布関数,密度関数)

 昨日の続きです。

[定義3-5]:Xを確率変数とするとき,∀x∈Rに対して事象(X≦x)∈の確率をP(X≦x)と表わすと,これはx∈Rの関数となる。

この関数を確率変数Xの分布関数,または累積分布関数といい,一般にF(x),またはFX(x)と表記する。

 

すなわち,

F(x)≡P(X≦x)=P({ω∈Ω|X(ω)≦x})(-∞<x<∞)

である。

以下では,場合に応じて確率変数Xをr.V.X(random variable),分布関数F(x)をd.f.F(x)(distribution function)と記す。

[定理3-6]r.V.Xのd.f.F(x)は次の性質を有する。

(1)  (x)は非減少関数である。

(2)  (-∞)=limx→-∞F(x)=0,F(∞)=limx→∞F(x)=1

(3)  (x)は右連続関数である。

(証明)(1),(2)は自明なので(3)だけを証明します。

n(x<X≦x+1/n)と置けば∩n=1n=φなので,

limn→∞P(An)=P(limn→∞n)=P(φ)=0です。

 

一方,P(An)=F(x+1/n)-F(x)なので,

limn→∞F(x+1/n)=F(x)です。

同様にして,上記の特殊な数列:{1/n}に限らず,n→∞でゼロに収束する任意の非増加列:{εn}を考えても,limn→∞F(x+εn)=F(x)の成立が容易に示せるので,F(x)は右連続であると結論されます。

 

(証明終わり)

[定義3-7]:確率空間(Ω,,P)が離散空間の場合,その上の確率変数をXとするとき,

 

 pj≡P(X=xj)=P({ω∈Ω|X(ω)=xj})と定義すれば,Σjj=1であるが,こうして定義される数列:{pj:-∞<j<∞}をXの確率分布という。

確率分布はp.d.と略記します。

これは,probability distributionの略です。

[例3-8]:∀ω∈Ωについてr.V.X=a(一定)のd.f.F(x)を考えると,x<aなら(X≦x)=φなのでF(x)=0,x≧aならF(X≦x)=ΩなのでF(x)=1です。

これを,Heaviside関数(階段関数)θ(x)(x<0 ならθ(x)=0,x>0 ならθ(x)=1;ただしθ(0)≡1)で表現するとF(x)=θ(x-a)と表現できます。この分布を退化分布といいます。

 

 

 

[例3-9]:既述のようにA∈でr.v.XがIA (=Aの指示関数)のときには,d.f.FIA(x)はx<0 ならFIA(x)=0,0≦x<1ならFIA(x)=1-P(A),x≧1ならFIA(x)=1です。

[例3-10]:r.V.Xがp.dとしてpj=P(X=xj)を持つ離散分布のときのd.f.F(x)を考えます。

各jについて,集合Aj(X=xj)={ω∈Ω|X(ω)=xj}を定義すると,X=ΣjjAjと表現できます。一方,F(x)=Σ(X≦xj)j=Σj{pjθ(x-xj)}ですから,結局,F(x)=ΣjIAj(x)です。

[定義3-11]:同じ確率空間の2個の確率変数X1,X2の同時分布関数F(x1,x2)を,F(x1,x2)≡P(X1≦x1,X2≦x2)=P(A1∩A2)によって定義する。

  

 A1≡{ω∈Ω|X1(ω)≦x1},A2≡{ω∈Ω|X2(ω)≦x2}である。

同時分布関数はj.d.fと略記します。

これはjoint distribution functionの略です。

[定義3-12]:∀x1,x2∈Rについて,

 A1≡{ω∈Ω|X1(ω)≦x1},A2≡{ω∈Ω|X2(ω)≦x2}

 が独立であるとき,

 

 すなわちP(A1∩A2)=P(A1)P(A2)であるとき,

 確率変数X1とX2は独立であるという。

 いいかえると,P(X1≦x1,X2≦x2)=P(X1≦x1)P(X2≦x2),

 あるいは,j.d.fが2つの確率変数X1とX2のそれぞれのd.f.の積としてF(x1,x2)=FX1(x1)FX2(x2)と表わせるとき,

 

 X1とX2は独立であるという。

 そして,この場合,右辺のFX1(x1),およびFX2(x2)を

 周辺分布関数(m.d.f=marginal distribution function)という。

[定理3-13]:r.V.X1,X2のj.d.f.F(x1,x2)は次の性質を持つ。

(1)  1≦x1',x2≦x2'に対してF(x1,x2)≦F(x1',x2')

(2) limx1→∞F(x1,x2)=FX2(x2),limx2→∞F(x1,x2)=

X1(x1)である。

 

(3) limx1→-∞F(x1,x2)=limx2→-∞F(x1,x2)=0

(4) limx1→∞,x2→∞F(x1,x2)=1である。

(5)P(a1<X1≦b1,a2<X2≦b2)=F(b1,b2)-F(a1,b2)-F(b1,a2)+F(a1,a2)が成立する。

(証明)(5)だけ証明します。

(X1≦b1)=(X1≦a1)+(a1<X1≦b1),

(X2≦b2)=(X2≦a2)+(a2<X2≦b2)ですから,

  

(X1≦b1)∩(X2≦b2)

=(X1≦a1)∩(X2≦a2)+(X1≦a1)∩(a2<X2≦b2)

+(a1<X1≦b1)∩(X2≦a2)+(a1<X1≦b1)∩(a2<X2≦b2)

 

です。

故に,P(a1<X1≦b1,a2<X2≦b2)

=F(b1,b2)-F(a1,a2)-P(X1≦a1,a2<X2≦b2)

-P(a1<X1≦b1,X2≦a2) です。

そして,P(X1≦a1,a2<X2≦b2)

=P((X1≦a1)∩(X2≦b2)-(X1≦a1)∩(X2≦a2))

=P(X1≦a1,X2≦b2)-P(X1≦a1,X2≦a2)

=F(a1,b2)-F(a1,a2) です。

同様に,

(a1<X1≦b1,X2≦a2)=F(b1,a2)-F(a1,a2)

ですから,結論を得ます。(証明終わり)

[定義3-14]:確率変数Xの取り得る値が高々可算個であるとき,Xを離散(型)(discrete)確率変数という。

 

 これは,Σj=1(X=xj)=Ωを満たす高々可算濃度の集合:{xj}⊂Rが存在することを意味する。

 このとき,pj≡P(X=xj)はΣj=1j=1なる条件を満たす。

 

 この{pj}を離散確率変数Xの確率分布(p.d.=probability distribution)という。

 そして,この場合p(x)≡P(X=x)=pj (if x=xj),

 p(x)=0 (if x≠xj)を離散密度関数,または確率関数と呼ぶ。

この離散確率変数Xのd.f.は,前にも述べたようにF(x)=Σ(X≦xj)jで与えられます。

[定義3-15]:同じ確率空間の2個の離散確率変数X1,X2の取り得る値が{x1i},{x2j}であるとき,

 

 pij≡P(X1=x1i,X2=x2j)(pij≧0,Σi,j=1ij=1)なる{pij}を,1,X2の同時確率分布(j.p.d.)という。

そして,pi・≡P(X1=x1i)=Σj=1ij,およびp・j≡P(X2=x2j)=Σi=1ijをそれぞれX1の周辺確率分布,X2の周辺確率分布(m.p.d.)という。

[定義3-16]:∀x1,x2∈RについてA1≡{ω∈Ω|X1(ω)≦x1},A2≡{ω∈Ω|X2(ω)≦x2}が独立であるとき,

すなわちP(A1∩A2)=P(A1)P(A2)のとき,

 

確率変数X1とX2は独立であるという。

[定義3-17]:連続的な分布関数を持つ確率変数を連続(型)(continuous)確率変数という。

連続型変数の場合,確率変数をXと置くと,

P(X=x)≦P(x-h<X≦x)=F(x)-F(x-h)→0(h→0)

です。

確率は区間の長さ(=測度)hに比例するので,

xが連続点である限り1点x(長さhがゼロ)での確率はゼロです。

[定義3-18]:連続確率変数Xについて,∀a,b(a≦b)に対して,

 P(a<X≦b)=∫abf(x)dxを満たすf(x)≧0 が存在すれば,

 これをXの確率密度関数という。

 

 確率密度関数をp.d.fと書きます。これはprobability distribution functionの略です。

密度関数f(x)が存在するとき,

 

d.f.はF(x)=P(X≦x)=∫-∞xf(t)dtで与えられますから,

F(x)が連続であって可算個の点を除いて導関数を持つとき,

連続点xではf(x)=dF(x)/dxです。

すなわち,次式の右辺の極限値が存在するときには

f(x)=limΔx→0{P(x<X≦x+Δx)/Δx},

あるいはf(x)dx=P(x<X≦x+dx)です。

[定理3-19]:(確率密度関数の性質) 

 (x)を確率密度関数とすると,

 

 (1)f(x)≧0

 (2)∫-∞f(x)dx=1 である。

[補助定義]:(スティルチェス積分の定義)(T.J.Stieltjesによる)

 F(x),g(x)を[a,b]で定義された実数値関数とする。

 ただし,F(x)は非減少関数,g(x)は連続関数とする。

閉区間[a,b]の任意の分割:a=x0<x1<x2<..<xn=bに対して和:Σj=0n-1g(ξj){F(xj+1)-F(xj)};ξj∈(xj,xj+1)を作る。

 

この和が,max(0≦j≦n-1)(xj+1-xj)→0 に対して一定値に収束するとき,この値をg(x)のF(x)によるスティルチェス積分といい,

abg(x)dF(x)と表わす。

特に,F(x)=xのときはスティルチェス積分は,リーマン積分(Riemann integral)に一致します。

(注)スティルチェス積分は測度関数:F(x)が非減少関数のときだけではなく,有界変動関数のときにも定義できます。

 

 また,リーマン積分だけでなく,ルベーグ積分(Lebesgue integral)も同じようにスティルチェス積分に拡張されます。

ブラウン運動(Brownian motion)のような場合には,その運動経路の測度(長さ)が有界変動ではないので,こうした通常の積分を定義することは不可能です。 

よって,伊藤積分のような新概念が必要になります。※

さて,分布関数d.f.F(x)がx=xjにおいて,

不連続なジャンプ:pj(j=1,2,..,n)を持つ非減少関数で,

区間(xj,xj+1)ではF'(x)=fj(x)を満たすとします。

a=x0,b=xn+1でとし,区間(a,b)でg(x)が連続のときには,

abg(x)dF(x)=Σj=0nxjxj+1g(x)fj(x)dx+Σj=1ng(xj)pj

と表現可能です。

スティルチェス積分の表記では,確率変数Xの分布関数をF(x)とすると,F(x)が連続的か離散的かに関わらず,

式:F(x)=∫-∞xdF(t)が成立します。

[定義3-20]:同一確率空間上のn個の確率変数:X1,X2,..,Xnの同時分布関数F(x1,x2,..,xn)≡P(X1≦x1,X2≦x2,..,Xn≦xn)に対して,

 

 F(x1,x2,..,xn)=∫-∞x1-∞x2..∫-∞xnf(t1,t2,..,tn)dt1dt2..dtnを満たす関数:つまり密度関数f(x1,x2,..,xn)が存在するとき,

 

 同時分布関数:F(x1,x2,..,xn)は絶対連続であるという。

このとき,f(x1,x2,..,xn)をX1,X2,..,Xnの同時確率密度関数(j.p.d.f.)という。

(注):2007年7/7の記事「条件付確率と条件付期待値」では,逆に絶対連続なら確率密度関数が存在するという内容の「ラドン・ニコディム(Radon Nikodym)の定理」を紹介しました。

 

 ただ,一見では両者で絶対連続の定義が違うようにも見えます。

すなわち,ラドン・ニコディムの定理は,

 

"もしもF(A)が"絶対連続:Eの測度μ(E)=0 なら常にF(E)=0 が成立する。"なら,適当な密度関数f(x)が存在してF(A)=∫(x)μ(dx)と表現できる。"

 

というものです。

より一般には定理の前半として「任意の集合関数は絶対連続な集合関数と特異な(絶対連続でない)集合関数との和に一意的に分解される。」という命題も含まれています。

後者の命題は任意の分布関数は連続分布の部分と離散分布の部分の和に一意的に分割表現できるというような意味でしょう。(注終わり)※

以下では連続な確率変数については基本的に常に確率密度関数が存在するようなあまり特異でない分布のみを考察の対象とします。

さて,同時的確率密度関数の基本性質は,

 

(1)f(x1,x2,..,xn)≧0

(2)∫-∞-∞..∫-∞f(t1,t2,..,tn)dt1dt2..dtn=1

 

(3)F(x1,x2,..,xn)が微分可能な点(x1,x2,..,xn)では,

f(x1,x2,..,xn)=(∂n/∂x1∂x2,..∂xn)F(x1,x2,..,xn)

 

です。

[定義3-21(1)]:簡単のためn=2とする。

 すなわち,確率変数X1,X2の同時分布関数をF(x1,x2)≡P(X1≦x1,X2≦x2)とする。

 

 このとき,周辺確率密度関数(m.p.d.f.)fX1,fX2を,

X1(x1)=∫-∞f(x1,x2)dx2,

X2(x2)=∫-∞f(x1,x2)dx1

によって定義する。

[定義3-21(2)]:fX2(x2)>0 のとき, 

  X2=x2の下でのX1の条件付確率密度関数を

  fX1(x1|X2=x2)≡f(x1,x2)/fX2(x2)で,

  

 同様にfX1(x1)>0 のとき,

 X1=x1の下でのX2の条件付確率密度関数を

 fX2(x2|X1=x1)≡f(x1,x2)/fX1(x1)

  

 で定義する。

すると,条件付分布関数は,

X1(x1|X2=x2)=∫-∞x1X1(τ|X2=x2)dτ={1/fX2(x2)}∫-∞x1f(τ,x2)dτ,

 

および,FX2(x2|X1=x1)=∫-∞x2X2(τ|X1=x1)dτ={1/fX1(x1)}∫-∞x2f(x1,τ)dτ

 

になります。

確率変数X1,X2が独立であるとは, 

F(x1,x2)=FX1(x1)FX2(x2)(FX1(x1),FX2(x2)は周辺分布関数)が成立することをいいますが,

 

これは密度関数が存在するときには,

f(x1,x2)=fX1(x1)fX2(x2)

が成立することに相当します。

このときには,条件付確率密度関数は,

X1(x1|X2=x2)=fX1(x1),

かつfX2(x2|X1=x1)≡fX2(x2) となります。

さらに,一般のn個の確率変数X1,X2,..,Xnが独立であるとは,

F(x1,x2,..,xn)=Πj=1nXj(xj)成り立つことをいいますが,

 

これは密度関数の表現では,

f(x1,x2,..,xn)=Πj=1nXj(xj) です。

[例3-22]:確率変数X1,X2,..,Xnは全て同じ周辺分布関数F(x)を持つ独立確率変数であるとします。

(1)  Y≡min(X1,X2,..,Xn)の分布関数:FY(y)=P(Y≦y)を求めてみます。

(Y>y)=P(X1>y,X2>y,..,Xn>y)=P(X1>y)P(X2>y)..P(Xn>y)={1-F(y)}nですから,

 

Y(y)=P(Y≦y)=1-{1-F(y)}nです。

(x)の"導関数=密度関数"f(x)=dF/dxが存在するとき,

Yの確率密度関数はfY(y)=dFY/dy=n{1-F(y)}n-1f(y)

です。

(2)  Z≡max(X1,X2,..,Xn)の分布関数を求めます。

 

 (1)と同様にしてZ(z)=P(Z≦z)={F(z)}nです。

 f(x)が存在するとき,

 確率密度関数はZ(z)=n{F(z)}n-1f(z)です。

(3)n個の確率変数X1,X2,..,Xnのうちでx∈Rを超えない確率変数の個数をNとするとき,Nの確率分布P(N=k)を考えます。

 

 これは,P(N=k)=nk[F(x)]k[1-F(x)]n-k

 で与えられると考えられます。

 ここでまた一休みします。(つづく)

参考文献:藤沢武久 著「新編 確率・統計」(日本理工出版会)

 

ブックオフオンライン 

iconオンライン書店 boople.com(ブープル) 

| | コメント (4) | トラックバック (0)

2010年2月12日 (金)

確率と分布関数(1)(確率の定義)

 ちょっと調べる必要があって1988年(38歳でまだ大型コンピュータで仕事をしていてパソコンもネットも知らなかったのどかな時代)にコツコツとまとめた確率と統計のノートから抜粋します。

 最初は定義と定理の列挙です。定理の証明は簡単なものが多いので基本的には省略します。

 まず,Rを実数全体の集合とします。

[定義1-1]:Rの部分集合族のうちで次の性質を持つ最大の集合族をRのボレル集合族(Borel family of sets)と呼ぶ。

(1) M1,M2,..,∈なら,∪k=1k

(2) M∈,N∈なら,M-N∈

(3) a∈R,b∈R,a<bなら(a,b)∈

これから,または以下の性質も有することがわかります。

(4) R∈,φ∈

(5) N∈ならNc≡R-N∈

(6) M1,M2,..,∈なら∩k=1k

(7) ∀a∈Rについて(a,∞)∈,{a}∈

[定義1-2]:試行の結果の全体:Ωを標本空間または確率事象といい,

 Ωの元ωを根源事象または素事象という。

   

 Ωの部分集合をA,B,C,..と表記し,各々を単に事象という。

 

 ある事象A⊂Ωを与えたとする。

  

 ω∈Aのとき,ωは事象Aの1つの結果である。

 

 または,ωが起これば事象Aが起こった。 という。

事象A,B∈Ωを与えたとき,AまたはBが起これば事象A∪Bが起こったという。

 

事象A,Bが共に起こればA∩Bが起こったという。

  

また,Ac≡Ω-AをAの余事象という。

 

空集合φは実現不可能な事象をいう。

[定義1-3]:確率事象Ωの部分集合族が次の3条件を満たすときをσ-集合体(σ-加法族)という。

(1)  A∈ならAc

(2)  1,A2,..,∈なら∪n=1n

(3)  Ω∈ 

 

 そしてσ-集合体の元を改めて事象と定義する。

 

※この定義から次の3つの性質も有することがわかります。

(1) φ∈

(2) A1,A2,..,∈なら∩n=1n

(3) A1,A2,..,∈ならlimsup n→∞n,liminf n→∞n

 

 ただし,

 limsup n→∞n≡∩n=1j=nj,liminf n→∞n≡∪n=1j=nj

 です。それぞれ,集合族{An}の上極限,下極限と呼ばれます。

 

 常にliminf n→∞n⊂limsup n→∞nですが,

 

 特にliminf n→∞n=limsup n→∞nのとき,この共通の集合をlim n→∞nと記して集合族{An}の極限集合と呼びます。

[例1-4]:集合族{Ω,φ}も1つのσ-集合体と見なせます。

[定義1-5]:A,B∈でA∩B=φのとき,

 "事象Aと事象Bは互いに排反である",

 または,"AとBは排反事象である" という。

[定理1-6]:集合列{An}(An,n=1,2,..)が非減少列:

 A1⊂A2⊂..⊂An⊂An+1⊂..なら,

 A≡∪n=1nは互いに排反な事象の和として表わされる。

(証明)B1≡A1,Bk≡Ak-Ak-1(k=2,3,..)と置けば,

 i<jのときBi∩Bj=φ(排反)です。

 

 そして,A≡∪n=1n=Σk=1kと書けるのは明らかです。 

 

(証明終わり)

※ついでに,集合演算の規則:(∪n=1n)∩B=∪n=1(An∩B)

 も挙げておきます。

[定義2-1]:(確率の定義)

(1)古典的な確率の定義

1つの試行の結果としてn個の素事象が同等の確からしさで起こるとき,各素事象:ωj∈Ωに対して1/nを割り当てる。

すなわち,各々の素事象ωjに対して,

P({ωj})≡1/n(j=1,2,..,n)とし,

 

事象AがA={ω12,..,ωr}={ω1}∪{ω2}∪..∪{ωr}なら, 

P(A)≡P({ω1})+P({ω2})+..+P({ωr})=r/n

 

とする集合関数P(A)を事象Aの確率という。

あるいは,事象Aの元の個数をN(A)とするとき, 

P(A)≡N(A)/N(Ω) とする。

 

(2)相対頻度による定義

同じ条件の下で試行をn回繰り返したとき,

 

事象Aが起こった回数をN(A)とすれば,

相対頻度fnはfn(A)=N(A)/nと書ける。

このとき,次式の右辺の極限値が存在するなら,

P(A)≡limn→∞n(A) を事象Aの確率という。

(3)公理による定義(Kolmogorovによる)

確率とは次の3条件を満たし,Ωの部分集合の族の"あるσ-集合体の任意の元=事象"に対して定義された集合関数である。

この"3条件=確率の公理"は,以下の通りである。

公理1:∀A∈に対してP(A)≧0

公理2:P(Ω)=1

公理3(完全加法的):i≠jのときAi∩Aj=φなる事象列{An}に対し,P(∪n=1n)=Σn=1P(An)が成り立つ。

そして,Ω,,Pをまとめて(Ω,,P)と表記し,確率空間と呼ぶ。

この定義からPは以下の性質を持つことがわかります。

(1)  (φ)=0

(2)  A∈のときP(Ac)=1-P(A)

(3)  ,B∈でA⊂BならP(A)≦P(B)

(4)  ∀A∈に対してP(A)≦1

(5)  ,B∈のときP(Ac∩B)=P(B)-P(A∩B)

(6)  ,B∈のときP(A∪B)=P(A)+P(B)-P(A∩B)

(7)  事象列{An}が非減少列であって,A≡limn→∞n=∪n=1n

(A)=limn→∞P(An)である。

 

(8)  事象列{An}が非増加列であってA≡limn→∞n=∩n=1nなら

(A)=limn→∞P(An)である。

 

※そして,実は非減少列,非増加列に限らず,

 極限集合:A=limn→∞nが存在すればP(A)=limn→∞P(An)が成立します。

また,A,B∈のとき, 

P(A∪B)=P(A)+P(B)-P(A∩B)

なる公式の応用として,

  

A,B,C∈のとき, 

P(A∪B∪C)=P(A)+P(B)+P(C)-P(A∩B)-P(B∩C)-P(C∩A)+P(A∩B∩C) 

が成立すること

 

も容易に示せます。

[例2-2]:Ω≡{ω12,..}を可算集合,

 {p1,p2,..}をΣn=1n=1,pk≧0 (k=1,2,..)を満たす実数集合

 とします。

 

 このとき,∀M⊂Ωに対して集合関数Pを

 P(M)≡Σ(ωi∈M)i と定義すれば,

 Pは確率の公理を満たします。

[例2-3]:Ω≡{ω|a≦ω≦b},A≡{ω|c≦ω≦d}(a≦c,b≦d)に対して,集合関数LをL(Ω)≡b-a,L(A)≡d-cで定義し,

PをP(A)≡L(A)/L(Ω)=(d-c)/(b-a)で定義すると,

 

 Pは確率の公理を満たします。

[定義2-4]:2つの事象をA,B∈とする。

 

 P(B)>0 のとき,P(A|B)≡P(A∩B)/P(B)を,

"事象Bが確実に起きたという前提の下での事象Aの条件付確率"

という。

 

 また,P(A∩B)を事象AとBの同時確率という。

[定理2-5](乗法公式):A0,A1,A2,.,Anを(n+1)個の事象とする。

 

 もしも,P(∩j=0n-1j)>0 なら, 

 P(∩j=0nj)=P(A0)P(A1|A0)P(A2|A1∩A0.,)..

 P(An|∩j=0n-1j) が成り立つ。

[定理2-6]:[定義2-4]においてBをP(B)>0 の事象とすれば,

 

 Bを固定したときの条件付確率を与える関数P(・|B)は,

 確率の公理を満たすので,

 (Ω,F,P(・|B))は1つの確率空間を作る。

[定理2-7](全確率の公式):可算個の排反事象列:{An}が,

 P(An)>0,∪n=1n=Ωを満たすとき,

 

事象Bの確率はP(B)=Σn=1P(An)P(B|An)である。

[定理2-8](ベイズ(Bayes)の公式):

 

 前定理と同じ条件の下で, 

 P(Aj|B)=P(Aj)P(B|Aj)/[Σn=1P(An)P(B|An)]

 が成立する。

[定理2-9]:A∩C=φ,P(B)>0 なら,

 P(A∪C|B)=P(A|B)+P(C|B) 

 である。

[定義2-10]:2つの事象A,Bが独立であるとは,

 P(A∩B)=P(A)P(B)なることである。

  

 2つの事象A,Bが独立でP(B)>0 なら,

 P(A|B)=P(A)である。

[定理2-11]:事象A,Bが互いに排反:A∩B=φで,

 P(A)>0,P(B)>0ならA,Bは独立では有り得ない。

[定理2-12]:n個の事象A1,A2,.,Anが独立であるとは,

 

 "全てのk≦nなるkに対するA1,A2,.,Akについて,

 (2n-n-1)個の等式:P(∩j=1kj)=Πj=1kP(Aj)

 が成立すること" である。

[定理2-13]:(1)P(A∩B)≧1-P(Ac)-P(Bc),(2)P((∩j=1nj)≧1-Σj=1nP(Ajc)である。

[定義3-1]:確率変数X=X(ω)はΩ上で定義される関数で,

有限値を取り(i.e.P({ω∈Ω|-∞<X(ω)<∞})=1),

 

しかも∀x∈Rに対して[ω∈Ω|X(ω)≦x]が1つの事象となるものをいう。

すなわち,定義の条件は,

∀x∈Rに対して[ω∈Ω|X(ω)≦x]∈

となることです。

 

以下では集合[ω∈Ω|X(ω)≦x]を略記号:(X≦x)で表記することにします。

[定理3-2]:Ωを定義域とし空でない実数集合を値域とする任意関数をXと置くと,

 

 ∀x∈Rに対し,

 

(1)∪n=1(X≦x-1/2n)=(X<x),

(2)∩n=1(X≦x+1/2n)=(X≦x)

 

である。

これから,(X≦x)∈だけでなく(X<x)∈である,

ことがわかる。

  

そしてσ-集合体の性質から,

 

(X>x),(x<X≦y),(x≦X<y),(X=x)

も全ての元になる,こともわかる。

Xを確率変数,x∈Rをある定数とすると,Xをxに割り当てる標本点(素事象)の集合:Ax≡{ω∈Ω|X(ω)=x}が定義できて,

 

それはある確率:p=P(Ax)∈[0,1]を持ちます。

[定理3-3]:同じ確率空間(Ω,,P)上でX,Yが共に確率変数のとき,

 

(1)X+Y (2)kX(k∈R) (3)X2 

 

は確率変数である。

 

また,(4)(Y=0)=φなら,X/Yも確率変数である。

これから,X,Yが共に確率変数なら,

XY=(1/4){(X+Y)2-(X-Y)2},

(max(X,Y)≦x)=(X≦x)∩(Y≦x)により,

 

XYとmax(X,Y)も確率変数です。

[定理3-4]:集合A⊂Ωに対して,  

 ω∈AならIA(ω)=1,ω∈AcならIA(ω)=0  

 で定義されるΩ上の集合関数IAをAの定義関数,

 または,指示関数という。

 

 IAが確率変数となるための必要十分条件はA∈である。

(証明)x<0 なら(IA≦x)=φ,0≦x<1なら(IA≦x)=Ac,x≧1なら(IA≦x)=Ωですが,φ∈,Ω∈は自明です。

 

 そして,"AcはA∈と同値"ですから,IA(ω)が確率変数となるための必要十分条件はA∈です。(証明終わり)

特にΩ∈ですから,IΩは1つの確率変数です。

 

そしてx<1なら(IA≦x)=φ,x≧1なら(IA≦x)=Ωです。

そこで,x<0ならP(IA≦x)=0,0≦x<1ならP(IA≦x)=1-P(A),x≧1ならP(IA≦x)=1です。

 

ノートを書き写すだけの作業ですが,ここで一休みします。

(つづく)

参考文献:藤沢武久 著「新編 確率・統計」(日本理工出版会)

  

 

ブックオフオンライン 

iconオンライン書店 boople.com(ブープル)

| | コメント (2) | トラックバック (0)

2010年2月10日 (水)

新女流名人誕生!!

 里美香奈倉敷藤花が清水市代女流名人に挑戦していた名人戦5番勝負の第3局で挑戦者が勝ち3連勝で女流名人を奪取しました。二冠です。

 里美香奈さんおめでとうございます。

ブックオフオンライン 

iconオンライン書店 boople.com(ブープル) 

| | コメント (0) | トラックバック (0)

2010年2月 6日 (土)

電磁力学と解析力学

1月末にfolomy物理フォーラムでMössbauer(メスバウアー)効果と磁性のZeema効果などとの関連についての質問を受けたのですが,Mössbauer効果の方面については私自身ほとんど考えたり勉強したりしたことがなかったので2月初めにでも詳細にブログに書くと約束しました。

そこで,まずは「γ崩壊とメスバウアー効果」という題目で原稿を書き始め,γ崩壊の摂動Hamiltonianとして"γ線量子=光子"と原子核との電磁相互作用を考察することから始めました。

 

すなわち,

  

摂動HamiltonianH'を電磁場(γ線)と核の相互作用=電磁相互作用HamiltonianとしてH'=∫jμ(,t)Aμ(,t)d3=∫ρ(,t)φ(,t)d3-∫(,t)(,t)d3と表わすことから始めます。

 

ただし,jμ(cρ,),μ(φ/c,)でρ(,t)は電荷密度,

(,t)は電流密度です。

 

を時刻tに位置にある電荷の速度とすると,伝導電流が存在しないときは(,t)=ρ(,t)と書くことができます。

 

という文章から書き始めたのでした。

 

しかし,相互作用を電気双極子,磁気双極子,電気四重極子と多重極展開する際の細かい計算,特にベクトル解析での変換の計算などで2,3日つまづいたりしているうちに,

 

私の学生時代からの悪い癖ですが,忘れてしまったという意味も含めてはっきりとは理解していない項目があることに気付いて基礎の基礎まで降りて考察したくなってしまいました。

 

さて,2008年11/2の記事「解析力学の初歩」によれば,電場を=-∇φ-∂/∂t,磁場を=∇×とするとき,その中で電荷がqの荷電粒子が運動するときの粒子の運動エネルギーをTとすれば,

  

荷電粒子のLagrangianは,L=T-V,V=V(,,t)≡qφ(,t)-qvA(,t)で与えられることがわかります。

このとき,d/dt=∂/∂t+(∇),××(∇×)=∇(vA)-(∇)なので-∂V/∂r+(+d/dt)(∂V/∂)=q+q(v×)です。

 

そこで,Lagrangeの方程式:(d/dt)(∂L/∂)=∂L/∂,

または(d/dt)(∂T/∂)=-∂V/∂+(d/dt)(∂V/∂)は,

 

(d/dt)(∂T/∂)=+q(×) となります。

そして,≡∂L/∂と定義するとエネルギーを意味するHamiltonianはH=pv-L=(∂L/∂)-Lとなります。

 

今の場合,対象としているのは荷電粒子の運動を与える系ですが,実際にはこれだけでなく電磁場をも含む全体で閉じています。

 

全体の系は,(自由荷電粒子+相互作用)の他に,自由電磁場:

M≡∫(ε0220)d3(c2ε0/4)(μνμν)3

をも加えた総和になります。

 

ただしFμν≡∂μν-∂νμです。

さて,粒子だけの部分系での考察を続けます。

 

電磁場がない場合の全くの自由粒子なら正準運動量は≡∂L/∂=∂T/∂ですが,電磁場がある場合はL=T-V,V=(,,t)≡qφ(,t)-qvA(,t)です。

 

Vもに陽に依存して,∂V/∂=-qですから,

=∂T/∂-∂V/∂=∂T/∂+qとなります。

よって,運動量は自由粒子の運動量(∂T/∂)に電磁場の運動量qを加えたものとなります。

 

そこで,"エネルギー=Hamiltonian"はH=pv-L=(∂L/∂)-L=(∂T/∂+q)-T+V=(∂T/∂)-T+qφです。

一方,電磁場のない自由粒子のLagrangianをL0,HamiltonianをH0とし,運動量を0と書けばL0=Tであり,00-L0

(∂L0/∂)-L0(∂T/∂)-Tです。

 

これらを用いると電磁場のある場合の量は0+q,H=H0qφと書けます。そこで,0のみの関数という意味で,

 

自由粒子のHamiltonianをH0=H0(0)と表現すれば,

H=H0(0)+qφ=0(-q)+qφ となります。

 

あるいは,これは電磁ポテンシャルをμ(φ/c,)と4元ベクトル表現すれば,/c=H0(-q)/c+qA0となります。

さらに,エネルギーと運動量も4元ベクトル表現をすると,

μ(H/c,),0μ(H0/c,0)ですから,上式は,

0=p00(-q)+qA0,または,

0-qA0=p00(-q)と書き直されます。

つまり,電磁場のないときのHamiltonianがH=f(),または0=f()というの関数の形で与えられるとき,これを0-qA0=f(-q)と書き換えれば電磁相互作用を含む形式に変換されます。

 

このpμ → pμ-qAμなる置換が,いわゆる電磁場の極小相互作用変換(minimal-coupling transformation)と呼ばれるものです。

ところで,非相対論では速度がの自由粒子の運動エネルギーTはT=m2/2で与えられるので,運動量は0=∂T/∂=mです。

 

それ故,自由粒子HamiltonianはH=2/(2m)ですから,極小相互作用変換は,H-qφ=(-q)2/(2m),つまりH=(-q)2/(2m)+qφとなります。

このとき,(Euler-)Laglange方程式と等価なHamiltonの正準方程式は,

/dt=∂H/∂=(-q)/m=,および

/dt=-∂H/∂:d(m)/dt+q(×) です。

 

したがって,これまでの手続きに従えば荷電粒子に及ぼす電気力や磁場のLorentz力による荷電粒子の正しいNewton力学の運動方程式が得られることが再確認されます。

この定式化では,電磁場があるときのHamiltonianはH=(-q)2/(2m)+qφ=2/(2m)-qpA/m+q22/(2m)+qφです。

 

そこで自由粒子のHamiltonianH02/(2m)に対して相互作用がある場合のHamiltonianをH=H0+H'と書いて,H'=qφ-qpA/m+q22/(2m)なる摂動があると解釈します。

 

この摂動H'はまたH'=qφ-q(-q)/m-q22/(2m)=qφ-qvA-q22/(2m)とも表現できます。

この一体での定式化を質量がmi,電荷がqi(i=1,2,..,N)の粒子の多体系に拡張すると,HamiltonianはH=Σi=1N[{i-qi(i,t)}2/(2mi)+qiφ(i,t)]=Σi=1N{i2/(2mj)}-Σi=1N[qii(i,t)/mi+qi2(i,t)2/(2mi)+qiφ(i,t)]になります。

 

そして,H=H0+H'なる表現においてはH0=Σi=1N{i2/(2mj)},

かつH'=Σi=1N[qiφ(i,t)-qii(i,t)-qi2(i,t)2/(2mi)} です。

さらに,対象とする帯電体が総電荷がΣiq=∫ρd3,総電流がΣiii=∫3で与えられる連続体なら,上記摂動:H'は

H'=∫(ρφ-jA)d3-∫{ρ22/(2μ)}d3

=∫jμμ3-∫{ρ22/(2μ)}d3となるはずです。

ここで,μは帯電体の(質量)密度です。 

しかし,そもそも電磁場の真空中のMawell方程式系は相対論を考慮した場合のみが正しい扱いですから,変換の出発点となる自由粒子のLagrangianは相対論的力学でのそれであるL=-mc2(1-2/c2)1/2とすべきです。

これによれば,≡∂L/∂=m/(1-2/c2)1/2です。

 

これからH=-L=m2/(1-2/c2)1/2+mc2(1-2/c2)1/2

=mc2/(1-2/c2)1/2です。

 

これらは,確かに相対論的力学で与えられる式に一致しています。

 

これからまた,(H/c)22=m22,またはpμμ=p022=m22,あるいは,H=c(2+m22)1/2というよく知られたエネルギー・運動量の不変式の表現を得ます。

古典論の段階では正エネルギーのみで考察してよいので量子論で現われる負エネルギー,または反粒子などの問題は生じません。

 

そして,(H/c)22=m22極小相互作用変換を施せば,(H-qφ)2/c2-(-q)2=m22,あるいはH=c{(-q)2+m22}1/2+qφです。

 

しかし,実は=m/(1-2/c2)1/2+qより-q=m/(1-2/c2)1/2,c{(-q)2+m22}1/2=c{m22/(1-2/c2)+m22}1/2=mc2/(1-2/c2)1/2でH-qφは自由粒子のエネルギーH-qφ=mc2/(1-2/c2)1/2です。

 

そこで,この表式は自由粒子の質量がmであるという以上の情報を含んではいません。

しかし,このH=c{(-q)2+m22}1/2+qφなる表式から正準方程式:d/dt=∂H/∂,d/dt=-∂H/∂によって自動的に電磁場の中での荷電粒子の運動方程式が得られます。

 

方程式:d/dt=-∂H/∂の左辺は,d/dt

=(d/dt){m/(1-2/c2)1/2}+q(d/dt)

=(d/dt){m/(1-2/c2)1/2}+q(∂/∂t)+q(∇)

と変形されます。

 

一方,右辺は-∂H/∂=-q∇φ-c{{(-q)∂(-q)/∂}/{(-q)2+m22}1/2で,-q=m/(1-2/c2)1/2,c{(-q)2+m22}1/2=mc2/(1-2/c2)1/2により,

 

-∂H/∂=-q∇φ+q(/∂)と書けます。

 

故に××(∇×)=∇(vA)-(∇)を用いれば,(d/dt){m/(1-2/c2)1/2}=qE+(×)を得ます。

 

これは,確かに先に書いた電磁場の中の荷電粒子に対するNewtonの運動方程式:d(m)/dt+q(×)を相対論に拡張した運動方程式になっています。

 

ところで,自由粒子のエネルギー・運動量の不変式:(H/c)22=m22,またはpμμ=m22に,H=ihc(∂/∂t),=-ihc∇,またはpμ=ihc(∂/∂xμ)を代入して簡易的に量子化をすると,

 

波動方程式:{(1/c2)∂2/∂t2-∇2+(mc/hc)2}ψ(,t)

={□+(mc/hc)2}ψ(,t)=0 が得られます。

 

これは,自由粒子の従う相対論的波動方程式の1つであるKlein-Gordon方程式として知られているものです。

 

ここにψは波動関数または粒子場です。(ただし,c≡h/(2π)で,hはPlanck定数です。)

  

しかし,電子や原子核のようなFermi粒子(Fermion)の場合は粒子の波動関数または粒子場ψは古典論のエネルギー・運動量の不変式の平方根を取った等式:H/c-(2+m22)1/2=0 を量子化して得られる方程式:

 

ihc[(1/c)(∂/∂t)-{(-ihc∇)2+m22)}1/2]ψ(,t)=0

に従うことがわかっています。

 

すなわち,ψは左辺の平方根を行列展開して線形化たDirac方程式:

(ihcγμμ-mc)ψ(,t)=0,あるいは

μμ-mc)ψ(,t)=0 に従います。

 

(ψはスピノール(spinor)表現です。)

  

そして,γμμ-mcに極小相互作用変換を施せば,{γμ(pμ-qAμ)-mc}ψ(,t)=0 となります。

 

そこで,ψ~≡ψ+γ0として量子論で自由Fermi粒子のLagrangianLをL=∫3で与えるLagrangian密度を=ψ~(ihcγμμ-mc)ψ=Σαβ~α(ihcγμμ-mc)αβψβ}とすることができます。

 

すると正準運動量は,πα≡∂/∂(∂ψα/∂t)

=c-1/∂(∂0ψα)=ic-1cψ+αです。

 

それ故,HamiltonianをH=∫3で与えるHamiltonian密度;=Σαπα(∂ψα/∂t)-=ihcψ+0ψ-ψ~(ihcγμμ-mc)ψ=-ψ~(ihcγkk-mc)ψです。

 

運動方程式(ihcγμμ-mc)ψ=0 によって,-(ihcγkk-mc)ψ=ihcγ00ψですから=ihcψ+0ψとも表現されます。

 

極小相互作用変換を施したDirac方程式:{γμ(pμ-qAμ)-mc}ψ=(ihcγμμ-qγμμ-mc)ψ=0 に対応するLagrangian密度は,

=ψ~(ihcγμμ-qγμμ-mc)ψ=Σαβ~α(ihcγμμ-qγμμ-mc)αβψβ]です。

 

そして,正準運動量はπα≡∂/∂(∂ψα/∂t)

=c-1/∂(∂0ψα)=ic-1cψ+αです。

 

Hamiltonian密度=Σαπα(∂ψα/∂t)-

=ihcψ+0ψα-ψ~α(ihcγμμ-qγμμ-mc)ψ

=-ψ~α(ihcγkk-qγμμ-mc)ψ=-ψ~(ihcγkk-mc)ψ+qψμμです。

自由粒子のHamiltonianを,改めてH0=-∫{ψ~(ihcγkk-mc)ψ}3とおくと,電磁場がある場合には,

H=-∫{ψ~(ihcγkk-mc)ψ}3+q∫(ψμμψ)d3

=H0+q∫(ψμμψ)d3と書けます。

 

Fermi粒子の4元電流密度は,jμ=qψ~γμψで与えられることがわかっていますから,H=H0+H'と書いたときの"摂動=電磁相互作用"H'は,

正確にH'=q∫(ψμμψ)d3=∫jμμ3となります。

 

以上から,最初に述べたように,"電磁場(γ線)と核の相互作用=電磁相互作用Hamiltonian"H'が確かにH'=∫jμ(,t)μ(,t)3

=∫ρ(,t)φ(,t)3-∫(,t)(,t)3

と表現されることが明確に示されました。

 

これは今日の記事の1つの目的です。

 

しかし,最初の古典論での考察はむしろ自由粒子における運動量が=∂T/∂,で与えられHamiltonianが,H=(∂T/∂)-Tになるという式から出発しています。

  

ところが,相対論における運動エネルギーは,T=mc2(1-2/c2)-1/2-mc2となるはずで,運動量を=∂T/∂で表現すると,

=∂T/∂=m(1-2/c2)-3/2です。

 

しかし,これは相対論の自由粒子Lagrangian;L=-mc2(1-2/c2)1/2から求めた正しい運動量:≡∂L/∂=m/(1-2/c2)1/2とは一致しません。

 

逆に,L-Tを計算するとL-T=mc2-mc2(1-2/c2)-1/2+mc2(1-2/c2)1/2=mc2-m2(1-2/c2)-1/2ですから,

L=T-m2(1-2/c2)-1/2+mc2です。

 

つまり,相対論力学では本質的でない定数項:mc2を無視しても自由粒子のLagrangianが運動エネルギーTと一致しないと結論されます。(ただし,HamiltonianはTと一致します。)

 

これで本記事でもう一つの目的としていたことも達成されました。

   

もう30年以上も前の話ですが,当時の指導教官に「少しぐらいつまづいても細かい事に拘泥していたら学生の数年間では目標分野の最先端まで到達できないぞ。」とか言われても,読書は繰り返しではなく1回精読主義の自分には結局無理で,今もその性格は変わりませんね。

  

他人に説明しようとして考察しているうちに,自分自身がドツボにはまるようではまだまだですね。

 

参考文献:砂川重信 著「理論電磁気学(第2版)」(紀伊国屋書店)

 

PS:将棋順位戦:B級1組の渡辺明竜王のA級昇級が確定したようです。

 

ブックオフオンライン 

iconオンライン書店 boople.com(ブープル) 

| | コメント (1) | トラックバック (0)

2010年2月 4日 (木)

将棋の順位戦結果

 昨日(2/3)には将棋のA級順位戦8回戦があり残念ながら応援していた谷川浩司17世名人は首位決戦で三浦弘行八段に敗れてしまい,羽生善治名人への挑戦権獲得から一歩後退しました。

 後は最終戦(3/2)の高橋道雄九段戦を残すのみです。

 また降級争いでは天才佐藤康光九段が藤井猛九段に敗れB級への陥落が決まりました。まだ若い(40歳)ので捲土重来を期待します。

 この結果A級の成績は次のようになりました。

6勝2敗  三浦弘行:(自力で挑戦権獲得可能)
5勝3敗 丸山忠久,谷川浩司,高橋道雄:(プレ-オフ待ち=他力本願)
4勝4敗 郷田真隆,森内俊之,木村一基
3勝5敗 藤井猛,井上慶太
1勝7敗  佐藤康光:(降級決定)

 もっと残念なのは順位戦C級2組で私と同郷(岡山県)の大山15世名人の弟子の有吉道夫九段(74歳:現役最高齢)が松本佳介六段に敗れて2勝7敗で降級点3回が決まりフリークラスは65歳定年のため来年度の現役引退が決まったことです。昨年度は最後に踏ん張ったのにね。

 私の知る限りでは加藤(一二三),塚田,小林(健二),福崎,脇などかつてのA級,かつての名人,タイトル保持者もいて10回戦まであるC級1組(昇級2名)で8回戦までで5勝3敗の北島忠雄6段も応援しています。

 今期はあと勝って7勝3敗でも昇級の目はないでしょうが有終の美を飾り少しでも順位を上げて来期以降につなげてください。

PS:今日は午後4時頃順天大病院にお見舞いに行ったにも関わらず,誕生日祝いか相手から病院内レストラン(ヒル・トップ(山の上?))でソルティ・ドッグ2杯おごられて夕方からいい気分で帰ってきた極楽トンボでした。

PS2:朝青龍に食べさせてもらっていた本末転倒の大ちゃんと相撲協会.さらにブラ下がっていたスポーツマスコミたち。。。

 アスリートの中でも闘争本能を刺激されやすい実質的な格闘技スポーツである大相撲を国技だの伝統,品格だのともったいを付けて,もはや無用となりつつある自分たちの存在意義,付加価値,利権を維持しようとする旧態勢力が,比較的自由な外の世界と内部の封建的社会とのギャップを感じている新興勢力を抑える葛藤構造は貴乃花派との確執と同根の矛盾であり,結局は格好のスケープ・ゴートにされたという感があると思いますね。

 朝青龍の何回もあった"不祥事"のうち今回の酒の上でのケンカ騒ぎに限ると,元巨人の新浦寿夫投手がちょっと前の時代の韓国プロ野球でシーズン中だけどゲームがオフの日に外の店でお酒を嗜んでいるとファンに「ダメじゃないか」と諭されることが多かったという話を思い出します。

 儒教的韓国では水島新司のホークスの景浦安武選手:「あぶさん」(ビッグコミック・オリジナル)などは受け入れてもらえない風土だったのでしょうか? そういえば,故中川昭一氏の酒での死に至る?失敗もありましたね。。

| | コメント (0) | トラックバック (0)

2010年2月 1日 (月)

今日は誕生日(60歳です。)

 本日は私の60回目の誕生日です。めでたくもありめでたくもなし。

 誰もくれないだろうけど,赤いチャンチャンコも巣鴨地蔵通りのマルジ特製の赤パンツもいらないよ。。。。

 バブルも終わりかけた40歳(1990年)の3月に自ら安定?したサラリーマンの道を捨て42歳の11月まではまだ別会社の正社員でしたが,以後はバブルも終わりただ細々と食いつないで現在に至りました。

 ただ自分に忠実に目先の個人的な利害ではなく,たとえ貧乏な道であろうと自己のイデー,自分に恥じない道だけを選んでひたすら歩んできたつもりですしこれからもそれを変えるつもりはありません。

 他人からキレイごとばかりと言われることもありますが,私はスタンドプレイをしているつもりはありません。たとえスタンドプレイであるとしてもそれで人気商売でもない私に(自己満足以外に)何の得があるのでしょう。

 最後まで普通の意味では損をするための行為であれば,甘んじてキレイごとだのスタンドプレイだのと罵ってくださって結構です。

 ところで,昨日1/31(日)は,たまたま阿佐ヶ谷の「棋友館(準棋士の小田切さんの道場)」で 将棋チェスネットの遅い新年会で昼12時から指し初めの将棋大会がありました。

 プロの北島忠雄六段,女流プロの蛸島彰子元女流名人,坂東香菜子女流2級も含め,イツモのメンバーと初参加の私の友人2名も含めた16人のハンデ戦(持ち時間20分秒読み30秒:プロは2面指し以上)で結局は優勝は北島六段の7勝0敗(誰も勝てないとはなさけない)でした。

 私も心臓病になる前に確か飛車落ち下手で1勝1敗だった蛸島さんと久しぶりに飛車落ちで教えていただいたのですが,勝負ところでウッカリ王手の桂馬のフンドシになるように自ら玉の近くの歩を突いてしまったのが直接の敗因で負けました。

 これも含め1勝3敗でブービーに近かったのですが全員に何らかの賞品があり坂東女流(通称バンカナ)の小さなサイン入り色紙(真天)をもらいました。棋書,タオルなども選択可能だったのですがお金で買えるものより直筆の色紙のほうが貴重ですよね。

 18時から近くのイタリアンレストランで2次会が開かれワインなど飲みました。今年は社団戦にも参加する約束をしました。

 それにしても杉並区のこの辺りに来ると,就職して東京に住み始めた1977年(昭和52年)から35歳で木場の3DKのマンションに移る1985年(昭和60年)までの8年間丸の内線の新高円寺駅そばの杉並区梅里1丁目の6畳間のアパートに住んでいた素朴な時代を思い出してなつかしかったですね。

 結局,早い時間からのお酒,特にワインには弱いので20時半頃,誕生日を祝って貰える予定の近くの飲み屋まで帰った頃には足がふらついていて,零時前のまだ50歳最後のうちに帰宅して今まで寝ていました。

 真面目にお勤めの方には申し訳ないのですが,今日1日だけはボーッとしてマッタリと過ごそうかなと思っています。まあ,普通のサラリーマンなら定年退職ですしね。

 そういえば,2/6の土曜日も昨年10年ぶりに会って忘年会をやった旧友たちと新宿で新年会です。このところ10年ぶりの知己とか30年ぶりの甥とかと会っているのはヒョットして死期が近いのかな? 

| | コメント (9) | トラックバック (0)

« 2010年1月 | トップページ | 2010年3月 »