« 2010年2月 | トップページ | 2010年4月 »

2010年3月

2010年3月30日 (火)

電磁波の放射(2)(多重極展開)

 「電磁波の放射」の続きです。 

静場ではなく一般の時間tに依存する電磁場の展開に移ります。 

無限に拡がった空間の中のある領域に電荷分布ρe(,t)と電流分布e(,t)があるときの電磁場の遅延ポテンシャルは(,t)=0/(4π)}∫d3'e(',t')/|'|,φ(,t)={1/(4πε0)}∫d3e(',t')/|'|で与えられます。

 

ただし,t'≡t-|'|/cです。 

しかし,ここではAμ(,t)=∫A^μ(,ω)exp(-iωt)dω,μ(',t')=μ(',t-|'|/c)=∫s^μ(',ω)exp(-iω(t-|'|/c))dωのAμ,sμを振動数で展開した表現から出発します。

さらに,exp(-iω(t-|'|/c)=exp(iω|'|/c)exp(-iωt)なのでA^μ(,ω)=∫A^inμ(,ω)+{1/(4π)}∫d3's^μ(',ω)exp(iω|'|/c)/|'|と書けます。

また,2009年10/16の記事「光(電磁波)の散乱(1)」で述べたようにz方向へ進む平面波:exp(ikz)=exp(ikrcosθ)はレーリー(Rayleigh)の公式と呼ばれる展開式:exp(ikrcosθ)=Σl=0(2l+1)iljl(kr)Pl(cosθ)で表現されることが知られています。

ただし,jl(x),nl(x)は球面ベッセル(Bessel)関数で,これらはjl(x)≡{π/(2x)}1/2l+1/2(x),nl(x)≡{π/(2x)}1/2l+1/2(x)で定義されます。Jl+1/2(x),Nl+1/2(x)はベッセル関数です。

また,同じベッセルの微分方程式のこれと異なる選択の独立解として球面ハンケル関数(Hankel):hl(1)(x),hl(2)(x)があります。これらはhl(1)(x)≡{π/(2x)}1/2[Jl+1/2(x)+iNl+1/2(x)],hl(2)(x)≡{π/(2x)}1/2[Jl+1/2(x)-iNl+1/2(x)]で定義されます。

x→ ∞でのこれらの漸近形は,それぞれ,jl(x)→ sin(x-lπ/2)/x,nl(x)→ -cos(x-lπ/2)/x,hl(1)(x)→ (-i)l+1exp(ix)/x,hl(2)(x)→ il+1exp(-ix)/xです。

さて,レイリーの公式から,より有用な公式:exp(iω|'|/c)/|'|=(iω/c)Σl=0(2l+1)jl(ωr'/c)hl(1)(ωr/c)Pl(cosχ)(r>r'>0)が得られます。

 

ただし,cosχ≡(rr')/rr'),R≡|'|=(r2+r'2-2rr'cosχ)1/2です。

これを証明します。 

(証明):ψ^(,ω)≡exp(iω|'|/c)/|'|はヘルムホルツ方程式(Helmholtz eq.) (∇2+k2)ψ^0 (k=ω/c)の解でr>>r'のとき外向き球面波になるという境界条件を満たします。

そこで,x→ ∞でのハンケル関数l(1)(x)の漸近形(-i)l+1exp(ix)/xから,exp(iω|'|/c)/|'|=exp(ikR)/R=Σl=0l(kr')hl(1)(k)Pl(cosχ)なる展開形がわかります。

一方,左辺のψ^(,ω)'の関数と見ると'に対するヘルムホルツ方程式:(∇'2+k2)ψ^0 の解でもありますから,原点r'=0 で特異でないという条件から,exp(ikR)/R=Σl=0l(kr)jl(kr')Pl(cosχ)と展開されることがわかります。

同じRにおいて,これら2つの展開表現が両立するためには,exp(ikR)/R=Σl=0ll(kr')hl(1)(kr/c)Pl(cosχ)なる展開形を持つ必要があります。

ところで,r→ ∞では,R=|'|=(r2+r'2―2rr'cosχ)1/2 ~r-r'cosχとなるため,exp(ikR)/R ~ exp{ik(r-r'cosχ)}/rです。

また,l(1)(kr) ~ (-i)l+1exp(ikr)/(kr)ですからr→ ∞ではexp{ik(r-r'cosχ)}/r=Σl=0ll(kr')(-i)l+1exp(ikr)Pl(cosχ)/(kr)が成立します。

 故に,exp(-ikr'cosχ)=Σl=0(2l+1)(-i)l+1ll(kr')/kを得ます。

一方,先のレーリーの公式:exp(ikrcosθ)=Σl=0(2l+1)iljl(kr)Pl(cosθ)においてr=r',θ=π-χを代入した後,Pl(cosθ)=Pl(-cosχ)=(-1)ll(cosχ)なる関係を用いると,exp(-ikr'cosχ)=Σl=0(2l+1)(-i)ljl(kr)Pl(cosχ)となります。

したがって,lik(2l+1),すなわちexp(ik|'|)/|'|=(ik)Σl=0(2l+1)jl(kr')hl(1)(k)Pl(cosχ)なる陽な展開公式が得られます。(証明終わり) 

さて,先にμ(,t)=Ainμ(,t)+{1/(4π)}∫d3'sμ(',t-|'|/c)/|'|をμ(,t)=∫-∞A^μ(,ω)exp(-iωt)dω,またはA^μ(,ω)={1/(2π)}∫-∞μ(,t)exp(iωt)dtなる展開形で書きました。

そしてμ(',t-|'|/c)=∫-∞s^μ(',ω)exp(-iω(t-|'|/c))dω=∫-∞s^μ(',ω)exp(iω|'|/c)exp(-iωt)dω,かつs^μ(,ω)={1/(2π)}∫-∞μ(,t)exp(iωt)dtです。

そこで,無限の過去(t=-∞)にはバックグラウンドの電磁場は存在してなかった:Ainμ(,t)=A^inμ(,ω)=0 という仮定の下で,A^μ(,ω)={1/(4π)}∫d3's^μ(',ω)exp(iω|'|/c)/||と書けます。

μ(,t)=∫-∞dωA^μ(,ω)exp(-iωt)の右辺にA^μ(,ω)の表式を代入し,さらにA^μ(,ω)の表式の右辺にs^μ(',ω)の表式を代入して整理します。

 

すると,μ(,t)={1/(4π)}-∞dt'{1/(2π)}-∞dωexp{-iω(t-t')}∫d3'exp(iω|'|/c)sμ(',t')/|'|]を得ます。

μ(φ/c,),sμ=Jμ/(c2ε0),Jμ=(cρe,e)ですから,馴染み深い形式ではφ(,t)={1/(4πε0)}-∞dt'{1/(2π)}-∞dωexp{-iω(t-t')}∫d3'exp(iω|'|/ce(',t')/|'|],

および,(,t)=01/(4π)}-∞dt'{1/(2π)}-∞dωexp{-iω(t-t')}∫d3'exp(iω|'|/c)e(',t')/|'|]です。

まず,φ(,t)の表式の右辺の被積分関数の因子exp(iω|'|/c)/|'|に,exp(iω|'|/c)/|'|=(iω/c)Σl=0(2l+1)jl(ωr'/c)hl(1)(ωr/c)Pl(cosθ')を代入します。

するとφ(,t)=Σl=0φl(,t)={1/(4πε0)}Σl=0(2l+1)-∞dt'{1/(2π)}-∞dωexp{-iω(t-t')}(iω/c)l(1)(ωr/c)l(ωr'/c)Pl(cosθ')ρe(',t')d3'を得ます。

ρe(,t)の分布領域が半径aの球面より内部に限られていて放射電磁波の角振動数ωがωa/c<<1を満たす,あるいはT=2π/ωなる振動周期Tまたは波長λ=cTがλ>>aを満たすと仮定します。

 

つまり,放射電磁波の波長λは電荷の存在領域:{r≦a}に比べて,はるかに大きいと仮定します。

ここでx~ 0 でのjl(x)=(-x)l{(1/x)d/dx}l(sinx/x)={xl/(2l+1)!!}[1-x2/{2(2l+3)}+..]なる近似展開式,およびhl(1)(x)=(-x)l{(1/x)d/dx}l{exp(ix)/x}を考えます。

すなわち,ωr'/c~ 0 では,jl(ωr'/c)=(ω/c)l{r'l/(2l+1)!!}[1-(ω/c)2r'2/{2(2l+3)}+..]であり,(iω/c)l(1)(ω/c)=(iω/c)(c)l(-r)l{(1/r)d/dr}l{exp(iωr/c)/(iωr/c)}です。

そこで,jl(ωr'/c)の展開の第1項を取ると(iω/c)l(1)(ωr/c)jl(ωr'/c) ~ (-r)l{(1/r)d/dr}l{exp(iωr/c)/}r'l/(2l+1)!!を得ます。

そして,<ρe(l)(t')>≡∫ρe(',t')r'll(cosθ')3'と置けば,φはφ(,t)={1/(4πε0)}Σl=0{(2l+1)/(2l+1)!!}-∞dt'{1/(2π)}-∞dωexp{-iω(t-t')}(-r)l{(1/r)d/dr}l{exp(iωr/c)/}<ρe(l)(t')>と表現できます。 

これはさらに,φ(,t)={1/(4πε0)}Σl=0{(2l+1)/(2l+1)!!}(-r)l{(1/r)d/dr}l-∞dt'δ(t-t'-r/c){<ρe(l)(t')>/r}と変形されます。

結局,最終形としてφ(,t)=Σl=0φl(,t)={1/(4πε0)}Σl=0{(2l+1)/(2l+1)!!}(-r)l{(1/r)d/dr}l{<ρe(l)(t-r/c)>/r};<ρe(l)(t')>≡∫ρe(',t')r'll(cosθ')3'が得られます。 

同様にして,(,t)=Σl=0l(,t)=0/(4π)}Σl=0{(2l+1)/(2l+1)!!}(-r)l{(1/r)d/dr}l{<e(l)(t-r/c)>/r};<e(l)(t')>≡e(',t')r'll(cosθ')3'を得ます。 

ここで,(,t)の展開で後の便宜のために添字をl→l-1(l=1,2,..)とシフトすると,(,t)=Σl=1l(,t)=0/(4π)}Σl=1{(2l-1)/(2l-1)!!}(-r)l-1{(1/r)d/dr}l-1{<e(l-1)(t-r/c)>/r}となります。 

 さて,得られた多重極展開の各項φl(,t),l(,t)を,"lが小さい順=遠方(rが大)での寄与が大きい順"に見てゆきます。

まず,l=0 ではφ0(,t)=<ρe(0)(t-r/c)>/(4πε0),0(,t)=0 です。

  

<ρe(0)(t-r/c)>=∫ρe(,t-r/c)d3は全電荷量qを示しています。そしてdq/dt=∫{∂ρe (,t)/∂t}d3=-∫div{e(,t)}d3=-∫r=∞e(,t)dS=0 なので,全電荷量qは時間的に一定不変です。

そこで,φ0(,t)=q/(4πε0)であり,これは実際上電荷がqの点電荷による静電場に過ぎませんから,電磁波の放射を問題にする今の場合はこの項を考慮する必要がありません。 

 次にl=1 のとき,φ1(,t)={-1/(4πε0)}(/dr){<ρe(1)(t-r/c)>/r}=<ρ(1)(t-r/c)>/(4πε02)+(d/dt)<ρe(1)(t-r/c)>/(4πε0cr)です。

ここで,<ρe(1)(t-r/c)>=∫ρe(',t-r/c)r'cosθ'3'=∫(')ρe(',t-r/c)d3'=np(t-r/c)と書けます。(t)≡∫ρe(,)d3は電気双極子モーメントです。

そこで,時間微分をd≡d/dtと表わせばφ1(,t)={1/(4πε0)}{np(t-r/c)/2npd(t-r/c)/(cr)}です。

 一方,1(,t)=0/(4π)}e(0)(t-r/c)>/r,<e(0)(t)>=e(,t)d3ですが,(t)≡∫ρe(,)d3よりd≡d/dt=∫{∂ρe(,)/∂t}d3=-∫div{e(,)}d3=∫e(,t)d3です。 

したがって,1(,t)=μ0d(t-r/c)/(4πr)と書けます。

 結局,l=1 の寄与は,φ1(,t)={1/(4πε0)}{np(t-r/c)/2npd(t-r/c)/(cr)},および1(,t)=μ0d(t-r/c)/(4πr)と書けます。

  

 この項の全てが電気双極子ベクトルとその時間微分の寄与で表わされるため,l=1の項による放射を電気双極子放射と呼びます。

ただし,先述したように(t-r/c)は原点Oの取り方に依存するのに対し,時間微分d(t-r/c)は原点の取り方には依りません。

次に,電気双極子放射による電場や磁場の具体的表現を得るため,ポテンシャルの空間微分を考えます。

 

まず,∂j{np(t-r/c)/2}=j{rp(t-r/c)/3}=pj(t-r/c)/33xj{rp(t-r/c)}/5-xj{rpd(t-r/c)/(c4)}より∇{np(t-r/c)/2}=(t-r/c)/33{rp(t-r/c)}/5{rpd(t-r/c)/(c4)}です。

同様にして,∇{npd(t-r/c)/(cr)}=d(t-r/c)/(c2)-2{rpd(t-r/c)}/(c4){rp2d(t-r/c)/(c23)}を得ます。

また,1(,t)/∂t={μ0/(4π)}2d(t-r/c)/r={1/(4πε0)}2d(t-r/c)/(c2)です。 

 そこで,電場は1(,t)≡-∇φ1(,t)-∂1(,t)/∂t={1/(4πε0)}[{-(t-r/c)/33{(t-r/c)}/5}+{-d(t-r/c)/(c2)+3(d(t-r/c))/5}+{-(2d(t-r/c))/(c23)+2d(t-r/c)/(c2)}]となります。

一方,磁場は1(,t)=∇×1(,t)={μ0/(4π)}{-×d(t-r/c)/r3×2d(t-r/c)/(cr2)}です。

 電場,磁場はそれぞれ,d,2dに比例する次の上添字が 0,1,2 の3種の部分に分類できます。

 すなわち,1(0)(,t)={1/(4πε0)}{-(t-r/c)/33((t-r/c))/5},1(0)(,t)=0;1(1)(,t)={1/(4πε0)}{-d(t-r/c)/(c2)+3(d(t-r/c))/5},1(1)(,t)={-μ0/(4π)}{×d(t-r/c)/r3};

 

 および,1(2)(,t)={1/(4πε0)}{(2d(t-r/c))/(c23)-2d(t-r/c)/(c2)},1(2)(,t)={-μ0/(4π)}{×2d(t-r/c)/(cr2)}です。

 

 そこで,電気双極子振動の角振動数ω=ck=2πc/λ=2π/T,または周期T=λ/cを用いて,d=-iω,2d=-ω2とし,r>>cT=λ(=2πc/ω)の遠方領域での主要項を評価して見ます。

  

 すると,1/(4πε0)=c2μ0/(4π)なので,1(0)~ -/(4πε03),1(1)/(4πε0cr2),1(1)iω(×)/(4πε023),1(2)~ω2{(pr)-r2}/(4πε023),1(2)~ω2(×)/(4πε032)です。

 

 そこで,大きさのオーダーは|1(0)|=O(1/3),|1(1)|=|c1(1)|=O(1/2),|1(2)|=|c1(2)|=O(1/)となります。

 

 よって,r>>cT=λの非常に遠方の領域では,O(1/)の1(2),1(2)だけが効いてきます。

  

 ところで,単位時間に単位面積を通過する電磁エネルギーは電磁場のポインティングベクトル(Poynting vector):×(×)/μ0で与えられます。

  

 したがって,/rと置くとr>>cT=λでの実質的なエネルギー流密度は(×)/μ01(2)×1(2)/μ0 ~{μ044/(16π2cr2)}|×|2=O(1/2)と評価されます。

このr>>cT=λの領域を波動帯と呼びます。波動帯でのl=1 の全寄与はk=2π/λより(4π2) S 2/λ4×(定数)で有限です。

 

電気双極子の加速度運動を示す2階時間微分2dによる1(2)×1(2)の寄与のみがr→ ∞で有限に留まり他の寄与は全て消えます。

 

さて,1(2)(,t)={1/(4πε0)}{(2d(t-r/c))/(c23)-2d(t-r/c)/(c2)},1(2)(,t)={-μ0/(4π)}{×2d(t-r/c)/(cr2)}を再掲します。

 

これから,1(2)(,t)={×1(2)(,t)}/c,1(2)(,t)=-c×1(2)(,t)が得られます。よって,1(2),1(2),/rは互いに垂直なベクトルで,この順に右手系を作っています。

 

つまり,波動帯における放射電磁波は真空中の自由電磁波と同じく共に横波であると同時に|1(2)|=c|1(2)|を満たしています。

 

そこで,複素表示でのエネルギー流:のサイクル平均は,<>=(1(2)×1(2)*)/(2μ0)=-(c×1(2)×1(2)*)/(2μ0)={c/(2μ0)}|1(2)|2で与えられます。

 

したがって,波動帯では<>={μ0/(32π2cr2)}|×2d(t-r/c)|2なる表式を得ます。特に角振動数がω=ckの双極子なら<>={μ044/(32π2cr2)}|×|2となります。

 

そこで,単位時間当たりに原点を中心とする半径rの球面を通って放射される双極子放射の全平均エネルギーは,P=∫<dS={μ0/(32π2c)}∫|×2d(t-r/c)|2sinθdθdφです。

 

さらに,2dの方向をθ=0 の極軸に取れば,|×2d(t-r/c)|2=|2d(t-r/c)|2sin2θです。

 

故に,<={μ0/(32π2cr2)}|2d(t-r/c)|2sin2θ,およびP={μ0/(12πc)}|2d(t-r/c)|2 なる陽な表式を得ました。特に角振動数がω=ckの双極子ならP=μ0324/(12π)です。

 

これを見ると,放射される電磁エネルギーの方向分布は双極子が加速振動する2dの方向(θ=0)ではゼロで,その垂直方向で最大であることがわかります。これが双極子放射の特徴です。

  

今日はここで終わります。

 

参考文献:砂川重信 著「理論電磁気学(第2版)」(紀伊国屋書店),ジャクソン 著(西田 稔 訳)「電磁気学(上),(下)」(吉岡書店)

 

PS:彼の業績の詳細はわからないけどお金の使い方についてはポール・エルデシュ(Paul Erdos)は理想的で神のような人でしたね。

 

(「放浪の天才数学者エルデシュ」(The Man Who Loved Only Numbers by Paul Hoffman(平石律子 訳)(草思社)より)

 

ブックオフオンライン 

iconオンライン書店 boople.com(ブープル)

| | コメント (0) | トラックバック (0)

電磁波の放射(1)

先日「確率と分布」シリーズを終了させたので,現在は主として次の課題「γ崩壊とメスバウアー効果」に向かっています。

γ崩壊(γ-decay)については,原子核(nucleus) ZAN の励起状態:|i>≡|Iiπii>がγ線を放出して終状態:|f>≡|Ifπff>へ転移するという現象を考察すればいいだけなのですが,量子論の議論を展開する前に電磁気学の必要な基礎知識を明確にしておかないと不安を感じます。

理論の基礎を明確化するため,まず,2010年2/6に「電磁力学と解析力学」という記事を書きました。

 これに続いて,今回は無限に拡がった空間の中の狭い領域に電荷密度(charge density)ρe(,t),電流密度(current density)e(,t)の分布が与えられていてその時間変動が激しいときに周囲の空間に電磁波が放射される現象を考察します。

 

 これを双極子放射,四重極放射etc.の重ね合わせとして捉えるため,電磁場(electromagnetic field)の多重極展開(multipole expansion)を詳述したいと思います。

しかし,まずは過去の電磁気学や光学の記事から,このテーマに必要な古典電磁気学の基本知識を抜粋して要約します。

 

主として,2007年12/6の記事「ヤングの干渉実験(2)(量子論)」と2008年9/27の記事「先進波と負エネルギー,反粒子について」の内容から抜粋コピーしてそれらを適当に修正しました。

電磁場のスカラーポテンシャル(scalar potential)をφ(,t),ベクトルポテンシャル(vector potential)を(,t)とすると電磁場の強さ(=可観測量)である電場(,t),磁場(磁束密度)(,t)これらにより(,t)=-∇φ(,t)-∂(,t)/∂t,(,t)∇×(,t)と表わされます。

以下では,簡単のために引数,tを適宜省略します。

上述のφ(,t),(,t)は電磁ポテンシャル(electromagnetic potential)と呼ばれます。

 

そして,φ,による=-∇φ-∂/∂t,∇×なる場の強さ(field strength)の表現は,任意関数Λ=Λ(,t)についてのゲージ変換(gauge)と呼ばれる変換:φ→φ+∂Λ/∂t,-∇Λに対して不変です。これを電磁場のゲージ不変性といいます。

そして,"電磁場の基本方程式(運動方程式)真空中のマクスウェル方程式(Maxwell-eq)"のポテンシャル,φによる表現は()-2(1/c2)(∂∇φ/∂t)+(1/c2)(∂2/∂t2)=μ0e,-ε02φ-ε0(∂/∂t)=ρeと書けます。

 

序文で述べたように,ρe(,t)は電荷密度,e(,t)は電流密度を表わしています。

特に,相対論的に共変な(covariant)ゲージであるロ-レンツ(Lorenz)ゲージ,つまり条件(1/c2)(∂φ/∂t)=0 を満たすようなゲージ関数Λを採用すれば,運動方程式は(1/c2)(∂2/∂t2)-2=μ0e,□φ=(1/c2)(∂2φ/∂t2)-2φ=ρ0となってφとについて対称,かつ共変性が明白な形になります。

(上では□≡(1/c2)(∂2/∂t2)-2なる微分演算子記号を用いましたが,記号□はダランベルシャン(d'Alembertian)と呼ばれています。)

ところで,これ以外のゲージを採用すると時空座標のローレンツ変換x'μ=aμννに伴う4元電磁ポテンシャルAμ=(φ/c,)の変換が,通常のA'μ=aμννの他に新しい座標系で同じゲージ条件を満たすようにするため,A'μ=aμνν+αμ(a)のような余分の補正変換αμ(a)を追加される必要があります。

そこで,こうしたゲージ関数では電磁場:Aμ=(φ/c,)が座標系の取り方に依存する量となって相対論的に正しい共変な4元ベクトルではなくなります。

したがって,非共変ゲージを採用したのでは電磁ポテンシャルは非局所的量(non-local)となります。それ故,これが信号として観測可能な量なら電磁信号が光速を超えて相対論的因果律(causality)を破ることになると考えられます。

しかし,この問題点については以前の2006年10/9の記事「非共変ゲージの非局所性(電磁場)」で論じたように,現実に観測される物理量は場の量Aμ=(φ/c,)ではなく場の強さである電場と磁場,つまりFμν≡∂Aν/∂xμ-∂Aμ/∂xνであって,これらはゲージ選択に無関係であることから解決済みです。

つまり,如何なるゲージを選択しようと場の強さは共変ゲージから得られる量と全く一致するため共変であり,そこで局所的なことも明らかですから,現実には相対論を破らないことがわかります。

つまり,"量子論おいて観測されるのは確率であって波動関数ではない。"という話と同じような意味です。

 

電磁場を示す電磁ポテンシャル:Aμ=(φ/c,)は,量子論なら光子の波動関数に相当するため,これを「物理的実在」と考えないなら何らの矛盾も生じないわけです。

さて,時空座標をxμ=(ct,),電磁ポテンシャルをAμ=(φ/c,),電荷,電流をJμ=(cρe,e)とする4元表記では,ロ-レンツゲージ:(1/c2)(∂φ/∂t)=0 は∂Aμ/∂xμ=∂μμ=0 となり,運動方程式:□=μ0e,□φ=ρe0は,□Aμ=∂ννμ=sμとなります。ただしsμ≡Jμ/(c2ε0)です。

そして,特に電荷や電流の全くない場合:Jμ=(cρe,e)=0 の真空中の自由電磁場の方程式は,□Aμ=∂ννμ=0 です。

μ(x)={1/(2π)4}∫d4k[A^μ(k)exp(-ikx)],sμ(x)={1/(2π)4}∫d4k[s^μ(k)exp(-ikx)として,Aμ,sμを"平面波の重ね合わせ=Fourier積分"で表わせば,微分方程式:□Aμ=∂ννμ=sμは代数方程式:k2A^μ(k)=-s^μ(k)に帰着します。

特に,sμ=Jμ/(c2ε0)=0 の自由場の方程式:□Aμ=∂ννμ=0 はk2A^μ(k)=0 となりますが,これはk2=kμμ=(k0)22=0 を意味します。

 

これは量子論で光子(photon)の質量がゼロなることに相当します。

そこで,自由場ではフーリエ積分表示:Aμ(x)={1/(2π)4}∫d4k[A^μ(k)exp(-ikx)]の成分である各平面波:exp(-ikx)=exp{i(kr-ωt)}の(角)振動数(frequency)ω=ck0は波数(wave number)ベクトルの関数としてω=ωk=c||と書けます。

故に,自由場では波数の4元表示kμ=(ω/c,)はkμ=(ωk/c,)となって,exp(-ikx)=exp{i(kr-ωkt)},かつexp(ikx)=exp{-i(kr-ωkt)}です。

したがって,A^μ(k)=θ(k0)δ(k2)として自由電磁場をAμ(x)={1/(2π)4}∫d4k[θ(k0)δ(k2)exp(-ikx)]と表わせば,Aμ(x)=Aμ(,t)={1/(2π)3}∫d3(2||)-1kμkexp{(-i(kr-ωkt))+ ε-kμkμ*exp{i(kr-ωkt)}となります。

ただし,akは定数係数でありεkμは偏光(polarization)を表わす単位ベクトルです。つまりεk2=εkμεkμ=(εk0)2εk2=-1ですが,これはローレンツ条件:kεk=kμεkμ=(ωk/c)εk0kεk=0 を満たすように与えられます。

次に,一般の4元電流密度sμに対しローレンツゲージの電磁場の方程式:□Aμννμμを解きます。 

□Aμ=sμなる形から形式的にAμ=□-1μと書けるので,ダランベルシァン□の逆演算子(inverse)□-1が得られればいいと思われます。実は,これは3次元のラプラシアン(Laplacian)△=∇2の逆演算子△-1を求めるのと同じ方法で求めることができます。

すなわち,もしも□D^=1なるD^が見出されれば,□-1=D^よりAμ=□-1μはAμ=D^sμと書けて形式的に解けます。

そして微分演算子□に対して□D^=1を満たす逆演算子D^=□-1は積分演算子ですから,D^を□D(x)=δ4(x)を満たす関数D(x)で解Aμ=□-1μを表現すればAμ(x)=∫d4yD(x-y)sμ(y)と書けることになります。

実際には□A0μ0を満たす積分定数A0μをも考慮して,Aμ(x)=A0μ(x)+∫d4yD(x-y)sμ(y)が一般解になります。

一般に,□D(x)=δ4(x)を満たす関数D(x)は微分演算子□のグリーン関数(Green's function)と呼ばれます。

グリーン関数D(x)を具体的に求めるため,そのフーリエ積分表示をD(x)=(2π)-4∫D^(k)exp(-ikx)d4kと書けば,デルタ関数の積分表示がδ4(x)=(2π)-4∫exp(-ikx)d4kなので,□D(x)=δ4(x)はD^(k)=-1/k2を意味します。

それ故,形式的にはD(x)=(2π)-4∫D^(k)exp(-ikx)d4k=-(2π)-4∫[exp(-ikx)/k2]d4kと書けます。

しかし,D^(k)=-1/k2は分母がゼロになる点,つまりk2=(k0)22=0 なる位置に特異点を持ちますから,このままではwell-definedではありません。

逆に,D^(k)の極(poles)k0≡±||付近の挙動を適切に定義することで,D(x)が満たす境界条件を一意に定めることが可能なので,これらの極をどのように回避してwell-definedとするか次第で望ましいD(x)を求めることができます。

仮に,D^(k)≡-1/(k2+iε)(ε>0)と選択してD(x)≡-limε→+0(2π)-4∫[exp(-ikx)/(k2+iε)]d4kとして計算してみると,詳細は省略してD(x)=D(,t)={1/(4π||)}[δ(||-ct)-δ(||+ct)]={1/(4πc||)}[δ(t-||/c)-δ(t+||/t)]を得ます。

この関数:D(x)はt→±∞や||→∞でゼロとなるという通常の境界条件を確かに満足していますから,これを電磁場を考察する際のダランベルシャン□の基本的なグリーン関数と考えることにします。

慣例に従って,D(x)をD(x)=Dret(x)-Dddv(x)と分解してDret(x)≡Dret(,t)=θ(t)D(,t)={1/(4πc||)}δ(t-||/c),Dadv(x)≡Dadv(,t)=-θ(-t)D(,t){1/(4πc||)}δ(t+||/c)と定義します。

ret,Dadvは,それぞれ遅延(retarded)グリーン関数,先進(advanced)グリーン関数と呼ばれています。t>0 の未来を表わすだけなら,そこではDadv(,t)=0 ,D(,t)=Dret(,t)なので当面の問題では遅延グリーン関数ret(,t)だけ考慮すれば十分です。 

すると,先に書いた一般解の表現μ(x)=A0μ(x)+∫d4yD(x-y)sμ(y)は,t>0 でAμ(x)=A0μ(x)+∫d4yDret(x-y)sμ(y)となります。

あるいは,自由電磁波A0μ(x)=A0μ(,t)を無限の過去t=-∞ に入射した入射電磁波Ainμ(,t)と考えるなら,Aμ(,t)=Ainμ(,t)+c∫-∞dt'∫d3'Dret(',t-t')sμ(',t')なる表式は,現時刻tまでに入射波が散乱され全ての波が重ね合わされた結果を表わす散乱現象の記述と解釈されます。

すなわち,Aμ(,t)=Ainμ(,t)+∫d3'∫-∞tdt'{1/(4π|'|)}δ(t-t'-|'|/c)μ(',t')=Ainμ(,t)+{1/(4π)}∫d3'[sμ(',t-|'|/c)/|'|]です。

一方,sμをJμ=c2ε0μに戻し無限の過去には電磁場は存在しなかった場合:Ainμ(,t)=0 を想定すると,φ(,t)={1/(4πε0)}∫d3'[ρe(',t-|'|/c)/|'|],(,t)=0/(4π)}∫d3'[e(',t-|'|/c)/|'|]となります。

 

通常の状況はこれです。 

上述の意味で,これらのポテンシャルφ(,t),(,t)を遅延ポテンシャル(遅刻ポテンシャル)と呼び,それによる電磁波を遅延波(遅刻波)と呼びます。

これらを(角)振動数ωで展開して,μ(,t)=Ainμ(,t)+{1/(4π)}∫d3'[sμ(',t-|'|/c)/|'|]をμ(,t)=∫A^μ(,ω)exp(-iωt)dω,またはA^μ(,ω)={1/(2π)}∫Aμ(,t)exp(iωt)dtと表わすこともできます。

すると,他方μ(',t-|'|/c)=∫s^μ(',ω)exp(-iω(t-|'|/c))dω=∫s^μ(',ω)exp(iω|'|/c)exp(-iωt)ですから,A^μ(,ω)=∫A^inμ(,ω)+{1/(4π)}∫d3'[s^μ(',ω)exp(iω|'|/c)/|'|]と書けます。

したがって,Gret(,ω)=exp(iωr/c)/(4πr) (r≡||)と置けば,A^μ(,ω)=∫A^inμ(,ω)+∫d3'ret(',ω)s^μ(',ω)と表現できるためret(,ω)を遅延グリーン関数と呼ぶこともあるようです。 

このret(,ω)はヘルムホルツ方程式(Helmholtz)のグリ-ン関数になっています。つまり,[△+(ω/c)2]ret(,ω)=-δ3()を満たしています。  

 

以下,遅延波,遅延ポテンシャルのみを考えればよいケースに限定して考察をします。 

次に,Aμ(,t)=(φ(,t)/c,(,t))の多重極展開というテーマに向かいますが,まず場が時間tに依らない静場(static-field):Aμ()=(φ()/c,())における多重極展開を復習します。

まず,ルジャンドル多項式(Legendre polymomials)Pl(z)の母関数展開:1/(1-2tz+t2)1/2Σl=0ll(z)から,公式:1/|'|=1/(r2+r'2―2rr'cosθ')1/2=Σl=0(rl/r'l+1)Pl(cosθ') (r<r'),Σl=0(r'l/rl+1)Pl(cosθ') (r>r')が得られます。

ただし,cosθ'=(rr')/rr'です。これは導体における鏡像法でよく使用される式です。 

静電ポテンシャル:φ()={1/(4πε0)}∫d3e(')/|'|にこの母関数展開を代入すると,r>r'(帯電領域の外側)ではφ()=Σl=0φl()={1/(4πε0)}Σl=0-(l+1)∫ρe(')r'll(cosθ')3'となります。

 右辺の展開のl=0 の項は,φ0(r)={1/(4πε0)}r-1{∫ρe(')d3'}=q/(4πε0r)となります。ただしq≡∫ρe()d3ですが,これは全電荷量です。

これは,rが十分大きい遠方から見ると,1/2以上の1/rの高次の項は全て消えて,あたかも全電荷が原点に集中しているかに見えることを示しています。

 また,l=1の項はφ1(r)={1/(4πε0)}r-2∫ρ(')r'cosθ'd3'={1/(4πε0)}r-3{∫ρe(')(rr')d3'}=np/(4πε02)です。ここで/rは方向の単位ベクトルです。

 

 ∫ρe()3は電気双極子モーメント(electric dipole moment;電気双極子能率)を示しています。

ただし,この式で定義されるは座標原点の選び方に依らない本当の意味のベクトル量であるとはいえません。 

 実際,原点Oをベクトルだけ移動したとすれば'で指定されていた位置は新原点ではベクトル"='-で表現されるので,∫ρe(')'d3'=∫ρe("+)"d3"+∫ρe("+)d3"= ∫ρe~(")"d3"+∫ρe~(")d3"=~+qとなります。 

ここで,ρe~(")≡ρe("+),~≡∫ρe~(")"d3"と定義しました。~は新原点での上記定義による双極子モーメントですが~=qですから,明らかに双極子モーメントベクトルは座標原点に依存します。 

 しかし,全電荷qがゼロのときには~=となって双極子モーメントは原点の取り方に依らない客観性を持つため,ベクトル的物理量としての意味を持ちます。

 今の多重極展開の場合には,∫ρe()3は一般に原点の選び方に依らないベクトル量ではありませんが,双極子モーメントの時間微分d/dtは如何なるときも座標原点の取り方に依らず客観的意味を持っています。

実際,~+qよりd/dt=d~/dt+(dq/dt)ですが,全電荷qは時間的に変化しない保存量なのでdq/dt=0 です。そこでd/dt=d~/dtとなるからです

さらに,l=2の項はφ2(r)={1/(4πε0)}r-3∫ρe(')r'22(cosθ')d3'={1/(8πε0)}r-3∫ρe(')r'2(3cos2θ'-1)d3'={3/(8πε0)}r-5[∫ρe('){(rr')2-(1/3)r2r'2}d3']=Q/(8πε02)と書けます。

ただし,Q≡∫ρe('){(nr')(nr')-(1/3)r'2}d3'ですが,これをテンソル成分の形で書けばQ=Σi,j=13ijij,Qijρe(){xij-(1/3)δij2}3です。

ijを成分とする2階テンソル量を電気四重極モーメント(electric quadratic moment)と呼びます。電気四重極モーメントもテンソルとしての客観的意味を持つのは全電荷qがゼロで,かつ双極子モーメントもゼロのときだけです。 

 いずれにしても,原点r=0 に近づくにつれて,φ0からφ12,..という具合に順に電荷分布の構造が全体のφに反映されてきます。

次に,静磁場のベクトルポテンシャル()=0/(4π)}∫d3'[e(')/|'|]の展開ですが,これは静電ポテンシャルφ()={1/(4πε0)}∫d3'[ρ(')/|'|]の展開とほぼ同様に行なうことができます。

すなわち,()=Σl=0l()={μ0/(4π)}Σl=0-(l+1)e(')r'll(cosθ')3'が直ちに得られます。

そして,まず右辺のl=0 の項を調べると0()={μ0/(4πr)}e(')d3'です。

しかし,eに対して式ek()=∂j(xkej)-xkjej,つまりe()=div(:e)-diveが成立します。これと時間に依らない連続の方程式:dive0 を考慮すればe()=div(:e)を得ます。

そして,電流密度e()がゼロでない領域が空間の有限部分に限られているため,全電流はゼロです。つまり=∫e ()d3=0 ですからl=0 の0()={μ0/(4πr)}e(')d3'=0 です。

次に,l=1の項は1()={μ0/(4π)}r-2e(')r'cosθ'd3'=0/(4π)}r-3{∫e(')(rr')d3'}です。

 

ここで,{'×e(')}×e(')(')-'(e('))を用いると,∫e(')(rr')d3'=∫{'×e(')}×3'+∫'(e('))d3'です。

 一方,∂j'{xk'(')ej(')}=k'(')(div'e)+(')ek(')+k'(e('))=jek(')(')+xk'(e('))ですが,両辺を体積積分すると左辺は表面積分となって消えるため,∫'(e('))d3'=-∫e(')(rr')d3'です。

 そこで,∫e(')(rr')d3'=(1/2)[∫{e(')}d3']×を得ます。それ故,(1/2)∫{×e()}d3と置くと1()=μ0(×)/(4πr3)と表現できます。

 

 を磁気双極子モーメント(magnetic dipole moment)と呼びます。 

特に電流が1つの閉曲線Cに沿って流れる線状電流なら,原点OをCに囲まれた平面内に取り,電流の強さをIと書けばe()d3={∫Se()dS}d=Idより,=(1/2)∫{×e()}d3=(I/2)C(×)です。

ところが,(1/2)C(×)はCで囲まれた平面に垂直で電流Iの向きに右ネジを回すとネジの進む向きを持ち,Cで囲まれた領域の面積Sに等しい大きさを持つベクトルを表わすので,その向きの単位ベクトルをと書けば=ISを得ます。

 したがって,こうした線状電流の平面回路は,それが作る磁場に関しては回路を周辺とする板状の面に単位面積あたりIの磁気モーメントを持つ磁石を曲線Cの囲む平面Sに垂直に敷き詰めたものと同等です。

それ故,回路が十分微小でrが大きいときには()=1()=μ0(×)/(4πr3)と書けます。

 逆に空間内に()なる体積密度で磁気双極子が分布しているとし,微小体積内でのその巨視的意味での平均を()と書けば,()={μ0/(4π)}∫{(')×(')/|'|3}d3'です。

 ところが,rot'{(')/|'|}=rot'(')/|'|-(')×(')/|'|3です。そして∫rot'{(')/|'|}d3'=0 です。

 故に()={μ0/(4π)}∫[rot'(')/|'|]d3'です。

 

 これを()=0/(4π)}∫d3'[e(')/|'|]なる表式と比較すると,()なる磁気双極子の空間分布はm()=rot()で与えられる電流mの空間分布と見なすことができます。mは外部磁場による物質の磁化に基づく磁化電流です。 

l=2の磁気四重極項:2(r)={μ0/(4π)}r-3e(')r'22(cosθ')d3'={μ0/(8π)}r-3e(')r'2(3cos2θ'-1)d3'={3μ0/(8π)}r-5[∫e('){(rr')2-(1/3)r2r'2}d3']は電気と比較して無視できるオーダーなので磁気四重極子についてこれ以上の詳細な論議は省略します。 

()について,原点r=0 に近づくにつれて,1を初めとして2,3,..と電流分布の構造が全体のに反映されてゆきます。

長くなったため,ここでひとまず終わりにします。(つづく)

 

参考文献:砂川重信著「理論電磁気学(第2版)」(紀伊国屋書店),ジャクソン 著(西田 稔 訳)「電磁気学(上),(下)」(吉岡書店)

 

ブックオフオンライン 

iconオンライン書店 boople.com(ブープル) 

| | コメント (0) | トラックバック (0)

2010年3月28日 (日)

お花見をしました。(久しぶり)

 丁度3年前までいた会社の先輩1人,後輩1人に誘われて昨日27日の朝,上野公園で花見をしました。門前仲町での夜勤明けの花見ですね。自宅のすぐ前の都バスの巣鴨駅南口バス停から浅草雷門行きに乗って千駄木三丁目で上野松阪屋行きに乗りかえ30分くらいで着きました。ほぼドアツードアです。

 桜は五分から六分咲き程度でしたがまだかなり肌寒かったです。しかし土曜日のせいか歩いているとすぐ人にぶつかるほどの人出でした。(昼過ぎには引き上げて浅草で飯を食べ建設中のスカイ・ツリーも見てきました。)

 桜を眺めていると,満開の桜の中にいると狂気になってしまうという話,背中には鬼がしがみついて離れないという内容?の恐ろしい安吾の小説「桜の森満開の下」を思い出しました。満開のときを想像したのです。

 これは学生時代の後半の頃に,ロートレアモン,ランボー,ボードレールと並んで,太宰や中也などシュールやデカダンの文学を夢中になって読んでいた頃のことですから40年以上も前ですね。

 読んだことはないけど「桜の木の下には死体が埋まっている。」という梶井基次郎の有名な話もあるらしいです。

 感受性が強いなら,もっと濃い色の満開の桜に囲まれてしまうと咽せるように感じ,富士の樹海の中とは別の意味で気が変になるのかも知れません。

 ところで,前会社といっても派遣会社ですが旧知の同僚によると,派遣先の大きな証券会社の対象の部門そのものがこの5月で閉鎖になるため,そこの正社員も含めリストラで解雇の対象になり仕事がなくなるらしいです。

 このメンバーでの花見も今年限りとか寂しい話をされました。まだまだ,そうしたセチ辛い状況が続いているのですね。

PS:宮沢賢治の「アメニモマケズ」ではないですが,若い頃は当時の学生運動における思想などを通じ社会的上昇志向(立身出世,金銭欲,名誉欲etc.)と無縁の清貧な生活を目指そうとしました。

 そして自己のライフワーク(実存)についても金銭の授受,産学共同(社会に貢献するという意味では否定しませんが営利企業にくみするという意味)を拒否して人知れず趣味嗜好とする生き方を頭の中では理想としていました。

 しかし,右の頬を打たれたら左の頬を差し出す。汝の敵をも愛す。

 頭の中でいくらキレイごとをとなえようと,神でもない平凡な人間の1人である以上,私も内在するドロドロとした欲望を制御できず,意識するしないに関わらず,時代の支配的な価値観に抵抗できるわけもなく,現実の生活では上昇志向をやめることは不可能でした。

 しかし,幸か不幸か,結果としてそうした上昇志向的試みは全て失敗したために,現状はささやかながら理想的生活形態?になっています。イヤ,単なる負け惜しみ,負け犬の遠吠えかな?

 

ブックオフオンライン 

iconオンライン書店 boople.com(ブープル)

| | コメント (0) | トラックバック (0)

2010年3月24日 (水)

確率と分布関数(11)(区間推定)(終了)

 確率と分布関数の続きです。今日の記事でこの課題は終わりです。 

[定義14-1]:母集団分布p(x;θ)を持つ母集団からの任意標本をX1,X2,..,Xnとし,適当な正の数:(1-α)>0 (例えば 0.95(α=0.05),0.90(α=0.10),..)を与えます。

これに対して,これらの標本の適当な関数θ^1(X1,X2,..,Xn),θ^2(X1,X2,..,Xn)を選んでP(θ^1(X1,X2,..,Xn)<θ<θ^2(X1,X2,..,Xn))=1-αが成立するようにできるとき,この区間(θ^1,θ^2)を信頼度(confidence level)が(1-α)×100%の信頼区間(confidence interval)という。

 

また,θ^1,θ^2の値を信頼限界(confidence limit)という。

[例14-2]:信頼度:(1-α)×100%の信頼区間(θ^1,θ^2)を求める方法

(1)任意標本をX1,X2,..,Xnと母数θを含む確率変数(統計量):T(X1,X2,..,Xn;θ)であって,その確率密度関数:g(t)がθを含まないものを選ぶ。

(2)P(t1<T(X1,X2,..,Xn;θ)<t2)=∫t1t2g(t)dt=1-α (0<α<1)を満たすt1,t2を求める。

(3)左辺のt1<T(X1,X2,..,Xn;θ)<t2を変形してP(θ^1(X1,X2,..,Xn)<θ<θ^2(X1,X2,..,Xn))=1-αを満たす(θ^1,θ^2)を求める。

[例14-3]:正規母集団(normal population):N[μ,σ2]の母平均μの区間推定

(1)σ2が既知(σ2=σ02)の場合

 母集団分布の確率密度関数はp(x;μ)=(2π)-1/2σ0-1exp{-(x-μ)2/(2σ02)}です。

任意標本X1,X2,..,Xnに対し,標本平均を<X>≡Σj=1nj/nと置き,<X>をμの推定量とすると,これは明らかにE[<X>]=μを満たすのでμの不偏推定量(unbiased estimator)です。

また,Var[<X>]=σ02/nにより推定量の有効性(efficiency)はe[<X>]≡(nE[{∂[logp(X;μ)]/∂μ}2]Var[<X>])-1=1です。そしてlim n→∞ P(|<X>-μ|≧ε)=0 も成立するため,<X>は有効推定量,一致推定量(consistent estimator)でもあります。

そして,変数<X>は正規分布:N[μ,σ02/n]に従うため,変数:n1/2(<X>-μ)/σ0は標準正規分布:N[0,1]に従います。

 

それ故,1-α=P(-x0<n1/2(<X>-μ)/σ0<x0)=P(<X>-x0σ0/n1/2<μ<<X>+x0σ0/n1/2);(2π)-1/2-x0x0exp(-t2/2)dt=1-α,or (2π)-1/20x0exp(-t2/2)dt=(1-α)/2と表現できます。

 μ^1≡<X>-x0σ0/n1/2,μ^2≡<X>+x0σ0/n1/2と置くと,これらはX1,X2,..,Xnの関数です。結局,この場合の(1-α)×100%信頼区間は,(μ^1,μ^2)≡(<X>-x0σ0/n1/2,<X>+x0σ0/n1/2)となります。

μ^1,μ^2は確率変数ですが,区間の長さは(μ^2-μ^1)=2x0σ0/n1/2で一定です。

 もしも,α=0.05を与えて 1-α=0.95,or (1-α)/2=0.475 とすればx0≒1.96なので,95%信頼区間は,(<X>-1.96σ0/n1/2,<X>+1.96σ0/n1/2)で与えられることがわかります。

(2)σ2が未知の場合

 任意標本X1,X2,..,Xnに対して,標本平均を<X>≡Σj=1nj/nと置き,やはり<X>をμの推定量μ^とします。前と同様,E[<X>]=μであり<X>はμの不偏推定量です。

また,S2≡Σj=1n(Xj-<X>)2/nとします。こうすればnS22=Σj=1n{(Xj-<X>)22}です。

 

ただし,今はμの推定量<X>を問題にしているので余談になりますが,3/12の記事「確率と分布関数(8)」の[定理11-5]:"E[{Σj=1n(Xj-<X>)2}/(n-1)]=σ2"によれば,分散σ2の不偏推定量はS2ではなく不偏分散:S02≡Σj=1n{(Xj-<X>)2/(n-1)}です。

そして,n変数:X1-<X>,X2-<X>,..,Xn-<X>は全て正規分布:N[0,σ2]を持ちますが,Σj=1n(Xj-<X>)=0 ですから,独立な確率変数は(n-1)個だけです。

そこで,2/19の記事「確率と分布関数(4)」の[定理6-15の系]:"X1,X2,..,Xnが全て正規分布N[μ,σ2]を持つn個の独立確率変数ならばΣj=1n{(Xj-μ)22}は自由度nのχ2分布を持つ。"からnS22=Σj=1n{(Xj-<X>)22}は自由度(n-1)のχ2分布に従います。

 また,(<X>-μ)/(σ/n1/2)は標準正規分布:N[0,1]に従うことがわかっています。

確率と分布関数(4)の[定理6-17]:"確率変数XとYが独立でXがN[0,1],Yが自由度nのχ2分布を持つならばT≡X/(Y/n)1/2は自由度nのt分布を持つ。"により,T≡{(<X>-μ)/(σ/n1/2)}/[nS2/{(n-1)σ2}]1/2=(n-1)1/2(<X>-μ)/S=(<X>-μ)/S0と置けばTは自由度(n-1)のt分布に従います。

 

 よって,1-α=P(-t0<(<X>-μ)/S0<t0)=P(<X>-t00<μ<<X>+x00);[Γ(n/2)/{(n-1)πΓ((n-1)/2)}1/2]∫-t0t0{1+t2/(n-1)}-n/2dt=1-α,or );[Γ(n/2)/{(n-1)πΓ((n-1)/2)}1/2]∫0t0{1+t2/(n-1)}-n/2dt=(1-α)/2を得ます。

そこで,この場合は(1-α)×100%信頼区間は(μ^1,μ^2)≡(<X>-t00,<X>+t00)となります。

ここまで,簡単なケースについて母集団からの標本によって母数の「区間推定(interval estimation)」を行うという概念を紹介しましたが,この他,同じく母集団からの標本に基づいて,"ある仮説=帰無仮説(null hypothesis)"の「仮説検定(test of hypothesis)」を行なうという概念もあります。

こちらは,"標本から得られる統計量有意水準(significance level):αの母集団の確率分布の(1-α)の範囲からはずれていれば,母数に関する仮説が誤っている可能性が強い。"と判断します。

まあ,推定と検定はその推論の向きが逆の関係であるというだけで本質的な差異はないと思われるので,検定の詳細は省略します。

少し具体的な検定の例として2007年3/23の記事「タミフルと異常行動の因果性」があるので,よかったら参照してください。

さて,重回帰式(multiple regression):Y=x1β1+x2β2+..+xpβp+ε=Σk=1pkβk+εの回帰係数(regression voefficients):β^1,β^2,..β^pの区間推定,または有意性検定を論じるために,前記事「確率と分布関数(10)」の最後の部分を再掲します。

(再掲記事):

[定義13-5]:n個の標本Y1,Y2,..,YnをYj=xj1β1+xj2β2+..+xjpβp+εj=Σk=1pjkβk+εj (j=1,2,..,n)と置く。ただしβk(k=1,2,..,p)は未知母数でありxjk(j=1,2,..,n;k=1,2,..,p)は既知定数である。

εj(j=1,2,..,n)は誤差で,これらは互いに独立な確率変数であって全てN[0,σ2]に従うと仮定する。これを線形回帰モデルという。

β^kをβkの推定量とするとき,Yj-Σk=1pjkβ^k(j=1,2,..,n)を残差(residual)という。残差の平方和:Q(β^)=Σj=1n(Yj-Σk=1pjkβ^k)2を最小にする回帰係数:β^=(β^1,β^2,.., β^p)を求める方法を最小二乗法(method of minimum square)という。

先にQ(β^1,β^2)の最小値を与えるβ^1,β^2を回帰係数とする回帰直線y=β^1+β^2xを求めた手続きを単回帰(sigle redression)と呼ぶのに対して上記のp≧3の手続きを重回帰(multiple linear regression)という。

そして,Q(β^)が最小になるための必要条件:-(1/2)(∂Q/∂β^k)=Σj=1n[xjk{Yj-(xj1β^1+xj2β^2+..+xjpβ^p)}]=0 (k=1,2,..,p)を正規方程式(normal equations)と呼ぶ。

(注):具体的に正規方程式を解きます。

正規方程式はΣj=1n(xjkj1β^1+xjkj2β^2+..+xjkjpβ^p)=Σj=1njkj (k=1,2,..,p)です。

kl≡Σj=1njkjl,Dk≡Σj=1njkjと置けば,正規方程式はΣl=1pklβ^l=Dk (k=1,2,..,p)と書けます。これは(p×p)係数行列Sとp次元縦ベクトル:β^≡t(β^1,β^2,..,β^p),t(D1,D2,..,Dp)による行列表現ではSβ^=です。

また,t(Y1,Y2,..,Yn),kt(x1k,x2k,..,xnk) (k=1,2,..,p)なるn次元縦ベクトルを用いるとSkl=Σj=1njkjltkl,Dk=Σj=1njkjtk(k,l=1,2,..,p)ですから,(n×p)行列XをX≡(1,2,..,p)で定義すると,S=tXX,tと書けます。

さらに,Yj=Σk=1pjkβk+εj (j=1,2,..,n)もβt12,..,βp),εt12,..,εn)により,=Xβεですからt=Sβtεです。

S=tXXについてdetS≠0と仮定すれば,T=(tij)≡S-1が存在するので正規方程式Sβ^=から,"β^=S-1=Tなる解=回帰係数"が得られます。

X=(1,2,..,p)は既知定数成分の行列なのでS=tXX,T=S-1も確率変数ではないため,E[β^]=S-1E[]=S-1E[Sβtε]=E[β]+S-1 tXE[ε]=βよりβ^はβの不偏推定量です。(注終わり)※

[定理13-6]:Cov(β^i,β^j)=tijσ2,特にVar(β^i)=tiiσ2 (i,j=1,2,..,p),またQ(β^)=Σj=1nj2-Σk=1pkβ^kであり,E[Q]=(n-p)σ2である。(再掲終わり)◎

さて,Q(β^)を改めてSe2≡Σj=1n(Yj-Σk=1pjkβ^k)2と定義すれば,定理からE[Se2]=E[Q]=(n-p)σ2です。そしてコクラン(Cochran)によれば,Se22は自由度(n-p)のχ2分布に従います。

p個の説明変数x1,x2,..,xpと定数項β0を持つ重回帰式:Y=β0+x1β1+..+xpβp+ε=β0+Σk=1pkβk+εは,(p+1)個の説明変数x1,x2,..,xp+1による式:Y=x1β1+x2β2+..+xp+1βp+1+ε=Σk=1p+1kβk+εにおいてx1=1とした後,変数の添字を(xkk) → (xk-1k-1)とシフトしたものに一致します。

そこで,このときの誤差の二乗和Se2=Σj=1n(Yj-β^0-Σk=1pjkβk^)2から作った統計量Se22は自由度(n-p)ではなく自由度(n-p-1)のχ2分布に従います。

そこで,Ve≡Se2/(n-p-1)と置くと,これはE[Ve]=σ2を満たすので,これが重回帰モデルにおける不偏分散です。

これは,確かに単回帰Y=β^1+β^2x(p+1=2)のときの不偏分散Se2/(n-2)の拡張になっています。

 

不偏分散Veを用いると,(n-p-1)Ve=Se22が自由度(n-p-1)のχ2分布に従うと表現できます。

一方,回帰係数:β^i(i=0,1,2,..,p)はβ^=S-1=T,tでE[β^i]=βi,Var(β^i)=tiiσ2により,正規分布N[βi,tiiσ2]に従うことがわかります。そこで(βi-βi)/(tii1/2σ)は標準正規分布N[0,1]に従います。

そこで,再び先述の「確率と分布関数(4)」の[定理6-17]:"確率変数XとYが独立でXがN[0,1],Yが自由度nのχ2分布を持つならばT≡X/(Y/n)1/2は自由度nのt分布を持つ。"から,(β^i-βi)/(tiie)1/2は自由度(n-p-1)のt分布に従うことが言えます。

以上から,t分布の(1-α)信頼区間:(-t0,t0)を,1-α=P(-t0<(β^i-βi)/(tiie)1/2<t0)で与えることができます。

 

このt0値を具体的にt分布表から読めば(1-α)信頼区間が得られるわけです。例えば自由度が(n-p-1)=60の場合にα=0,05,1-α=0.95の95%信頼区間を与えるt0はt0=2.00です。

なお,これを書く動機となった先輩から受けた質問の2010年2/5の2度目のメールの内容は以下の通りです。

:一寸,多重回帰で質問です。

「t値」って分かりやすい言葉で説明したらどうなりますか?

t値の式は,[変量iのt値(i)]=[回帰係数(i)/標準誤差(i)]です。

ただし,標準誤差(i)=root(sii・Ve)

ii:偏差平方和,偏差積和行列の逆行列のii成分

e:不偏分散=(残差平方和)/(n-p-1)

n:サンプル数

p:説明変量の数,です。

この変量iの標準誤差(i)が良く分かりません。

,(sii:偏差平方和,偏差積和行列の逆行列のii成分)とは何のことかも分かりません。

 EXCELである説明変量を100倍して回帰を取ったら,ちゃんと回帰係数は元の100分の1になるけれどt値は変わらないんだね。

 

 標準誤差が偏差平方和,偏差積和行列の逆行列を基にして求められているからだろうと思うけれど。

それと一般に(ネットで見たけれど),t値の絶対値が2以上だったら良いというのはどういう理由か分かりますか?

以上,簡単な日本語で説明できればお願いします。◎

(注):メール上の行列S=(sij)は私の説明ではT=(tij)=S-1なので,siiにはtiiが対応している他は,共通の記号を使用しています。これで質問に対する回答は全て答えたと思います。(了)※

しかし,ちょっとした質問を動機にして昔(約20年前)勉強したノ-ト3冊全部を読み直し,自分の復習やより深い理解を目指してくどい説明をしたためウザイと取られたと想像します。

しかし,私の勝手な自己満足の方は十分充足されました。

 

取り合えず,シリーズ記事の1つのテーマは片付いたので,次から別の課題に集中できます。

参考文献:藤沢武久 著「新編 確率・統計」(日本理工出版会)

PS:3/25(木) 朝起きたら頭が痛くて寒気がする。。ウーン,この身体は天侯,気温通りだなあ。。部屋の中に古い精神安定剤が落ちてたのでそれを飲んで寝ます。

     

 

ブックオフオンライン 

iconオンライン書店 boople.com(ブープル) 

| | コメント (1) | トラックバック (3)

2010年3月23日 (火)

確率と分布関数(10)(線形回帰の基礎)

確率と分布関数の続きです。 

 まず,最小二乗法の話をします。これは必ずしも確率の話ではなく,実際の観測値をモデル予測式を想定して予測する手法の1つです。

すなわち,多数の実測値データとモデル式による予測値の差の二乗和を最小にする予測モデル式中の最適パラメータ値を求める方法です。

[定義13-1]:x-y平面上にn個の点(xj,yj)(j=1,2,..,n)(散布図)が与えられているとする。

幾つかのパラメータを持つモデル式:y=f(x)に対し,x=xjにおける実測値yjと予測値y=f(xj)の差εj≡yj-f(xj)の二乗和:Q≡ε12+ε22+..+εn2=Σj=1n[yj-f(xj)]2を最小にする曲線(=回帰曲線:regression curve)f(x)(またはそのパラメータ)を定める方法を最小二乗法(method of minimum square)という。

 特に,予測式:f(x)が直線f(x)=β1+β2xの場合はx=xjにおける差はεj≡yj-(β1+β2j)(j=1,2,..,n)である。二乗和:Q=Q(β12)≡ε12+ε22+..+εn2=Σj=1n[yj-(β1+β2j)]2を最小にするβ12の値を求める方法は特に線形最小二乗法(linear method)といわれる。

線形最小二乗法でQの最小値を与える係数値をβ1=β^12=β^2とするとき,最適直線y=β^1+β^2xを回帰直線(regression line),係数β^1,β^2を回帰係数(regression coefficients)と呼ぶ。

12)が最小になるための2つの必要条件は∂Q/∂β1=-2Σj=1n[yj-(β1+β2j)]=0 ,および∂Q/∂β2=-2Σj=1n[xj{yj-(β1+β2j)}]=0 である。これを正規方程式(normal equations)という。

正規方程式を満たす解の値β1=β^12=β^2を解けば,β^2={Σj=1njj-n<x><y>}/{Σj=1nj2-n<x>2}=Σj=1n(xj-<x>)(yj-<y>)/{Σj=1n(xj-<x>)2},β^1=<y>-β^2<x>を得る。

 

ただし,<>は標本平均,すなわち<x>≡Σj=1nj/n,<y>≡Σj=1nj/nである。

さらに,∂Q2/∂β12=2n,∂Q2/∂β1∂β2=2Σj=1nj,∂Q2/∂β22=2Σj=1nj2なので,(∂Q2/∂β1∂β2)2-(∂Q2/∂β12)(∂Q2/∂β22)=4(Σj=1nj)2-4n(Σj=1nj2)=-4nΣj=1n (xj2-<x>)2≦0 が成り立つ。

 

それ故,β1=β^12=β^2は確かにQの"唯一の極小値=最小値"を与える。

[定理13-2]:ある変量Yが他の変数xに対してY=β1+β2x+ε (εは正規分布:N[0,σ2]に従う誤差)と表わされるとき,最尤法におけるβ12の推定値は最小二乗法による回帰係数と一致する。

(証明):x=xjのときのYの測定値をyjとすると,Yは正規分布N[β1+β2j2]に従うため,"Y1,Y2,..,Ynの同時確率分布関数=尤度関数"はL=(2πσ2)-n/2exp[-Σj=1n{yj-(β1+β2j)}2/(2σ2)]=(2πσ2)-n/2exp[-Q(β12)/(2σ2)]で与えられます。

 したがって,尤度(likelihood)Lを最大にするβ12がQ=Q(β12)を最小にするβ12に等しいことは明らかです。(証明終わり)

[定理13-3]:[定理13-2]と同じ条件下でY=β1+β2x+εを与える推定量β1=β^12=β^2は不偏推定量(unbiased estimator)である。

(証明):今のケースではβ^2=Σj=1n(xj-<x>)(Yj-<Y>)/{Σj=1n(xj-<x>)2},β^1=<Y>-β^2<x>です。

1,x2,..,xnが確定値であるのに対し,これらに対応するY1,Y2,..,Ynは様々な値を取る母集団の任意標本であると考えられます。

すると,Yj=β1+β2j+εj,かつE[εj]=0 からE[β^2]=Σj=1n(xj-<x>)E[Yj-<Y>]/{Σj=1n(xj-<x>)2}=Σj=1n(xj-<x>){β2(xj-<x>)}/{Σj=1n(xj-<x>)2}=β2,E[β^1]=E[<Y>-β^2<x>]=β1+β2<x>-β2<x>=β1を得ます。(証明終わり)

[定理13-4]:回帰係数β^1,β^2の分散,共分散は次の性質を有する。

 

(1)Var[β^1]=σ2j=1nj2)/{nΣj=1n(xj-<x>)2},Var[β^2]=σ2/{Σj=1n(xj-<x>)2},Cov[β^1,β^2]=-σ2<x>/{Σj=1n(xj-<x>)2}である。

 

(2)V≡Σj=1n{Yj-(β1+β2j)}2/(n-2)は,"分散:σ2の不偏推定量=不偏分散"である。

(証明):(1)β^2=Σj=1n(xj-<x>)(Yj-<Y>)/{Σj=1n(xj-<x>)2}にYj=β1+β2j+εj,および<Y>=β1+β2<x>+<ε>を代入すると,β^2=Σj=1n(xj-<x>){β2(xj-<x>)+εj-<ε>}/{Σj=1n(xj-<x>)2}となります。

 そこで,β^2-β2=Σj=1n(xj-<x>)(εj-<ε>)/{Σj=1n(xj-<x>)2}ですが,E[β^2-β2]=0 なのでVar[β^2]=E[(β^2-E[β2])2]=E[(β^2-β2)2]=E[{Σj=1n(xj-<x>)(εj-<ε>)}2]/{Σj=1n(xj-<x>)2}2を得ます。

ところが,E[εj]=E[<ε>]=0,E[εj]=σ2なのでVar[β^2]=E[Σj=1n(xj-<x>)2j-<ε>)2]/{Σj=1n(xj-<x>)2}2=Σj=1n(xj-<x>)2E[(εj-<ε>)2]/{Σj=1n(xj-<x>)2}2=E[εj2]/{Σj=1n(xj-<x>)2}=σ2/{Σj=1n(xj-<x>)2}です。

それ故,Var[β^1]=Var[Y-β^2<x>]=Var[Y]+<x>2Var[β^2]=σ2/n+σ2<x>2/{Σj=1n(xj-<x>)2}=σ2j=1nj2)/{nΣj=1n(xj-<x>)2}が得られます。

また,Cov[β^1,β^2]=E[β^1β^2]-β1β2=E[(<Y>-β^2<x>)β^2]-β1β2=E[<Y>β^2]-(Var[β^2]+β22)<x>-β1β2です。

ここで<Y>=β1+β2<x>+<ε>,E[β^2]=β2より,E[<Y>β^2]=β1β2+β22<x>+E[β^2<ε>]です。

右辺最後の項は,E[β^2<ε>]=E[Σj=1n(xj-<x>)(Yj-<Y>)<ε>]/{Σj=1n(xj-<x>)2}です。

 

しかし,Yj-<Y>=β2(xj-<x>)+εj-<ε>より,右辺の分子=E[Σj=1n(xj-<x>)(Yj-<Y>)<ε>]=Σj=1n(xj-<x>)E[(Yj-<Y>)<ε>]=β2E[<ε>]Σj=1n(xj-<x>)2+Σj=1n(xj-<x>)E[(εj-<ε>)<ε>]=0 です。

故に,結局Cov[β^1,β^2]=β1β2+β22<x>-(Var[β^2]+β22)<x>-β1β2=-<x>Var[β^2]=-σ2<x>/{Σj=1n(xj-<x>)2}を得ます。

(2)<Y>=β^1+β^2<x>+<ε>なので,Yj-β^1-β^2j=Yj-<Y>-β^2(xj-<x>)です。

そこでj=1n(Yj-β^1-β^2j)2=Σj=1n(Yj-<Y>)2+Σj=1nβ^22(xj-<x>)2-2β^2Σj=1n(Yj-<Y>)(xj-<x>)=Σj=1n(Yj-<Y>)2+Σj=1nβ^22(xj-<x>)2-2β^2Σj=1n(xj-<x>){β^2(xj-<x>)+εj-<ε>}です。

 

つまり,Σj=1n(Yj-β^1-β^2j)2=Σj=1n(Yj-<Y>)2-Σj=1nβ^22(xj-<x>)2-2β^2Σj=1n(xj-<x>)(εj-<ε>)と書けます。

故に,E[Σj=1n(Yj-β^1-β^2j)2]=Σj=1nE[(Yj-<Y>)2]-Σj=1n(xj-<x>)2E[β^22]-2Σj=1n(xj-<x>)E[β^2j-<ε>)]=Σj=1nE[Yj2]-nE[<Y>2]-Σj=1n(xj-<x>)2E[β^22]なる式を得ます。

ところが,E[Yj2]=Var[Yj]+E[Yj]2=σ2+(β1+β2j)2,E[<Y>2]=Var[<Y>]+E[<Y>]2=σ2/n+(β1+β2<x>)2j=1n(xj-<x>)2E[β^22]=Σj=1n(xj-<x>)2(Var[β^2]+E[β^2]2)=σ2+β22Σj=1n(xj-<x>)2です。

 したがって,E[Σj=1n(Yj-β^1-β^2j)2]=nσ2+Σj=1n1+β2j)2-σ2-n(β1+β2<x>)2-σ2+β22Σj=1n(xj-<x>)2=(n-2)σ2となります。

以上から,E[Σj=1n{Yj-(β^1+β^2j)}2/(n-2)]=σ2が示されました。(証明終わり)

さて,これまでの論議は線形最小二乗法において,変量Y=β1+β2x+εなる式の独立変数がx個だけのいわゆる単回帰です。

以下では,これをY=x1β1+x2β2+..+xpβp+ε=Σk=1pkβk+εなのように独立変数がp個の多変数x1,x2..,xpの重回帰モデルに拡張します。(ただし,x1β1が単に定数β1があるようなx=1(一定)の式も含みます。)

[定義13-5]:n個の標本Y1,Y2,..,YnをYj=xj1β1+xj2β2+..+xjpβp+εj=Σk=1pjkβk+εj (j=1,2,..,n)と置く。ただしβk(k=1,2,..,p)は未知母数であり,xjk(j=1,2,..,n;k=1,2,..,p)は既知定数である。

εj(j=1,2,..,n)は誤差で,これらは互いに独立な確率変数であって全てN[0,σ2]に従うと仮定する。これを線形回帰モデルという。

β^kをβkの推定量とするとき,Yj-Σk=1pjkβ^k (j=1,2,..,n)を残差(residual)という。残差の平方和:Q(β^)=Σj=1n(Yj-Σk=1pjkβk^)2を最小にする回帰係数:β^=(β^1,β^2,..,β^p)を求める方法を最小二乗法という。

先にQ(β^1,β^2)の最小値を与えるβ^1,β^2を係数とする回帰直線y=β^1+β^2xを求めた手続きを単回帰と呼ぶのに対して,上記のp≧3の手続きを重回帰(multiple linear regression)という。

そして,Q(β^)が最小になるための必要条件:-(1/2)(∂Q/∂β^k)=Σj=1n[xjk{Yj-(xj1β^1+xj2β^2+..+xjpβ^p)}]=0 (k=1,2,..,p)を正規方程式と呼ぶ。

 

※(注):具体的に正規方程式を解きます。

 

正規方程式はΣj=1n(xjkj1β^1+xjkj2β^2+..+xjkjpβ^p)=Σj=1njkj (k=1,2,..,p)です。

kl≡Σj=1njkjl,Dk≡Σj=1njkjと置けば,正規方程式はΣl=1pklβ^l=Dk (k=1,2,..,p)と書けます。これはp×pの係数行列Sとp次元縦ベクトル:β^≡t(β^1,β^2,..,β^p),t(D1,D2,..,Dp)による行列表現ではSβ^=です。

また,t(Y1,Y2,..,Yn),kt(x1k,x2k,..,xnk) (k=1,2,..,p)なるn次元縦ベクトルを用いるとSkl=Σj=1njkjltkl,Dk=Σj=1njkjtk(k,l=1,2,..,p)ですから,n×p行列XをX≡(1,2,..,p)で定義すると,S=tXX,tと書けます。

さらに,Yj=Σk=1pjkβk+εj (j=1,2,..,n)もβt12,..,βp),εt12,..,εn)により,=Xβεですからt=Sβtεです。

S=tXXについてdetS≠0 と仮定すれば,T=(tij)≡S-1が存在するので正規方程式:Sβ^=から,"β^=S-1=Tなる解=回帰係数"が得られます。

X=(1,2,..,p)は既知定数成分の行列なのでS=tXX,T=S-1も確率変数ではないため,E[β^]=S-1E[]=S-1E[Sβtε]=E[β]+S-1 tXE[ε]=βよりβ^はβ^の不偏推定量です。(注終わり)※

[定理13-6]:Cov(β^i,β^j)=tijσ2,特にVar(β^i)=tiiσ2 (i,j=1,2,..,p)である。またQ(β^)=Σj=1nj2-Σk=1pkβ^kであり,E[Q]=(n-p)σ2である。

(証明):Cov[Di,Dj]=Cov[Σk=1nkikl=1nljl],Cov[Yk,Yl]=Cov[εkl]=δklσ2,故にCov[Di,Dj]=Σk=1nkikjσ2=Sijσ2です。

これとβ^=S-1=TによってCov[β^i,β^j]=(S-1)ik(S-1)jlklσ2=(S-1)ijσ2を得ます。すなわち,Cov[β^i,β^j]=tijσ2,特にj=iならVar[β^i]=tiiσ2 (i,j=1,2,..,p)です。

また,Q(β^)=Σj=1n(Yj-Σk=1pjkβ^k)2=Σj=1nj2-2Σj=1nΣk=1pjkjβ^k+Σj=1nk=1pjkβ^k)2=Σj=1nj2-2Σk=1pkβ^k+Σk,l=1pklβ^kβ^l=Σj=1nj2-2Σk=1pkβ^k+Σk=1pkβ^k=Σj=1nj2-Σk=1pkβ^kと書けます。

また,Uj≡Yj-Σk=1pjkβ^kと置けばQ(β^)=Σj=1nj2であり,σ2=Var[Yj]=Var[Σk=1pjkβ^k]+Var[Uj]=Σk,l=1pjkjlCov[β^k,β^l]+Var[Uj]です。

 

したがって,Var[Uj]=σ2-Σk,l=1pjkjlklσ2を得ます。そしてE[Uj]=E[Yj-Σk=1pjkβ^k]=0です。

それ故,E[Q]=E[Σj=1nj2]=Σj=1nE[Uj2]=Σj=1n Var[Uj]=nσ2-Σj=1nΣk,l=1pjkjlklσ2=nσ2-Σk,l=1pklklσ2=nσ2-Σk=1pσ2=(n-p)σ2です。(証明終わり)

今日はここまでにします。(つづく)

参考文献:藤沢武久 著「新編 確率・統計」(日本理工出版会)

     

 

ブックオフオンライン 

iconオンライン書店 boople.com(ブープル)

| | コメント (0) | トラックバック (0)

2010年3月20日 (土)

最近考えていること(場の理論等覚え書き)

 ここ,数年,過去の知見の勉強ばかりではなく,所詮自己満足なのでテーマが大きくてなかなか手が届かないものばかりですが,自分なりに少しは考えていました。

ずいぶん前,「水の波」のシリーズを書いて非線形なK-dV方程式(Korteweg-deVries方程式):∂u/∂t+u(∂u/∂x)+μ(∂3u/∂x3)=0 を求めました。

 

これの解でu(x,t)=u1+U・sech2[{U/(12μ)}1/2{x-(u2+U/3)t}],U=u3-u1で記述される定常波形がsech2の"孤立波=ソリトン(soliton)"に着目したのも以下のような考えのためでした。

ブログはバラバラなようですが,一応,私なりの方向性があります。

 最も簡単なスピン(spin)がゼロで質量がmの自由粒子のスカラー場:φ(x)を考えると,これは線形波動方程式(クライン・ゴルドン方程式(Klein-Gordon equation)):(∂μμ+m2)φ(x)=(□+m2)φ(x)=0 を満たします。

運動量表示では,pμi∂μを代入して,(pμμ-m2)φ(p)=(p2-m2)φ(p)=0 と書けます。つまり相対論での自由粒子に対するエネルギーの恒等式p2=E22=m2と整合性を持っています。

 これは自由粒子のラグランジアン密度が0=(1/2)(∂μφ∂μφ-m2φ2)で与えられる全く普通の場の方程式です。

しかし,くりこみ手法のために非線形な自己相互作用項:(1/4)λφ40に付加したラグランジアン密度:=(1/2)(∂μφ∂μφ-m2φ2)+(1/4)λφ4/4もしばしば考察されています。

 

これに基づく運動方程式は(∂μμ+m2)φ(x)=(□+m2)φ(x)=λφ(x)3となります。上記の水の波の-dV方程式のように非線形方程式です。

 

(非線形項としては,今の段階でφの多項式形にこだわる必要はなく,取り合えずは微小であればいいとします。)

 ここで,別にくりこみの処方の便宜上ではなく,実際に自由粒子のエネルギー運動量の恒等式が2=E22=m2とはほんの僅かだけずれていて,

 

 通常の観測では無視できる程度のプランク質量,プランク長さ,プランク時間と比較できる程度のλ~ 0 の非線形項が存在すると仮想します。

つまり,従来のように理想的に運動量の確定した自由粒子を無限に拡がった平面波と考えるのではなく,ある程度は局在化された一種ソリトンのような孤立波であると考えるわけです。

そして,通常のテクノロジーには効かない程度のほんの僅かなものですが非線形項がありますから,厳密には重ねあわせの原理も成立しないのでφ4項が効いてくるようなオーダーでは級数展開も摂動法という総和の考え方も無効になります。

しかし,φ4項を相互作用項と考えて線形摂動論のアナロジーを考えることはできます。すなわち,(□+m2)φ=λφ3の両辺に積分演算子(□+m2)-1を掛けてφ=φ0+λ(□+m2)-1φ3と表現します。ただし(□+m20=0 です。

 

または,陽に(□+m2)G0(x)=-δ4(x)を満たす"グリーン関数(Green's function )=伝播関数(propagator)":G0(x)によってφ(x)=φ0(x)-λ∫d4y[G0(x-y)φ(y)3]と表わします。

これらから,原理的にはφ1=φ0+λ(□+m2)-1φ032=φ0+λ(□+m2)-1φ13,..のように反復法を用いてλのベキ展開として解を表現することはできます。

ただし,非線形な微分方程式の場合は如何に微小な項であろうと解を支配するのは最高次数の項ですから,線形摂動論におけるようにλの最低次まで取った近似解:φ1=φ0+λ(□+m2)-1φ03で十分であるという状況はありません。

  

高次項だけを総和しても低次項より大きくなって発散するという可能性もあるでしょう。

そこで,真の自由粒子の伝播関数が定義できて通常のように,それが場の時間順序積(T-product)としてiG(x―y)=<0|T(φ(x)φ(y))|0>と表現できるとしても,

 

このG(x―y)は(□+m20(x)=0 によって,(□+m2)G0(x―y)=-δ4(x―y)を満たす通常の裸の自由伝播関数:iG0(x-y)=<0|T(φ0(x)φ0(y))|0>=i(2π)-4∫d4p[exp{-ip(x-y)}/(p-m2+iε)]とはほんの少し異なるはずです。

そして,線形場を用いた摂動級数の計算では自己エネルギー部分に相当するFeynman-dyagramの内線に自由粒子伝播関数:G0(x-y)を割り当てると,その計算値の寄与は無限大に発散して物理的に有効な値が得られないことがわかっています。

 

そこで,"くりこみ"等の計算処方箋が要求されてきたわけです。

しかし,全ての自由Green関数を,G0(x-y)の代わりにG(x―y)=G0(x-y)+F(x-y)で置き換え,G0(x-y)による無限大の発散が微小で非線形な第2項F(x-y)の累積効果による無限大で相殺されて,有限有意な計算値となる可能性が期待できます。

初期のcutoff:Λの設定や正則子(regulator)による有限正則化,または次元dをd>4とする次元正則化は,Λ→∞,またはd→4の極限では補正項は得られても値そのものは無限大に戻ってしまうようなものでした。

 

しかし,今回の方法は,むしろ光子に微小な仮想質量μを想定して無限大と相殺させμ→0 の極限でもそのまま問題なしという赤外発散の解決法(極限の順序の交換で有限化する)に似ています。

自由粒子をソリトンと考えるのはインスタントン(instanton)と同じような考えだろうとか,非線形項を考えるのは格子上の場理論を考えるのと同じだろうとか,私が知らないうちに時代に取り残されたトピックが色々あるみたいですね。 

調べてはみたのですが,別にこの程度のたわごとで今さらオリジナリティなどを主張するつもりはないです。

 

既に似たものがあって,はるかに進んでいるなら教えてもらって後を付いていきます。

ただ,ここで述べた非線形化はくりこみにおける正則化手法を意図しているのではなく,必ずしもくりこみやくりこみ群を必要としない内容を述べているつもりです。

 

↓ 参考文献は後付けです。

 

参考文献1:五十嵐洋一 他「ゲージ理論におけるドメインウォールとヒッグス相中のソリトン」(日本物理学会誌),青木真也「格子上の場の理論」(シュプリンガーフェアラーク東京),戸田盛和「非線形格子力学」(岩波書店),および「非線形波動とソリトン」(日本評論社)

 

参考文献2:江沢 洋 他「くりこみ群の方法」(岩波講座),九後汰一郎「ゲージ場の量子論Ⅰ,Ⅱ」(培風館),K.Nishijima「Fields and Particles」(W.A.Benjamin,Inc.),ランダウ「相対論的量子力学1,2」(東京図書),J.D.Bjorken,S.D.Drell「Relativistic Quantum mechanics」,and「Relativistic Quantum Field」(McGraw-Hill)

  

PS:最近書いている「遅延選択実験」の話はまた別口です。

 

2008年夏の愛知県での将棋合宿の前後の頃,あるネットでしか知らない人から,何故か私に「タイムマシン」の特許申請が受理されないという旨の相談メールがありました。

 

そりゃ,そうでしょう。

 

そんなものは,まともな特許事務所,弁理士には相手にされないだろうと思いましたが,内容をよく読んで見ると,内容は別段"トンデモ"ではなく「遅延選択実験」,あるいは「量子テレポーテーション」を少し工夫しただけのものでした。

 

光子を1個まで分離する技術があれば実現可能だと思いました。

 

これについては確か現在北大準教授?で当時三菱総研の竹内繁樹氏が開発していたと思います。

 

http://utsusemi.nims.go.jp/japanese/mailmag/2003/028b.html

 

これは本当はばらしちゃいけない話でしょうけど,以後音信不通ですし,普通の人はマッドか?トンデモか?と思うような話ですしね。。。

 

しかし,あいにく去年夏に私のPCが壊れたとき,保存していた資料もメールアドレスも失くしてしまったらしく,内容もうろ覚えで詳しく思い出そうとしてもいまいち肝心の部分がハッキリしないのです。

    

"未来情報が相関として現在の観測に影響する"とはいっても,高々ナノ秒程度の話で,それを認知するのにそれ以上の時間ロスがあれば無意味なことですがね。。。

 

参考文献:「数理科学」2005年2月号(特集:エンタングルメント理論とその展開),竹内繁樹「量子コンピュータ」(講談社ブルーバックス)

     

 

ブックオフオンライン 

iconオンライン書店 boople.com(ブープル) 

| | コメント (0) | トラックバック (0)

2010年3月18日 (木)

確率と分布関数(9)(推定2)

 確率と分布関数(推定)の続きです。 

[定義12-1]:X1,X2,..,Xnを確率分布p(x;θ)を持つ母集団からのn個の任意標本とし,未知母数θの推定量をθ^=θ^(X1,X2,..,Xn)とするとき,∀ε>0 に対してlimn→∞P(|θ^-θ|≧ε)=0 (θ^→Pθ)が成立するならθ^をθの一致推定量(consistent estimator)という。

[定理12-2]:X1,X2,..,Xnを正規母集団:N[θ,σ2](σ2は既知)からの任意標本とする。このとき,<X>n≡(X1+X2+..+Xn)/nはθの一致推定量である。

(証明):平均がμ,分散がσ2の確率変数Xに対するチェビシェフの不等式P(|X-μ|>k)≦σ2/k2を,今の平均がθ,分散がσ2/nの確率変数<X>nに適用すると任意のε>0 に対し 0≦P(|<X>n-θ|≧ε)≦σ2/(nε2)となります。

 そこで,limn→∞σ2/(nε2)=0 からlimn→∞P(|<X>n-θ|≧ε)=0 (<X>nPθ)が従います。すなわち,<X>n=(X1+X2+..+Xn)/nはθの一致推定量です。(証明終わり)

[定理12-3]:θ^がlimn→∞Var[θ^]=0 を満たすθの漸近不偏推定量であればθ^はθの一致推定量である。

(証明):漸近不偏推定量の定義によって,limn→∞E[θ^]=θです。そこで,任意の正の数ε>0 に対しある自然数N0=N0(ε)が存在してn≧N0なら|E[θ^]-θ|≦ε/2です。

ω∈{ω∈Ω:|θ^(ω)-θ|≧ε}とすると,ε≦|θ^(ω)-θ|≦|θ^(ω)-E[θ^]|+|E[θ^]-θ|より,ε-|θ^(ω)-E[θ^]|≦|E[θ^]-θ|です。

そこで,n≧N0ならε-|θ^(ω)-E[θ^]|≦ε/2,つまり|θ^(ω)-E[θ^]|≧ε/2となります。故に,n≧N0なら{ω∈Ω:|θ^(ω)-θ|≧ε}⊂{ω∈Ω:|θ^(ω)-E[θ^]|≧ε/2}が成立します。

 

この結果とチェビシェフの不等式:P(|θ^-E[θ^]|≧ε/2)≦{Var[θ^]/(ε/2)2}から,P(|θ^-θ|≧ε)≦4Var[θ^]/ε2なる不等式を得ます。

 

仮定によりlimn→∞Var[θ^]=0 ですから,先に与えたε>0 と他の任意の数δ>0 による数:ε2δ/4 に対して自然数N1=N1(δ)が存在してn≧N1ならVar[θ^]<ε2δ/4 が成立します。

そこで,N0(ε)とN1(δ)のうちの大きい方をN=N(ε,δ)と書けば,n≧Nに対してP(|θ^-θ|≧ε)≦δとなります。

そこで,θ^のθへの確率収束:θ^→Pθ:limn→∞P(|θ^-θ|≧ε)=0 が成立します。(証明終わり)

[補題12-4]:Xj(1≦j≦n)が全て標準正規分布:N[0,1]を持つ独立確率変数で,Tがn×nの直交行列:TtT=tTT=I(単位行列)なら,列ベクトルX=t(X1,X2,..,Xn)に対してt(Y1,Y2,..,Yn)≡Tで定義される列ベクトルの成分Yj(1≦j≦n)もまた全て分布:N[0,1]を持つ独立確率変数である。

(証明):1≦j≦nを満たす各々のjについて変数XjはN[0,1]を持ちますから,確率密度関数はfXj(xj)=(2π)-1/2exp(-xj2/2)です。

  

 そしてXjは全て独立ですから,確率変数の族:t=(X1,X2,..,Xn)の同時確率密度関数fX();t(x1,x2,..,xn)はfX()=Πj=1nXj(xj)=(2π)-n/2exp{-(Σj=1nj2)/2}=(2π)-n/2exp{-(txx)/2}と書けます。

=Tより,=Tとすればx=t,かつtx=tTなので,fX()=(2π)-n/2exp{-(txx)/2}=(2π)-n/2exp{-(tt)/2}=(2π)-n/2exp{-(tyy)/2}です。

dy1dy2..dyn=(detT)dx1dx2..dxnですから,dx1dx2..dxn=(detT)-1dy1dy2..dynです。そこで,fX()dx1dx2..dxn=(detT)-1X()dy1dy2..dynとなります。

したがって, t=(Y1,Y2,..,Yn)=ttTの同時確率密度関数f()はfY()=(detT)-1X()で与えられます。

※(注):今の当面の変数変換は=Tの線形変換ですが,一般の変換()でも,局所的にd=J()dと無限小線形変換で表わされる点においては,(detT)-1=det(T-1)をdet(J-1)=det(∂/∂)で置き換えることで,fY()=det(∂/∂)fX()となります。

 

 なお,J()=(∂/∂)はヤコービ行列です。(注終わり)※

そして,直交行列Tに対しては,1=det(TtT)=(detT)2よりdetT=(detT)-1=±1ですが,今の確率変数の場合にはfY()=|detT|-1X()=(2π)-n/2exp{-(tyy)/2}を得ます。(証明終わり)

[定理12-3の系]:X1,X2,..,Xnを正規母集団:N[μ,σ2]からの任意標本とするとき,不偏分散:σ2^≡Σj=1n(Xj-<X>)2/(n-1)は分散:σ2の一致推定量である。

(証明):n次の正方行列:T=(tij)の成分をtij=1/n1/2(i=1),tij=1/{i(i-1)}1/2(i≧2,j<i),tij=-(i-1)/{i(i-1)}1/2(i≧2,j=i),tij=0 (i≧2,j>i)で与えれば,TtT=tTT=Iとなることが示せるのでTは直交行列です。

一方,Xj(1≦j≦n)は全て正規分布:N[μ,σ2]を持つので,Zj≡(Xj-μ)/σ(1≦j≦n)と定義すると,これらは全て標準正規分布:N[0,1]を持ちます。

 列ベクトルt(Z1,Z2,..,Zn)に対して,t(Y1,Y2,..,Yn)≡Tを定義すると,[補題12-4]によりYj(1≦j≦n)もまた全てN[0,1]を持ちます。

特に,Y1=Σj=1nj/n1/2=n1/2<Z>です。また,TtT=IによりtYYttTT,つまりΣj=1nj2=Σj=1nj2です。そこで,Σj=1n(Zj-<Z>)2=Σj=1nj2-n<Z>2=Σj=1nj2-Y12=Y22+..+Yn2です。

 

つまり,Σj=1n(Zj-<Z>)2は全てが標準正規分布N[0,1]を持つ(n-1)個の確率変数の和ですから,この変数は自由度(n-1)のχ2分布に従います。

(注):2/19の記事「確率と分布関数(4)(特殊分布(連続))」の[定理6-15]:X1,X2,..,Xnが全て標準正規分布を持つn個の独立確率変数ならばχ2≡Σj=1nj2=X12+X22+..+Xn2は自由度nのχ2分布を持つ。を参照しました。(注終わり) ※

そして,Zj-<Z>=(Xi-μ)/σ-(<X>-μ)/σ=(Xj-<X>)/σ,およびσ2^=Σj=1n(Xj-<X>)2/(n-1)から,Σj=1n(Zj-<Z>)2=Σj=1n(Xj-<X>)22=(n-1)σ2^/σ2を得ます。

そこで,(n-1)σ2^/σ2は自由度(n-1)のχ2分布に従うことが

わかりました。

 

故に,χ2分布の特性からE[(n-1)σ2^/σ2]=n-1,Var[(n-1)σ2^/σ2]=2(n-1)です。したがって,E[σ2^]=σ2,Var[σ2^]=2σ4/(n-1)です。

以上から不偏分散:σ2^≡Σj=1n(Xj-<X>)2/(n-1)は分散σ2の不偏推定量であり,そこでσ2の漸近不偏推定量です。

 

さらに,limn→∞Var[σ2^]=0 ですから[定理12-3]によってσ2^はσ2の一致推定量です。(証明終わり)

(別証明):以前の項目で示したように不偏分散σ2^はその呼称通り分散σ2の不偏推定量です。つまり,E[σ2^]=σ2ですから,σ2^はもちろんσ2の漸近不偏推定量です。

そして,前の記事の[例11-17]によれば,Var[σ2^]=2σ4/(n-1)ですから,limn→∞Var[σ2^]=0 も成立します。(証明終わり)

[定義12-5]:母集団分布がp(x;θ)である母集団データx1,x2,..,xnに対し,量L(θ)≡Πj=1np(xj;θ)を最大にするθの値をθ^*=θ^(x1,x2,..,xn)と書いて,これをθの最尤推定値(maximum likelihood estimate)と呼ぶ。

 また,L(θ)を尤度関数という。上記母集団からの任意標本X1,X2,..,Xnに対し,θ^(X1,X2,..,Xn)を最尤推定量(maximum likelihood estimator)という。

(注)尤度(ゆうど:likelihood)とは,尤もらしさ(もっともらしさ:liklihood)を意味します。※

[例題12-6]:X1,X2,..,Xnが次の確率分布を持つ母集団からの任意標本であるとき,未知母数の最尤推定量を求めよ。

(1)  一様分布:p(x;θ)=1/θ (0≦x≦θ),0 (その他)

(2)  正規分布N[μ,σ2]:p(x;μ,σ2)=(2π)-1/2σ-1exp{-(x-μ)2/(2σ2)}(-∞<x<∞)

(解)(1)L(θ)=1/θn (0≦x≦θ),0 (その他)となるので,L(θ)はθの単調減少関数でdL/dθ=0 となるθは存在しません。したがってθがゼロに近いほどL(θ)は大きいことになります

そして,母集団データx1,x2,..,xnを固定すればθの最小値はmax(x1,x2,..,xn)です。それ故,最尤推定量はθ^=max(X1,X2,..,Xn)で与えられます。

(2)この場合,θ=(μ,σ2)であり尤度関数はL(θ)=L(μ,σ2)=(2π)-n/2σ-nexp{-Σj=1n(xj-μ)2/(2σ2)}です。これの対数を取るとlogL(μ,σ2)=-(n/2){log(2π)+logσ2}-{Σj=1n(xj-μ)2/(2σ2)}です。

 尤度の最大値を与える方程式:∂{logL(μ,σ2)}/∂μ=Σj=1n(xj-μ)/σ2=(Σj=1nj-nμ)/σ2=0,∂{logL(μ,σ2)}/∂σ2={-n/(2σ2)}+Σj=1n(xj-μ)2/(2σ4)=0 解けばμ^=<x>=Σj=1nj/n,およびσ2^=Σj=1n(xj-<x>)2/nを得ます。

 したがって,μ,およびσ2の最尤推定量はそれぞれ<X>=Σj=1nj/n,およびΣj=1n(Xj-<X>)2/nです。(終わり)

[定理12-7]:θ^がθの最尤推定量でμ=g(θ)がθの一価関数ならμは最尤推定量μ^=g(θ^)を持つ。

(証明):μ=g(θ)はθの一価関数なので逆関数θ=g-1(μ)が存在して尤度関数はL(θ)=Πj=1np(xj;θ)=L(g-1(μ))と書けます。

最尤推定量の定義によって尤度関数L(θ)はθ=θ^=g-1(μ)で最大となります。一価関数μ=g(θ)ではθ^=g-1(μ)はμ=g(θ^)と同値ですから,μは最尤推定量μ^=g(θ^)を持つことになります。(証明終わり)

[定義12-8]:X1,X2,..,Xnを確率分布p(x;θ)を持つ母集団からの任意標本とし,未知母数θの推定量θ^に対する確率密度関数をg(θ^;θ)とする。(dP=g(θ^;θ)dθ^とする。)

一方,母集団データ(x1,x2,..,xn)を(θ^,y1,y2,..,yn-1)に変換してθ^=θ^(x1,x2,..,xn)を与えたときのY1,Y2,..,Yn-1の結合確率密度関数(j.p.d.f)をh(y1,y2,..,yn-1|θ^;θ)とする。

ただし,∂θ^/∂xk,∂yj/∂xk,(k=1,2,..,n;j=1,2,..,n-1)が全て存在して連続関数とする。

(x1;θ)p(x2;θ)..p(xn;θ)dx1dx2..dxn=g(θ^;θ)h(y1,y2,..,yn-1|θ^;θ)dθ^dy1dy2..dyn-1と置いたとき,h(y1,y2,..,yn-1|θ^;θ)がθを含まない(θに依存しない,θに独立)ならばθ^=θ^(X1,X2,..,Xn)をθの充足推定量(sufficient estimator)という。

※(注):p(x1;θ)p(x2;θ)..p(xn;θ)dx1dx2..dxn=g(θ^;θ)h(y1,y2,..,yn-1|θ^;θ)dθ^dy1dy2..dyn-1=L(θ)dx1dx2..dxnです。※

[例12-9]:X1,X2,..,Xnを2項母集団からの任意標本とする。確率分布(今の場合,2項母集団の離散分布なので密度関数ではない)をp(1;θ)=θ,p(0;θ)=1-θ(0<θ<1)とすると,T≡Σj=1njはθの充足推定量である。

(証明):p(x1;θ)p(x2;θ)..p(xn;θ)=Πj=1nθxj(1-θ)1-xj=θΣxj(1-θ)n-Σxj=θt(1-θ)n-t(xjは 0,または1)です。

一方,T≡Σj=1njの確率分布G(t;θ)はG(t;θ)=ntθt(1-θ)n-tで与えられます。

 

p(x1;θ)p(x2;θ)..p(xn;θ)=G(t;θ)H(x1,x2,..,xn|t;θ)から,H(x1,x2,..,xn|t;θ)=p(x1;θ)p(x2;θ)..p(xn;θ)/G(t;θ)=1/ntですが,これはθに依存しないのでT=Σj=1njはθの充足推定量です。(証明終わり)

[定理12-10]:ネイマンの分解基準(Neyman factorization criterion)

 確率密度関数(p.d.f)f(x;θ)を持つ母集団の任意標本X1,X2,..,Xnの関数θ^=θ^(X1,X2,..,Xn)がθの充足推定量であるための必要十分条件は,全てのθに対してΠj=1nf(xj;θ)=H(x1,x2,..,xn)g(θ^;θ)なる形の式が成立することである。

(証明):Πj=1n(xj;θ)dxj=h(y1,y2,..,yn-1|θ^;θ)g(θ^;θ)dθ^dy1dy2..dyn-1で,Πj=1ndxj=|detJ|dθ^dy1dy2..dyn-1です。(J≡∂(x1,x2,..,xn)/∂(θ^,y1,y2,..,yn-1))

(y1,y2,..,yn-1|θ^;θ)=|detJ|-1Πj=1nf(xj;θ)/g(θ^;θ)ですが,θ^=θ^(X1,X2,..,Xn)がθの充足推定量なら,h(y1,y2,..,yn-1|θ^;θ)はθに依りま戦せん。

 

1,y2,..,yn-1,θ^は全て(x1,x2,..,xn)の関数で,|detJ|-1=|detJ-1|,J-1=∂(θ^,y1,y2,..,yn-1)/∂(x1,x2,..,xn)も(x1,x2,..,xn)の関数です。

これをH(x1,x2,..,xn)と書けば,Πj=1nf(xj;θ)=H(x1,x2,..,xn)g(θ^;θ)です。

逆に,Πj=1n(xj;θ)=H(x1,x2,..,xn)g(θ^;θ)なら,θ^=θ^(x1,x2,..,xn),yj≡xj(j=1,2,..,n-1)と置けば,h(y1,y2,..,yn-1|θ^;θ)=|detJ|-1Πj=1nf(xj;θ)/g(θ^;θ)=|detJ|-1H(x1,x2,..,xn)です。

 

detJ=∂(x1,x2,..,xn)/∂(y1,y2,..,yn-1,θ^)=∂xn/∂θ^なので,h(y1,y2,..,yn-1|θ^;θ)=H(x1,x2,..,xn)|∂xn/∂θ^|-1であり,θに依存しないのでθ^はθの充足推定量です。

 

なぜなら,h(y1,y2,..,yn-1|θ^;θ)の因子H(x1,x2,..,xn)=H(y1,y2,..,yn-1,xn)でxn=xn(y1,y2,..,yn-1,θ^),∂xn/∂θ^も(y1,y2,..,yn-1,θ^)の関数ですからθに無関係です。(証明終わり)

 

[定理12-11]:(1)θの充足推定量θ^が存在する場合には,尤度方程式∂{logL(θ)}/∂θ=0 の任意の解はθ^の関数である。

  

(2)θの充足推定量θ1^,および有効推定量θ2^が存在すればθ2^はθ1^の関数である。

 

(証明):(1)任意標本値をx1,x2,..,xnと置けば,θ^はθの充足推定量なので,θ^の密度関数をg(θ^;θ)とすると尤度関数はL(θ)=g(θ^;θ)h(x1,x2,..,xn|θ^)と表現できます。

 

 そこで,尤度方程式∂{logL(θ)}/∂θは∂{logg(θ^;θ)}/∂θ=0 となります。この方程式の左辺はθ^,θのみの関数なのでθについて解いた解θ(最尤推定量)は充足推定量θ^の関数です。

 

(2)θの任意の不偏推定量をU^,充足推定量のθ1^の密度関数をg(θ1^;θ)と置きます。

 

 充足推定量の定義から,(x1,x2,..,xn)を(θ1^,y1,y2,..,yn-1)に変換してΠj=1n(xj;θ)dxjg(θ1^;θ)h(y1,y2,..,yn-11^,θ)dθ1^dy1dy2..dyn-1と置けば,h(y1,y2,..,yn-11^;θ)はθを含みません。

 

 一方,U^はθの不偏推定量なので,θ=E[U^]=∫..∫ug(θ1^;θ)h(y1,y2,..,yn-11^)dθ1^dy1dy2..dyn-1=∫k(θ1^)g(θ1^;θ)dθ1^が成立します。ただし,k(θ1^)≡∫..∫uh(y1,y2,..,yn-11^)dy1dy2..dyn-1です。

 

 θ=∫k(θ1^)g(θ1^;θ)dθ1^はk(θ1^)がθの不偏推定量であることを意味しています。

  

 E[U^]=θ,U^-θ=U^-k(θ1^)+k(θ1^)-θより,E[k(θ1^)]=θですから,Var[U^]=∫..∫(u-θ)2Πj=1n(xj;θ)dxj=∫..∫[u-k(θ1^)]2Πj=1n(xj;θ)dxj+∫..∫[k(θ1^)-θ]2Πj=1n(xj;θ)dxjと書けます。

  

 故に,Var[U^]≧∫[k(θ1^)-θ]2g(θ1^;θ)dθ1^ですが,この不等式でU^=θ2^と置けば有効推定量の分散の最小性から,等号:Var[θ2^]=∫[k(θ1^)-θ]2g(θ1^;θ)dθ1^が成立します。

  

 そこで,∫..∫[θ2^-k(θ1^)]2Πj=1n(xj;θ)dxj=E[{θ2^-k(θ1^)}2]=0 なのでθ2^=k(θ1^)です。(証明終わり)

 

 今日はここまでにします。(つづく)

参考文献:藤沢武久 著「新編 確率・統計」(日本理工出版会)

    

 

ブックオフオンライン 

iconオンライン書店 boople.com(ブープル) 

| | コメント (0) | トラックバック (0)

2010年3月15日 (月)

ニコニコ動画テスト。。柴犬の子供

【ニコニコ動画】今日家族になったばかりの柴犬が下駄箱の下から出たいようです

PS:私の風邪は治りました。今回は軽かったみたいです。子供時代の実家には雑種が2匹いたので今でも犬派です。(比較の問題だけで猫が嫌いというわけではないです。)

| | コメント (2) | トラックバック (0)

2010年3月12日 (金)

確率と分布関数(8)(推定1)

 確率と分布関数の続きです。推定(statistical inference)の項目に入ります。

[定義11-1]:母集団の分布p(x;θ)に含まれている未知母数(パラメータ)θを,この母集団から抽出した任意標本(samples):X1,X2,..,Xnの関数θ^(X1,X2,..,Xn)によって推定する方法を点推定法という。

1,X2,..,Xnがそれぞれx1,x2,..,xnなる値(標本値)と決まれば,θは1つの実現値θ*θ^(x1,x2,..,xn)を取るので,このθ*θの推定値という。また変量θ^(X1,X2,..,Xn)を推定量という。

[定義11-2]:未知母数θの推定量θ^がE[θ^]=θを満たすときθ^は不偏性(unbiasedness)を持つといい,このθ^をθの不偏推定量(unbiased estimate)という。

 また,b(θ^)≡E[θ^]-θを推定量θ^の偏りという。ここで期待値EはX1,X2,..,Xnの同時分布にわたって取られる。

[定理11-3]:X1,X2,..,Xnが母平均μを持つ任意の母集団からの任意標本であるならば,標本平均:<X>≡(X1,X2,..,Xn)/n(=μ^)はμの1つの不偏推定量である。

(証明):E[Xj]=μ (j=1,2,..,n)よりE[<X>]=(1/n)Σj=1nE[Xj]=μです。(証明終わり)

[例11-4];母集団の分布は 0<x≦θに対してp(x;θ)=1/θ,それ以外ではp(x;θ)=0 の一様分布とする。

 

 この一様母集団からの大きさnの任意標本:X1,X2,..,Xnに対し,<X>≡(X1,X2,..,Xn)/n,X(n)≡max(X1,X2,..,Xn)とおく。(今の場合,p(x;θ)はxの確率密度関数である。)

 このとき,θ^1≡2<X>,θ^2≡(n+1)X(n)/nは共にθの不偏推定量である。

(証明):j=1,2,..,nに対してE[Xj]=∫0θ(x/θ)dx=θ/2ですから,E[θ^1]=E[2<X>]=θです。

  

 次に,Xjの分布関数はx>θならP(Xj≦x)=1,0<x≦θならP(Xj≦x)=x/θ,x≦0 ならP(Xj≦x)=0 です

 そして,{X(n)≦x}=∩j=1{Xj≦x}で,1,X2,..,Xnは独立なので,X(n)の分布関数はF(x)≡P(X(n)≦x)=P(∩j=1{Xj≦x}=Πj=1P(Xj≦x)となります。

 

 そこで,x>θならF(x)=1,0<x≦θならF(x)=xnn,x≦0 ならF(x)=0 です。

 確率密度関数はf(x)=dF/dxで与えられます。これは,0<x≦θならf(x)=nxn-1n,それ以外ではf(x)= 0です。

 それ故,E[X(n)]=∫0xf(x)dx=(n/θn)∫0θn/dxθn =nθ/(n+1)です。故に,E[θ^2]=E[(n+1)X(n)/n]=θです。(証明終わり)

[定理11-5]:母集団分布に母分散σ2が存在するとき,分布型に関係なE[{Σj=1n(Xj-<X>)2}/(n-1)]=σ2が成り立つ。

(証明):母平均をE[Xj]=μ(j=1,2,..,n)とすると,Xj-<X>=(Xj-μ)-(<X>-μ)よりE[(Xj-<X>)2]=E[(Xj-μ)2-2(Xj-μ)(<X>-μ)+(<X>-μ)2]と書けます。

ところがE[(Xj-μ)2]=σ2,E[Σj=1n(Xj-μ)(<X>-μ)]=nE[(<X>-μ)2],また,明らかにE[(<X>-μ)2]=σ2/nです。

 それ故,E[{Σj=1n(Xj-<X>)2}]=nσ2-2nσ2/n+nσ2/n=(n-1)σ2です。以上から,E[{Σj=1n(Xj-<X>)2}/(n-1)]=σ2が得られます。

(注):S02≡{Σj=1n(Xj-<X>)2}/(n-1)を不偏分散(unbiased variance)という。

[定義11-6]:平均がμ,分散がσ2の母集団からの大きさnの任意標本X1,X2,..,Xnに対してμの推定量としてμ^≡c11+c22+..+cnnを取る。

 

 標本の線形関数:μ^がVar[μ^]を最小にする不偏推定量となるように定数cj(j=1,2,..,n)を定める。このときのμ^をμの最良線形不偏推定量という。

[例11-7]:μ^≡c11+c22+..+cnnがμの最良線形不偏推定量ならμ^は不偏推定量なのでE[μ^]=Σj=1njE[Xj]=μ(Σj=1nj)=μです。故にΣj=1nj=1です。

一方,Var[μ^]=Σj=1nj2Var[Xj]=(Σj=1nj22です。

以上から,最良線形不偏推定量を求めるには,Σj=1nj=1の下でΣj=1nj2を最小にすればいいことになります。

Σj=1nj1,および.Σj=1nj2=1の微分はそれぞれd(Σj=1nj)=Σj=1ndcj=0,およびd(Σj=1nj2)=2Σj=1njdcj=0 です。

 

λをラグランジュの未定係数として,極小条件:Σj=1n(λ+2cj)dcj=0 より,cj=-λ/2=(一定)を得られます。

 

よって,Σj=1nj=1よりcj=1/nがμ^≡c11+c22+..+cnnの最良線形不偏推定量を与えることがわかります。(証明終わり)

[定義11-8]:θ^1とθ^2が共にθの不偏推定量であるとき,Var[θ^1]<Var[θ^2]ならθ^1の方がθ^2よりも有効である(efficient)という。

 

 そして,母数θの全ての不偏推定量のうち最も分散の小さいものを,最も有効な推定量,または最良(best)推定量という。

 

[定理11-9]:(クラーメル・ラオの不等式(Cramer-Rao inequality),or C-R不等式)

 母集団分布p(x;θ)は次の4つの条件:正則条件(1)~(4)満たすとする。(ただし,ここではp(x;θ)をp.d.f.とみなす。)

(1)-∞<x<∞の全てのxに対して∂p(x;θ)/∂θが存在する。

(2)∫-∞-∞..∫-∞Πj=1np(xj;θ)dx1dx2.. dxnは積分と微分∂/∂θの順序の交換ができる。

(3)E[{∂logp(X;θ)/∂θ}2]<∞

(4)∫-∞-∞..∫-∞θ^(x1,x2,..,xn) Πj=1np(xj;θ)dx1dx2.. dxnはθに関して微分可能である。

 この正則条件の下でθの不偏推定量θ^(X1,X2,..,Xn)の分散はVar[θ^]≧1/(nE[{∂[logp(X;θ)]/∂θ}2])なる不等式を満たす。

等号の成立は,Σj=1n[{∂[logp(Xj;θ)]/∂θ}=k{θ^(X1,X2,..,Xn)-θ}を満たすn,θによらない定数kが存在するときです。

(証明):θ^が不偏推定量であるという仮定から,θ=∫-∞-∞..∫-∞θ^(x1,x2,..,xnj=1np(xj;θ)dx1dx2.. dxnです。

 両辺をθで微分すると,1=∫-∞-∞..∫-∞θ^(x1,x2,..,xn)[Σj=1nΠk=1,k≠jnp(xk;θ){∂p(xj;θ)/∂θ}]dx1dx2..dxn=∫-∞-∞..∫-∞Πj=1nθ^(x1,x2,..,xn)[Σj=1nΠk=1,np(xk;θ){∂[logp(xj;θ)]/∂θ}]dx1dx2..dxnです。

 よって,1=Σj=1nE[θ^(X1,X2,..,Xn){∂{logp(xj;θ)]/∂θ}]が成立します。

 一方,明らかに,1=∫-∞-∞..∫-∞Πj=1np(xj;θ)dx1dx2..dxnです。

 

 これも両辺をθで微分すると,上と同様にして 0=Σj=1nE[∂[logp(Xj;θ)]/∂θ]を得ます。

 したがって,1=E[{θ^(X1,X2,..,Xn)-θ}{Σj=1n∂[logp(Xj;θ)]/∂θ}]と書けます。

 

 これにシュワルツの不等式(Schwarz inequality)を適用すれば1≦E[{θ^(X1,X2,..,Xn)-θ}2]/E[{Σj=1n∂logp(xj;θ)/∂θ}2]が得られます。

そして,Var(θ^)=E[{θ^(X1,X2,..,Xn)-θ}2]より,これはVar(θ^)≧1/E[{Σj=1n∂logp(Xj;θ)/∂θ}2])を満たします。

 

等号はΣj=1n{∂[logp(xj;θ)]/∂θ}=k[{θ^(X1,X2,..,Xn)-θ}を満たす定数kが存在するときに限られます。

なぜなら,一般にシュワルツの不等式は数空間のベクトル,に対して|(xy)|2≦||2||2が成立するというもので,等号はが同じ方向のベクトルのとき,例えば=kと書ける場合だけ成立します。

 さて,∀jに対して∫-∞(xj;θ)dxj=1より,∫-∞{∂logp(xj;θ)/∂θ}p(xj;θ)dxj=0 です。したがってE[∂[logp(Xj;θ)]/∂θ]=0 です。

それ故,j≠kならE[{∂[logp(Xj;θ)]/∂θ}{∂[logp(Xk;θ)]/∂θ}]=∫-∞-∞..∫-∞{∂[logp(xj;θ)]/∂θ}{∂[logp(xk;θ)]/∂θ}Πj=1np(xj;θ)dx1dx2.. dxn=E[∂[logp(Xj;θ)]/∂θ]E[∂log[p(Xk;θ)]/∂θ]=0 です。

 そこでE[{Σj=1n∂[logp(Xj;θ)]/∂θ}2]=Σj=1nE[{∂[logp(Xj;θ)]/∂θ}2]=nE[{∂[logp(x;θ)]/∂θ}2]を得ます。故に,Var(θ^)≧1/(nE[{∂[logp(xj;θ)]/∂θ}2])です。

  

 これをクラーメル・ラオの不等式(Cramer-Rao inequality),or C-R不等式といいます。(証明終わり)

[定義11-10]:C-R不等式で等号を成り立たせるθ^,つまりΣj=1n{∂[logp(xj;θ)]/∂θ}=k[{θ^(X1,X2,..,Xn)-θ}を満たすkが存在するようなθ^を有効推定量,または最小分散不偏推定量(minimum-variance unbiased estimator)という。

[例11-11]:母集団分布がp(x;λ)=λx exp(-λ)/x! (x=0,1,2,..)なる分布のポアソン(Poisson)母集団のパラメータλの有効推定量は<X>=(X1+X2+..+Xn)/nである。

(証明):logp(x;λ)=xlogλ-λ-log(x!)ですから,∂[logp(x;λ)]/∂λ=-1+x/λです。

 

 故に,nE[{∂[logp(X;θ)]/∂θ}2]=nE[(-1+x/λ)2]=n{E[1]-2E[X]/λ+E[X2]/λ2}=n{1+2λ/λ+(λ2+λ)/λ2}=n/λとなります。

 一方,Var[<X>]=Σj=1nVar[Xj]/n2=λ/nです。したがって,Var[<X>]=1/(nE[{∂[logp(Xj;θ)]/∂θ}2])を満たします。

 

 等号が成り立っていますから,<X>=(X1+X2+..+Xn)/nは有効推定量です。(証明終わり)

[例11-12]:正規母集団N[μ,σ2]からの任意標本をX1,X2,..,Xnとすれば,標本平均<X>=(X1+X2+..+Xn)/nは母平均μの有効推定量である。

(証明):p(x;μ)=(2π)-1/2σ-1exp{-(x-μ)2/(2σ2)}(-∞<x<∞)ですから,∂logp(x;μ)/∂μ=(x-μ)/σ2です。故に,E[{∂[logp(X;μ)]/∂μ}2]=E[(x-μ)]/σ4=1/σ2です。

 そこで,1/(nE[{∂[logp(X;μ)]/∂μ}2])=σ2/nです。一方,Var[<X>]=Σj=1n Var[Xj]/n2=σ2/nです。故に,<X>は有効推定量です。(証明終わり)

[例11-13]:X1,X2,..,Xnが次の各確率分布を持つ母集団からの任意標本であるとき,θの有効推定量を求めます。

(1)p(x;θ)=Nxθx(1-θ)N-X (x=0,1,2,..,N,0<θ<1)

(2)p(x;θ)={1/(Γ(α)θα)}xα-1exp(-x/θ)(x≧0,αは定数)

(解):(1)logp(x;θ)=log Nx+xlogθ+(N-x)log(1-θ),故に∂[logp(x;θ)]/∂θ=x/θ-(N-x)/(1-θ)=(x-Nθ)/{θ(1-θ)}です。

 したがって,E[{∂[logp(X;θ)]/∂θ}2]=E[(x-Nθ)2]/{θ2(1-θ)2}=Nθ(1-θ)/{θ2(1-θ)2}=N/{θ(1-θ)},それ故,1/(nE[{∂[logp(X;θ)]/∂θ}2])=θ(1-θ)/(nN)です。

 ところで,<X>≡(X1+X2+..+Xn)/nと置くとE[<X>]=Nθ,Var[<X>]=Nθ(1-θ)/n,すなわち,Var[<X>/N]=θ(1-θ)/(nN)=1/(nE[{∂[logp(X;θ)]/∂θ}2])です。

 

 θの有効推定量は<X>/N=(X1+X2+..+Xn)/(nN)です。

(2)logp(x;θ)=-logΓ(α)-αlogθ+(α-1)logx-x/θ,故に∂[logp(x;θ)]/∂θ=-α/θ+x/θ2=(x-αθ)/θ2です。

 したがって,E[{∂[logp(X;θ)]/∂θ}2]=E[(x-αθ)2]/θ4=αθ24=α/θ2,それ故,1/(nE[{∂[logp(X;θ)]/∂θ}2])=θ2/(nα)です。

 <X>≡(X1+X2+..+Xn)/nと置くと,E[<X>]=αθ,Var[<X>]=αθ2/n,すなわち,Var[<X>/α]=θ2/(nα)=1/(nE[{∂[logp(X;θ)]/∂θ}2])です。

 

 θの有効推定量は<X>/α=(X1+X2+..+Xn)/(nα)です。

[定義11-14]:サンプル数をnとするとき,E[θ^]≠θであるがlimn→∞E[θ^]=θが成立するとき,θ^=θ^(X1,X2,..,Xn)をθの漸近不偏推定量(asymptotic unbiased estimator)という。

[定義11-15]:e[θ^]≡(nE[{∂[logp(X;θ)]/∂θ}2]Var[θ^])-1をθ^の有効性(efficiency)という。

これを用いるとC-R不等式は 0<e[θ^]≦1と書けます。

[例11-16]:X1,X2,..,Xnを正規母集団N[0,σ2]からの任意標本とし,σ2の推定量をσ2^≡Σj=1nj2/nとするときe[σ2^]を求める。

(解)p(x;σ2)=(2π)-1/2σ-1exp{-x2/(2σ2)}より,logp(x;σ2)=-(1/2)log(2π)-(1/2)logσ2-x2/(2σ2)なので,∂[logp(x;σ2)]/∂σ2=-1/(2σ2)+x2/{2(σ2)2}となります。

 故に,E[{∂[logp(X;σ2)]/∂σ2}2]=(2π)-1/2σ-1-∞[-1/(2σ2)+x2/{2(σ2)2}]2exp{-x2/(2σ2)}dx=(2π)-1/2{1/(4σ4)}∫-∞(1-2t2+t4) 2exp(-t2/2)dt=1/(2σ4)を得ます。

 

 それ故,nE[{∂[logp(X;σ2)]/∂σ2}2]=n/(2σ4)です。

 一方,Var[σ2^]=Var[Σj=1nj2/n]=Var[X2]/nで,Var[X2]=E[(X2-E[X2])2]=E[X4]-E[X2]2です。

 

 E[X]=0 なのでE[X2]=Var[X]=σ2です。また,E[X4]=(2π)-1/2σ-1-∞4exp{-x2/(2σ2)}dx=3σ4より,Var[X2]=2σ4,Var[σ2^]=2σ4/nです。

以上から,e[σ2^]=(nE[{∂[logp(X;σ2)]/∂σ2}2]Var[σ2^])-1=1です。(終わり)

[例11-17]:X1,X2,..,Xnを正規母集団N[0,σ2]からの任意標本とし,σ2の推定量を不偏分散σ2^≡Σj=1n(Xj-<X>)2/(n-1)とするとき有効性e[σ2^]を求める。

(解)p(x;σ2)=(2π)-1/2σ-1exp{-x2/(2σ2)}よりnE[{∂[logp(X;σ2)]/∂σ2}2]=n/(2σ4)です。(すぐ前の[例11-16]参照)

 

 一方,Var[σ2^]=Var[Σj=1n(Xj-<X>)2/(n-1)]=E[(Σj=1n(Xj-<X>)2/(n-1)-σ2)2]=E[(Σj=1nj2-n<X>2)2]/(n-1)2-σ4=(n2-1)/(n-1)2-σ4=2σ4/(n-1)です。(計算略)

したがって,e[σ2^]=(nE[{∂[logp(X;σ2)]/∂σ2}2]Var[σ2^])-1=(n-1)/n<1です。(終わり)

途中ですが今日はここまでにします。(つづく)

参考文献:藤沢武久 著「新編 確率・統計」(日本理工出版会),ラダクリシュナ-ラオ著(奥野忠一,篠崎信雄,古河陽子,鷲見泰俊,長田 洋,広崎昭太,矢島敬二 訳)「統計的推測とその応用」(東京図書)

 

PS:依然として風邪が治りません。

 

 以前は市販のカゼ薬を飲んで寝ていれば長くても3日くらいで完治したし,そもそも風邪など5年に1度くらいしか引きませんでした。ずっと臨時雇いだったので本格的に病気になると職を失いますから気を張っていたこともあったでしょうね。

 

 しかし,2006年暮れから2007年の初めに心臓病のせいで肺に水がたまり,その後2度目の入院で心臓手術して退院した後は,世間の気候の通りに病気になりやすく,最初のうち軽くて治ったかなと思ったときからが長くていつも10日以上もかかります。糖尿病のせいもあるでしょう。

 

 一人では立ち上がって部屋を出るのさえ苦しいので,医者までたどりつくこともできないし,食欲もないので最低限飲み物だけで2,3日臥せっています。

 

 3日分の薬もなくなりました。睡眠薬で無理やり寝てますが飯島愛さんの例もあるし,睡眠しているうちに肺炎で死ぬこともありますね。

 

 高校を出て一人暮らしを始めて以来42年足らず,いわば天涯孤独なので病気で寝込むというのは慣れているはずなのですが,何もする気力がなく無理に動くと苦しくなるので困ることが多いですね。

 

 41年前,故郷を出てからは,医者とか,看護師とか,お金を払って世話してもらう以外には,看病してもらったのは20代後半の頃,利尻島出身で白山に住んでいたガールフレンドの家で布団に寝て濡れタオルを額に乗せてもらったり,おカユ?(焼きそば?)を作ってもらったという記憶しかないですね。さびしい人生だな。。

 

 ↑ また弱音を吐いて同情でも買おうと考えてる。。自分のことばかりで,お前は他人の看病もしたことないじゃないか。。。

  

PS2:このブログを書くために数時間根をつめていたら心持ち症状が軽くなったような気がします。

   

 

ブックオフオンライン 

iconオンライン書店 boople.com(ブープル) 

| | コメント (2) | トラックバック (1)

2010年3月 8日 (月)

風邪引きました。

 気候が変なので3年ぶりくらいに風邪を引いてしまいまいた。

 仕方がないので最低限の食事を取ったあと,部屋の暖房の温度を上げて焼酎の炭酸割りを飲み,漢方の風邪薬と睡眠薬を飲んで無理やり寝ます。

 医者の話では,私の場合は肺炎を起こしたら8割強の確率で永眠できて睡眠不足が解消できるらしいのですが。。

 昔は風邪とか病気になると臨時雇いのため,仕事がクビになるので10年以上も風邪をひくヒマもなかったんですけどね。

| | コメント (0) | トラックバック (1)

2010年3月 7日 (日)

確率と分布関数(7)(極限定理の続き,収束の種類)

 確率と分布関数の続きです。 

色々と中断中のテーマはあるのですが,1つ1つコツコツと終わらせていくつもりです。今は,科学ブログを書いている限りブログネタには困りません。毎回悩んでいた昔が懐かしいくらいです。

[定理9-9]:中心極限定理(central limit theorem)(同一分布の場合)

有限な平均:μ=E[Xj],有限な分散:σ2=Var[Xj]の同一分布を持つ独立確率変数列:X1,X2,..に対して,limn→∞P({(X1+X2+..Xn-nμ)/(n1/2σ)}≦x)=(2π)-1/2-∞xexp(-u2/2)du(-∞<x<∞)が成立する。

(証明) Uj≡Xj-μと置くと,E[Uj]=E[Xj]-μ=0,E[Uj2]=Var[Xj]=σ2です。

  

 n(X1+X2+..Xn-nμ)/(n1/2σ)=(Σj=1nj)/(n1/2σ)と定義して,その特性関数をφn(t)と書けば,U1,U2,..が全て独立ですから,φn(t)=E[exp(itYn)]=Πj=1nE[exp{itUj/(n1/2σ)}]となります。

 

 ところで指数関数はexp(itu)=1+itu-(1/2)t22+(θ/6)(itu)3,(|θ|≦1)より,E[exp(itUj)]=1-(1/2)t2σ2+O(t3)と近似展開されます。

 

 そこで,Πj=1nE[exp{itUj/(n1/2σ)}]={1-t2/(2n)+O(n-3/2)}n={1+t2/(2n)+O(n-3/2)}-n=[{1+t2/(2n)+O(n-3/2)}1/{t2/(2n)+O(n-3/2)}]-t2/2+O(n-3/2)と書けます。

 

 ここで,公式:limn→∞(1+1/n)n=eから,limn→∞{1+t2/(2n)+O(n-3/2)}1/{t2/(2n)+O(n-3/2)}=eを得ます。

それ故,limn→∞φn(t)=exp(-t2/2)となります。右辺のexp(-t2/2)は標準正規分布N[0,1]の特性関数に一致しています。

 

φ(t)=exp(-t2/2)と置いてフーリエ反転公式:F(x2)-F(x1)=∫-∞[{exp(-itx2)-exp(-itx2)}φ(t)/(-it)]dtを用いると,F(x2)-F(x1)=(2π)-1/2x1x2exp(-u2/2)duを得ます。

 

したがって,F(x)=limn→∞P(Yn≦x)=(2π)-1/2-∞xexp(-u2/2)du (-∞<x<∞)が成立します。(証明終わり)

[例9-10]:上記の中心極限定理から大数の法則(law of large numbers)を導きます。

 

(解)uの関数exp(-u2/2)の性質から,任意のε10 に対して,あるx>0 が存在して(2π)-1/2-xxexp(-u2/2)du=1-ε1が成立することがわかります。

 そして,別に任意のε>0 を与えて,n≧σ222となるようなnを取ります。このとき,x≦n1/2ε/σです。

そこで,中心極限定理によりP(|(X1+X2+..Xn)/n-μ|≦ε)=P(|(X1+X2+..Xn-nμ)/(n1/2σ)|≦(n1/2ε/σ))≧P(|(X1+X2+..Xn-nμ)/(n1/2σ)|≦x) → (2π)-1/2-xxexp(-u2/2)du=1-ε1 (as n→∞)となります。

 したがって,十分大きいnに対して,P(|(X1+X2+..Xn)/n-μ|≦ε)>1-2ε1,すなわち,P(|(X1+X2+..Xn)/n-μ|>ε)<2ε1です。

 

 ε1>0 は任意でしたから,limn→∞P(|(X1+X2+..Xn)/n-μ|>ε)=0 を得ます。これは先に述べた大数の法則です。(終わり)

[定理9-11]:ラプラス-ド・モアブルの定理(Laplace-de Moivre)

  

 各試行の結果,排反事象T,Hのどちらか1つが起きるようなn回の"ベルヌーイ試行=独立試行"で,各試行の結果がTなら1,Hなら0 を割り当てる確率変数をXj(j=1,2,..,)とする。

  

 このとき,n回の試行のうちでTが出る回数をSnとすればSn=X1+X2+..+Xn=Σj=1njである。

そこで,P(Xj=1)=p,P(Xj=0)=q=1-pのときYn≡(Sn-np)/(npq)1/2と置けば,Ynのd.f:Fn(y)=P(Yn≦y)に対してlimn→∞n(y)=(2π)-1/2-∞yexp(-u2/2)duが成立する。

(yについて一様収束である。)

(証明) E[Xj]=p,Var[Xj]=pqより[定理9-9]を適用すれば自明。(証明終わり)

[定理9-12]:コルモゴロフの不等式(Kolmogorov's inequality)

平均がゼロで分散が有限の独立確率変数列:X1,X2,..について,Sk≡X1+X2+..+Xkと置けば任意のε>0 に対し,P(max(|S1|,|S2|,..,|Sn|)≧ε)≦(1/ε2){Σk=1n Var[Xk]}が成立する。

(証明):集合AをA≡{ω∈Ω|max(|S1|,|S2|,..,|Sn|)≧ε}と定義し,集合列:{Ak}k=1,2,.をA1≡{ω∈Ω||S1|≧ε},Ak≡{ω∈Ω||Sj|<ε(j=1,2,..,k-1),|Sk|≧ε)(k=2,3,..,n)で定義すれば,A=A1+A2+..+An=Σk=1nkです。

 このとき,A,Ak(k=1,2,..,n)の指示関数IA,IAkについて,明らかにIA=Σk=1nAkが成立します。故にP(A)=Σk=1nP(Ak)=Σk=1nP(IAk=1)です。

 一方,Sn=Sk+(Sn-Sk)で,Sk=X1+X2+..+Xk,(Sn-Sk)=Xk+1+Xk+2+..+Xnです。

 

 そして,SnとSkは独立ですから,Val[Sn]=Var[Sk]+Var[Sn-Sk]であり,E[Sk]=E[Sn-Sk]=0 です。

 故に,E[IAkn2]=E[IAkk2]+E[IAk(Sn-Sk)2]≧E[IAkk2]≧ε2P(IAk=1)=ε2P(Ak)なる不等式が得られます。

 そこで,Σk=1nVar[Xk]=E[Sn2]≧E[IAn2]=Σk=1nE[IAkn2]≧ε2Σk=1nP(Ak)=ε2P(A)=P(max(|S1|,|S2|,..,|Sn|)≧ε)が成立します。(証明終わり)

[定理9-13]:独立確率変数列:X1,X2,..があって,それぞれ平均ゼロと有限の分散和:Σk=1Var[Xk]<∞を持てば,P(Σk=1kが収束する)=1が成り立つ。

 

(これを"Σk=1kは概収束する。",あるいは,"ほとんど到るところで収束する。"という。)

(証明)Sk≡X1+X2+..+Xk=Σj=1kjと置けば,Sn+k-Sn=Xn+1+Xn+2+..+Xn+k-1です。

 

 一方,上記の[定理9-12]によれば,P(max(|S1|,|S2|,..,|Sn|)≧ε)≦(1/ε2){Σk=1n Var[Xk]}ですから,0≦P(max1≦k≦N(|Sn+k-Sn|)≧ε)≦(1/ε2){Σj=n+1n+N Var[Xj]}(N≧1)です。

両辺のN→ ∞ の極限を取ると, 0≦P(maxk≧1(|Sn+k-Sn|)≧ε)≦(1/ε2){Σj=n+1Var[Xj]}ですが,Σk=1Var[Xk]<∞ なる仮定によって,n→ ∞ に対して,右辺=Σj=n+1Var[Xj] → 0です。

そこで,(1/2ν)3>0 に対してpνが存在してΣj=pν+1Var[Xj]<(1/2ν)3=2-3νとなります。

 

よって,ε=1/2νと置けば,0 ≦P(maxk≧1(|Sn+k-Sn|)≧=1/2ν)≦2j= pν+1Var[Xj]}<2=1/2νが成立します。

したがって,Eν≡{ω∈Ω|maxk≧1(|Sn+k-Sn|)≧1/2ν}と置けばP(∪ν=1ν)≦Σν=1P(Eν)<Σν=12=1となります。そこで,n→∞ に対して,P(∪ν=nν)→ 0 です。

それ故,E≡∩n=1ν=nνと置けば,0 ≦P(E)≦P(∪ν=nν)→ 0,つまりP(E)=0 です。

 

そこで,P(Ec)=1 ですが,Ec=∪n=1ν=nνc,Eνc={ω∈Ω|maxk≧1(|Sn+k-Sn|)<1/2ν}={ω∈Ω|maxk≧1[|Σj= pν+1 pν+kj(ω)|]<1/2ν}です。

よって,ω∈Ecのとき,ある自然数nが存在してν≧nならω∈Eνc,つまり,|Σj= pν+1 pν+kj(ω)|<1/2ν≦1/2n (k≧1)です。

ω∈Ecならω∈Encですから,n≦pn≦mのとき|Σj=m+1 j(ω)|=|Σj=pn+1 j(ω)-Σj=pn+1 mj(ω)|≦|Σj=pn+1 j(ω)|+Σj=pn+1 mj(ω)|≦1/2n-1です。

 

つまり,ω∈Ecならn→ ∞ に対し|Σj=m+1 j(ω)|→ 0 です。それ故,P(Ec)≦P({ω∈Ω||Σj=m+1 j(ω)|→ 0 })です。

  

以上から,1=P(Ec)=P(∪n=1ν=nνc)=P(Σj=1 jが収束する。) が成り立ちます。 (証明終わり)

(注)これは2007年6/25の記事「ブラウン運動と伊藤積分(3)」で与えた(ボレル・カンテリ(Borel-Cantelli)の補題)とほぼ同じ内容です。

 

 すなわち,"{An}n=1,2,.を集合列としAをこれらの集合の無限個の共通に含まれる要素の集合,Pを確率測度とする。このとき,(a)ΣP(An)<∞ ならP(A)=0 (b)ΣP(An)=∞ で事象:Anが独立ならP(A)=1である。"という定理です。

 

(上記補題の証明):(a)A=∩r=1n=rnと書けます。よって∀rについてA⊂∪n=rnです。

 

ΣP(An)が収束するので,ε>0 を任意に取れば十分大きいrに対してP(A)≦P(∪n=rn)≦Σn=rP(An)<εです。そして,ε>0 が任意なのでP(A)=0 です。

(b)A=∩r=1n=rnより,Ac=∪r=1n=rncです。

 

故に,1-P(A)=P(Ac)=P(∪r=1n=rnc)≦Σr=1P(∩n=rnc)≦Σr=1Πn=r[1-P(An)]です。

 

ここで,ΣP(An)=∞ なので各rについて右辺の無限積は 0 に発散します。(Σlog[1-P(An)]≦-ΣP(An)=-∞ よりΠn=r[1-P(An)]=exp(-∞)=0 です。) 故に,P(A)=1です。(証明終わり)(注終わり)※

[定理9-14]:大数の強法則(strong rule of large numbers)

独立確率変数列:X1,X2,..が,各々平均:E[Xj]=μj(-∞<μj<∞),分散:Var[Xj]=σj2<∞を持てば,Sn≡X1+X2+..+Xnと置くとE[Sn]=μ1+μ2+..+μn=mnである。

 

もしも,Σj=1 σj2<∞ なら,P(limn→∞(Sn-mn)/n=0)=1 が成り立つ。

(証明):Uj≡(Xj-μj)/jと置けば,E[Uj]=0,かつVar[Uj]=σj2/j2です。

仮定によって,Σj=1Var[Uj]=Σj=1 σj2<∞ ですから,[定理9-13]よりP(Σj=1j=Σj=1(Xj-μj)/jが収束する。)=1 が成立します。そこで,Sn'≡Σj=1nj=Σj=1n(Xj-μj)/jと置けばP(n→∞でSn'が収束する)=1 です。

ところで,S1'=U1=X1-μ1,Sn'-Sn-1'=Un(n≧2),つまりn(Sn'-Sn-1')=Xn-μn(n≧2)なので,(Sn-mn)/n=(1/n){S1'+2(S2'-S1')+..+n(Sn'-Sn-1')}=Sn'-(Σj=1n-1j')/nと書けます。

(n→∞でSn'が収束する)=1 を,ほとんど到るところでlimn→∞n'=Sと表現すれば,ほとんどいたるところでlimn→∞j=1n-1j')/n=Sです。

 

したがってP(limn→∞(Sn-mn)/n=0)=1 を得ます。(証明終わり)

※ 独立確率変数の平均がほとんど到るところで平均値の平均に収束するというこの定理を大数の強法則といいます。※ 

次に確率関連の収束の種類をまとめます。 

1.確率収束(convergence in probability)

[定義10.1]:確率変数の列:{Xn}n=1,2..があって∀ε>0 に対しlimn→∞P(|Xn-X|>ε)=0 が成り立つとき,XnはXに確率収束するといい,Xn PXと書く。

[定理10.2]:独立確率変数列:X1,X2,..が同一の平均E[Xj]=μ,分散Var[Xj]=σ2を持てば,∀α>0 に対して,{(X1+X2+..+Xn-nμ)/n1/2+α}n P 0 (n→∞)である。

(証明) Yn≡(X1+X2+..+Xn-nμ)/n1/2+αと置けば,E[Yn]=0 ,Val(Yn)=nσ2/n1+2α=σ2/nです。

 よって,平均がμ,分散がσ2の確率変数Xに対するチェビシェフの不等式:P(|X-μ|>k)≦σ2/k2を適用すればP(|Yn|>ε)≦σ2/(ε2)→ 0 (n→∞)です。(証明終わり)

2.法則収束(convergence in distibution)

[定義10.3]:確率変数の列{Xn}n=1,2..,と別にある1つの独立変数XがあってXの分布関数F(x)の全ての連続点において,Xnの分布関数Fn(x)がlimn→∞n(x)=F(x)を満たすなら,{Xn}はXに法則収束するといい,Xn dX,またはdlimXn=Xと書く。

[例10.4]: 確率変数Xの確率分布が,P(X=0)=P(X=1)=1/2のとき,確率変数列:{Xn}をXn≡1+1/n-Xで定義すれば,Xn dX (n→∞)が成り立つ。

(証明):Xn≡1+1/n-Xなので,X=0 ⇔ Xn=1+1/n;X=1 ⇔ Xn=1/nです。そこでP(Xn=1+1/n)=P(X=0)=1/2,P(Xn=1/n)=P(X=1)=1/2です。

 一方,Xの具体的な分布関数は,F(x)=P(X≦x)= 0 (for x< 0),1/2 (for 0≦x<1),1(for x≧1)です。

 

 そして,x≦0 に対しては明らかにFn(x)=P(Xn≦x)=0 です。0<x≦1 に対してはn→∞で1/n≦xより,limP(Xn≦x)=1/2です。そしてx>1ならn→∞で1+1/n≦xより,limP(Xn≦x)=1です。(証明終わり)

[定理10.5]:確率変数列{Xn}が確率収束(Xn PX)するなら法則収束(Xn dX)する。

(証明) {Xn}が確率収束(Xn PX)するとします。

すると,Fn(x)=P(Xn≦x)=P(Xn≦x,X≦x+ε)+P(Xn≦x,X>x+ε)≦P(X≦x+ε)+P(Xn≦x,X>x+ε)≦P(X≦x+ε)+P(|Xn-X|≦ε)です。

一方,P(X≦x-ε)=P(Xn≦x,X≦x-ε)+P(Xn>x,X≦x-ε)≦P(Xn≦x)+P(Xn>x,X≦x-ε)≦P(Xn≦x)+P(|Xn-X|≦ε)です。

 以上から,P(X≦x-ε)-P(|Xn-X|≦ε)≦P(Xn≦x)≦P(X≦x+ε)+P(|Xn-X|≦ε)ですが,Xn P X,つまりlimn→∞P(|Xn-X|≦ε)=0 ですからP(X≦x-ε)≦limn→∞P(Xn≦x)≦P(X≦x+ε)が成立します。

 それ故,F(x)=P(X≦x)と置けばF(x-ε)≦limn→∞n(x)≦F(x+ε)です。そしてε>0 が任意なのでxがF(x)の連続点ならlimn→∞n(x)≦F(x),or Xn dXが成立します。(証明終わり)

[定理10-6]:確率変数列X1,X2,..が全て独立で,それぞれ平均:E[Xj]=μj,分散:Var[Xj]=σj2(j=1,2,..)を持つとする。このときn≡n-1/2Σj=1n{(Xj-μj)/σj}と置けば,各Xj3次の積率が有限のtきnはあるUに法則収束する。すなわち,Un d Uである。

ただし,Uは標準正規分布N[0.1]を持つ確率変数である。

(証明):Yj≡(Xj-μj)/σjと置くと,E[Yj]=0,Var[Yj]=1です。

 

 そこで中心極限定理により,分布関数の連続点ではn→∞ に対してP(Un≦x)=P({(Y1+Y2+.. +Yn)/n1/2}≦xj))→ (2π)-1/2-∞xexp(-u2/2)duです。

 

 したがって,Un d Uで,UはN[0,1]を持つ確率変数です。(証明終わり)

3.概収束(almosut sure convergence)

[定義10-7]:確率空間(Ω,,P)上の確率変数列:{Xn}n=1,2..,およびある1つの確率変数Xに対して,P({ω∈Ω|limn→∞n(ω)=X(ω)})=1 が成立するとき,XnはXに概収束するといい,Xn a.s Xと書く。

 ただし,a.s.はalmosut surely(ほとんど確実に)を意味します。a.s.の代わりにa.e.=almost everywhere(ほとんど到るところで)を用いることもあります。

[定理10-8]:∀ε>0 に対してlimn→∞P(∪j≧n{ω∈Ω||Xj(ω)-X(ω)|≧ε})=0 は,Xn a.s Xと同値である。

(証明):Ej(ε)≡{ω∈Ω||Xj(ω)-X(ω)|≧ε}と置きます。すると定理の仮定は,limn→∞P(∪j≧nj(ε))=0 と書き直せます。

n=1j≧nj(ε)⊂∪j≧nj(ε)ですから,0≦P(∩n=1j≧nj(ε))≦P(∪j≧nj(ε))→ 0 (n→∞),つまりP(limsupEn(ε))=limn→∞P(∩n=1j≧nj(ε))=0 です。

そこで,E≡∪p=1n=1j≧nj(1/p))と置けば,0≦P(E)≦Σp=1P(∩n=1j≧nj(1/p))=0 ,すなわちP(E)=0 です。

 

それ故,P(Ec)=1で,Ec=∩p=1n=1j≧n{Ej(1/p)}cです。

 そして,ω∈Ecとすると,任意の自然数pに対して,あるnが存在してj≧nなら|Xj(ω)-X(ω)|<1/pが成り立ちます。

 

 そこで,ω∈Ecならlimn→∞j(ω)=X(ω)です。故に,Ec⊂{ω∈Ωlimn→∞j(ω)=X(ω)}です。

 したがって,1=P(Ec)≦P({ω∈Ωlimn→∞j(ω)=X(ω)})≦1が成り立ちます。故に,P({ω∈Ωlimn→∞j(ω)=X(ω)})=1,つまり,Xn a.s Xです。

 逆に,Xn a.s X (n→∞),すなわちP({ω∈Ωlimn→∞j(ω)=X(ω)})=1 とします。

ω∈{ω∈Ωlimn→∞j(ω)=X(ω)}のとき,任意の自然数pに対しあるnが存在してj≧nなら|Xj(ω)-X(ω)|<1/pが成立します。

 

すなわち,任意の自然数pに対して適当なnを取ればω∈∩j=n{Ej(1/p)}cですが,これはω∈∩p=1n=1j=n{Ej(1/p)}c=Ecを意味します。

つまり,{ω∈Ωlimn→∞j(ω)=X(ω)}⊂Ecですから仮定により1=P({ω∈Ωlimn→∞j(ω)=X(ω)})≦P(Ec)≦1です。それ故,P(Ec)=1 です。故にP(E)=0 です。

 E=∪p=1n=1j=nj(1/p)より,任意のpに対して∩n=1j=nj(1/p)⊂EなのでP(∪j=nj(1/p))=0 です。

 

 つまり,limm→∞P(∩n=1mj=nj(1/p))=0 ,またはlimm→∞P(∪j=mj(1/p))=0 です。

 ところで,任意のε>0 に対しε≧1/pなるpを採用すると,ω⊂Ej(ε)のとき|Xj(ω)-X(ω)|≧ε≧1/pによってω⊂Ej(1/p),つまりEj(ε)⊂Ej(1/p)です。

 

 そこで,∪j=mj(ε)⊂∪j=mj(1/p)ですから,0 ≦P(∪j=mj(ε))⊂P(∪j=mj(1/p))→ 0 です。

 したがって,任意のε>0 に対して,limn→∞P(∪j=mj(ε))=0 が成立します。(証明終わり)

[例10-9]:確率変数Xが(0,1)上の一様分布を持つとき,確率変数列:{Xn}をXn≡X+δn(X)で定義する。ただし,δn(x)は,0≦x≦1/nならδn(x)=1,それ以外ではδn(x)=0 なる関数である。このとき,Xn a.s X (n→∞)が成立する。

(証明) Xj-X=δj(X)ですから,0<ε≦1を満たす任意のεに対して,|Xj-X|>εとなるのはδj(X)=1 のとき,つまり,0≦X≦1/jのときだけです。

 j≧nなら1/j≦1/nですから,0≦ε≦1/nなら∪j≧n{|Xj-X|>ε}={|Xj-X|>1/n}={0≦X≦1/n}です。また,ε>1 なら∪j≧n{|Xj-X|>ε}=φです。

 

 Xが(0,1)上の一様分布を持つことから,これはP(∪j≧n{|Xj-X|>ε})≦1/nを意味します。

したがって,limn→∞P(∪j≧n{|Xj-X|>ε})=0 です。故に,[定理10-8]からXn a.s X (n→∞)です。(証明終わり)

[例10-10]:確率変数列:{Xn}は各々の平均がゼロで分散:Var[Xn]の和:が有限:Σn=1Var[Xn]<∞ であるとする。このとき,Xn a.s 0 (n→∞)が成り立つ。

(証明):平均がμ,分散がσ2の確率変数Xに対するチェビシェフの不等式:P(|X-μ|>k)≦σ2/k2は今の場合P(|Xj|>ε)≦Var[Xj]/ε2となります。

 それ故,P(∪j≧n{|Xj|>ε})≦{Σj=nVar[Xj]}/ε2 → 0 (as n→∞)となります。故に,[定理10-8]からXn a.s 0 (n→∞)です。(証明終わり)

[定理10-11]:確率変数列:{Xn}が概収束(Xn a.s.X)するなら確率収束(Xn PX)する。

(証明):{Xn}が概収束するとします。

ε>0 を任意に取って,Ej(ε)≡{ω∈Ω}|Xj(ω)-X(ω)|>ε}と置けばEj(ε)c={ω∈Ω}|Xj(ω)-X(ω)|≦ε}です。

 

仮定:Xn a.s.XよりP(limn→∞n =X)=1 ですから,limn→∞P(∩j=nj(ε)c)=1,故にlimn→∞P(∪j=nj(ε))=0 です。

一方,P(|Xn-X|≧ε)=P({ω∈Ω||Xn(ω)-X(ω)|≧ε})≦P(∪j=n{ω∈Ω||Xj(ω)-X(ω)|≧ε})=P(∪j=nj(ε))ですから,任意のε>0 に対してlimn→∞P(|Xn-X|≧ε)=0,すなわち,Xn PXが成立します。(証明終わり)

(注):逆命題の「確率変数列{Xn}が確率収束(Xn PX)するなら概収束(Xn a.s.X)する。」は一般には成立しません。

実際,任意のε>0,δ>0 を与えると,n a.s.(概収束)の場合,あるNが存在してP(∪n=N{ω∈Ω|Xn(ω)-X(ω)|>ε})≦δ,つまりP(∩n=N{ω∈Ω|Xn(ω)-X(ω)|≦ε})>1-δが成立します。

 一方,Xn PX(確率収束)の場合,あるMが存在してn≧MならP({ω∈Ω|Xn(ω)-X(ω)|≦ε})>1-δが成立します。

上記の評価式は,概収束の場合はn=N,N+1,N+2,..について{ω∈Ω|Xn(ω)-X(ω)|≦ε}が同時に起こる確率が1に近いことを示していますが,確率収束の場合はn=M,M+1,M+2,..のそれぞれついて{ω∈Ω|Xn(ω)-X(ω)|≦ε}が起こる確率が1に近いことを示しているに過ぎません。

したがって,確率収束する場合,収束が起こる集合:{ω∈Ω|XM(ω)-X(ω)|≦ε}と集合:{ω∈Ω|XM+1(ω)-X(ω)|≦ε}の間に何の関係も要求されず,ただ,それぞれの確率が1に近いだけです。

一方,概収束する場合は{ω∈Ω|XM(ω)-X(ω)|≦ε}と{ω∈Ω|XM+1(ω)-X(ω)|≦ε}の共通集合の確率が1に近いことを意味するため,確率収束する場合より条件が厳しいです。(注終わり)※

4.二乗平均収束(convergebce in mean square)

[定義10-12]:確率変数列{Xn}n=1,2..,およびある1つの確率変数Xに対して,limn→∞E[(Xn-X)2]=0 が成立するとき,XnはXに二乗平均収束するという。

[定理10-13]: 確率変数列{Xn}が二乗平均収束するなら確率収束(Xn PX)する。

 

(証明):平均がμ,分散がσ2の確率変数Xに対するチェビシェフの不等式:P(|X-μ|>k)≦σ2/k2を今の場合に適用すると, 0 ≦P(|Xj-X|>ε)≦Var[Xj]/ε2=E[(Xn-X)2]/ε2となります。

 

そこで,{Xn}が二乗平均収束するなら,limn→∞E[(Xn-X)2]=0 よりlimn→∞P(|Xj-X|>ε)=0 ,or Xn PXです。(証明終わり)

今日はここまでにします。

 

当初の目的の重回帰係数のt検定の項目まで後一息です。(つづく)

参考文献:藤沢武久 著「新編 確率・統計」(日本理工出版会)

  

 

ブックオフオンライン 

iconオンライン書店 boople.com(ブープル)

| | コメント (0) | トラックバック (0)

2010年3月 5日 (金)

高知:白バイ・スクールバス衝突事件:民事も棄却

 どうも,高知県警,そして検察,裁判所がグルになって,昔,映画「ワ-ルド・アパート」http://www.allcinema.net/prog/show_c.php?num_c=25906

 で見たアパルトヘイト(Apartheid:人種隔離政策)時代の南アフリカの白人政府が黒人協力者の白人家族にした仕打ちのような,暴挙がまかり通っているらしい。

 

 → 高知白バイ衝突事故(Wikipedia),2008年8/22 最高裁・上告棄却 高知:白バイ事件 そして,今回2010年2/23日に1年4ヶ月服役後に出所の片岡運転手家族の民事の賠償請求に門前払い。。。

 

 いやあ,アナクロですね。。

  

 既に,警察関係者の破廉恥な犯罪の頻発や,足利事件での犯人でっちあげetc.枚挙にいとまがなく,いまさら組織防衛に走ってもメンツもクソもなくて底が割れているのは明らかなのに。

 

 後は身内への義理だけか。。

  

 そりゃあ,他人の痛みは自分の痛みじゃないよ。対岸の火事だよ。だけどねえ。。血は通ってるのかい??

 

ブックオフオンライン 

iconオンライン書店 boople.com(ブープル)

| | コメント (2) | トラックバック (0)

2010年3月 3日 (水)

将棋A級順位戦一番長い日

 TKさんからのメール情報によれば,3月2日(火)に,一斉に行なわれた将棋A級順位戦最終戦(9回戦)の結果,三浦弘行八段が郷田正隆九段を破り7勝2敗の単独トップで羽生善治名人への挑戦が決まりました。

 また,井上慶太八段が木村一基八段に破れて3勝6敗となり順位の関係で佐藤康光九段と共に来期B級への陥落が決まりました。

 その他の結果は高橋(勝)-谷川,佐藤(勝)-丸山,森内(勝)-藤井でした。

 この結果A級の最終成績は次のようになりました。なお,来期は初のA級の渡辺明竜王と,A級復帰の久保利明棋王がA級に加わります。

7勝2敗  三浦弘行(名人挑戦)
6勝3敗 高橋道雄
5勝4敗 丸山忠久,谷川浩司,森内俊之,木村一基
4勝5敗 郷田真隆
3勝6敗 藤井猛,井上慶太(降級)
2勝7敗  佐藤康光:(降級)

 まずはお知らせまで。。

 

ブックオフオンライン 

iconオンライン書店 boople.com(ブープル) 

| | コメント (0) | トラックバック (0)

« 2010年2月 | トップページ | 2010年4月 »