<?xml version="1.0" encoding="UTF-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">
    <title>森保研究室</title>
    <link rel="alternate" type="text/html" href="http://www.moriyasu.org/" />
    <link rel="self" type="application/atom+xml" href="http://www.moriyasu.org/atom.xml" />
    <id>tag:www.moriyasu.org,2008-07-11://2</id>
    <updated>2008-12-18T08:55:13Z</updated>
    <subtitle>長崎大学経済学部准教授 森保洋 のウェブサイトです。</subtitle>
    <generator uri="http://www.sixapart.com/movabletype/">Movable Type 4.2rc3-ja</generator>

<entry>
    <title>引っ越しました</title>
    <link rel="alternate" type="text/html" href="http://www.moriyasu.org/2008/12/post-79.html" />
    <id>tag:www.moriyasu.org,2008://2.192</id>

    <published>2008-12-18T08:54:16Z</published>
    <updated>2008-12-18T08:55:13Z</updated>

    <summary>最新の情報はこちらをご覧下さい。 ...</summary>
    <author>
        <name>moriyasu</name>
        <uri>http://www.moriyasu.org/</uri>
    </author>
    
    
    <content type="html" xml:lang="ja" xml:base="http://www.moriyasu.org/">
        <![CDATA[最新の情報は<a href="http://d.hatena.ne.jp/hiroshi_moriyasu/">こちらをご覧下さい</a>。 ]]>
        
    </content>
</entry>

<entry>
    <title>主成分分析</title>
    <link rel="alternate" type="text/html" href="http://www.moriyasu.org/2008/07/post-78.html" />
    <id>tag:www.moriyasu.org,2008://2.186</id>

    <published>2008-07-22T05:47:31Z</published>
    <updated>2008-07-22T05:53:03Z</updated>

    <summary><![CDATA[&nbsp;  アメリカ各州の犯罪件数のデータcrime.csvを利用して主成分...]]></summary>
    <author>
        <name>moriyasu</name>
        <uri>http://www.moriyasu.org/</uri>
    </author>
    
        <category term="研究・教育" scheme="http://www.sixapart.com/ns/types#category" />
    
    
    <content type="html" xml:lang="ja" xml:base="http://www.moriyasu.org/">
        <![CDATA[<h3>&nbsp;</h3>  <p>アメリカ各州の犯罪件数のデータ</p><span class="mt-enclosure mt-enclosure-file" style="display: inline;"><a href="http://www.moriyasu.org/2008/07/22/crime.csv">crime.csv</a></span><p>を利用して主成分分析を行います。まず、データを読み込みます。read.csv中の「row.names=1」はデータの1列目をデータとしてではなく、列の名前として指定するというオプションです。</p>  <p><font color="#ff0000">&gt; crime &lt;- read.csv("crime.csv",row.names=1)</font></p>  <p><font color="#ff0000">&gt; crime</font></p>  <p><font color="#0000ff">殺人 強姦 車の窃盗</font></p>  <p><font color="#0000ff">ALABAMA 14.2 25.2 280.7</font></p>  <p><font color="#0000ff">ALASKA 10.8 51.6 753.3</font></p>  <p><font color="#0000ff">ARIZONA 9.5 34.2 439.5</font></p>  <p><font color="#0000ff">ARKANSAS 8.8 27.6 183.4</font></p>  <p><font color="#0000ff">CALIFORNIA 11.5 49.4 663.5</font></p>  <p><font color="#0000ff">COLORADO 6.3 42.0 477.1</font></p>  <p><font color="#0000ff">CONNECTICUT 4.2 16.8 593.2</font></p>  <p><font color="#0000ff">DELAWARE 6.0 24.9 467.0</font></p>  <p><font color="#0000ff">FLORIDA 10.2 39.6 351.4</font></p>  <p><font color="#0000ff">GEORGIA 11.7 31.1 297.9</font></p>  <p><font color="#0000ff">HAWAII 7.2 25.5 489.4</font></p>  <p>主成分分析を行うための関数はprcompです。以下のように利用します。「scale=T」は標準化後のデータについて分析を行うというオプションです。いつでも必ず利用するオプションと考えて下さい。</p>  <p><font color="#ff0000">&gt; result &lt;- prcomp(crime,scale=T)</font></p>  <p>summaryを使うと、累積寄与率が表示されます。</p>  <p><font color="#ff0000">&gt; summary(result)</font></p>  <p><font color="#0000ff">Importance of components:</font></p>  <p><font color="#0000ff">PC1 PC2 PC3</font></p>  <p><font color="#0000ff">Standard deviation 1.314 0.970 0.577</font></p>  <p><font color="#0000ff">Proportion of Variance 0.575 0.313 0.111</font></p>  <p><font color="#0000ff">Cumulative Proportion 0.575 0.889 1.000</font></p>  <p>第2主成分までの累積寄与率が88.9%であるので、第2主成分までについて分析を進めていきましょう。</p>  <p> 結果を代入した変数名$rotationとすると、主成分負荷量が表示されます。</p>  <p><font color="#ff0000">&gt; result$rotation</font></p>  <p><font color="#0000ff">PC1 PC2 PC3</font></p>  <p><font color="#0000ff">殺人 -0.6088455 0.49760728 -0.6178140</font></p>  <p><font color="#0000ff">強姦 -0.6910353 0.04978736 0.7211043</font></p>  <p><font color="#0000ff">車の窃盗 -0.3895861 -0.86597241 -0.3135514</font></p>  <p> また、結果を代入した変数名$x とすると、主成分得点が表示されます。</p>  <p><font color="#ff0000">&gt; result$x</font></p>  <p><font color="#0000ff">PC1 PC2 PC3</font></p>  <p><font color="#0000ff">ALABAMA -0.83442342 1.300508984 -0.95824549</font></p>  <p><font color="#0000ff">ALASKA -2.94664437 -1.131057633 0.58807447</font></p>  <p><font color="#0000ff">ARIZONA -0.99230103 0.026252731 0.13840981</font></p>  <p><font color="#0000ff">ARKANSAS 0.05770611 1.052383789 0.22314053</font></p>  <p><font color="#0000ff">CALIFORNIA -2.73467002 -0.649053651 0.47438226</font></p>  <p><font color="#0000ff">COLORADO -1.06513967 -0.517820358 1.11148111</font></p>  <p>累積寄与率から第2主成分までに全体の89％の情報が含まれていることが分かりました。ここでは、第1主成分と第2主成分をそれぞれX軸、Y軸にして、各州の主成分得点を散布図にしてみましょう。</p>  <p><font color="#ff0000">&gt; plot(result$x[,1],result$x[,2],pch=" ",xlab="第1主成分",ylab="第2主成分")</font></p>  <p><font color="#ff0000">&gt; text(result$x[,1],result$x[,2],rownames(result$x))</font></p>  <p><a href="http://www.moriyasu.org/WindowsLiveWriter/0904a8015821_CFF8/clip_image002_2.gif"><img style="border: 0px none ;" alt="clip_image002" src="http://www.moriyasu.org/WindowsLiveWriter/0904a8015821_CFF8/clip_image002_thumb.gif" width="240" border="0" height="172" /></a></p>  <h3>練習問題</h3>  <span class="mt-enclosure mt-enclosure-file" style="display: inline;"><a href="http://www.moriyasu.org/2008/07/22/pharma.csv">pharma.csv</a></span><p>には製薬会社の経営指標が、</p><span class="mt-enclosure mt-enclosure-file" style="display: inline;"><a href="http://www.moriyasu.org/2008/07/22/industry.csv">industry.csv</a></span><p>には各都道府県の産業別労働従事者比率が記録され得ています。このデータを使って主成分分析を行いなさい。</p><div><br /></div>]]>
        
    </content>
</entry>

<entry>
    <title>単回帰分析</title>
    <link rel="alternate" type="text/html" href="http://www.moriyasu.org/2008/07/post-77.html" />
    <id>tag:www.moriyasu.org,2008://2.185</id>

    <published>2008-07-15T05:53:51Z</published>
    <updated>2008-07-15T06:18:24Z</updated>

    <summary><![CDATA[&nbsp;  ファイルgarbage.csvに横浜と川崎を除く神奈川県内の各市...]]></summary>
    <author>
        <name>moriyasu</name>
        <uri>http://www.moriyasu.org/</uri>
    </author>
    
        <category term="研究・教育" scheme="http://www.sixapart.com/ns/types#category" />
    
    
    <content type="html" xml:lang="ja" xml:base="http://www.moriyasu.org/">
        <![CDATA[<h3>&nbsp;</h3>  <p>ファイル</p><span class="mt-enclosure mt-enclosure-file" style="display: inline;"><a href="http://www.moriyasu.org/2008/07/15/garbage.csv">garbage.csv</a></span><p>に横浜と川崎を除く神奈川県内の各市における人口とゴミ収集量のデータが保存されています。このデータを使って、</p>  <p>（ゴミ収集量）＝<a href="http://www.moriyasu.org/WindowsLiveWriter/76768a142613_D16E/clip_image002_2.gif"><img style="border: 0px none ;" alt="clip_image002" src="http://www.moriyasu.org/WindowsLiveWriter/76768a142613_D16E/clip_image002_thumb.gif" width="36" border="0" height="19" /></a>×(人口）<a href="http://www.moriyasu.org/WindowsLiveWriter/76768a142613_D16E/clip_image004_2.gif"><img style="border: 0px none ;" alt="clip_image004" src="http://www.moriyasu.org/WindowsLiveWriter/76768a142613_D16E/clip_image004_thumb.gif" width="25" border="0" height="19" /></a></p>  <p>の単回帰分析を行ってみましょう。</p>  <h4>データの入力</h4>  <p>いつものように read.csvを使ってデータを読み込みます。</p>  <p><font color="#ff0000">&gt; g &lt;- read.csv("garbage.csv")</font></p>  <p><font color="#ff0000">&gt; g</font></p>  <p><font color="#0000ff">市 人口ごみ収集量</font></p>  <p><font color="#0000ff">1 平塚 251991 75938</font></p>  <p><font color="#0000ff">2 鎌倉 172638 64139</font></p>  <p><font color="#0000ff">3 藤沢 362088 106898</font></p>  <p><font color="#0000ff">4 小田原 197460 72415</font></p>  <p><font color="#0000ff">5 茅ヶ崎 209575 64302</font></p>  <p><font color="#0000ff">6 逗子 56436 20700</font></p>  <p><font color="#0000ff">7 相模原 560366 169343</font></p>  <p><font color="#0000ff">8 三浦 53795 20550</font></p>  <p><font color="#0000ff">9 秦野 161692 46948</font></p>  <p><font color="#0000ff">10 厚木 206186 85428</font></p>  <p><font color="#0000ff">11 大和 202200 76155</font></p>  <p><font color="#0000ff">12 伊勢原 96436 31048</font></p>  <p><font color="#0000ff">13 海老名 110638 32124</font></p>  <p><font color="#0000ff">14 座間 117025 36712</font></p>  <p><font color="#0000ff">15 南足柄 43314 12939</font></p>  <p><font color="#0000ff">16 綾瀬 80430 25665</font></p>  <h4>&nbsp;</h4>  <p>R で回帰分析を行うための関数はlmです。説明変数と被説明変数をそれぞれ、人口とごみ収集量とする回帰分析を行うには以下のように入力します。</p>  <p><font color="#ff0000">&gt; result &lt;- lm(g$ごみ収集量 ~ g$人口)</font></p>  <p>以上で変数resultに結果が代入されました。結果の要約を表示するにはsummaryという関数を利用します。</p>  <p><font color="#ff0000">&gt; summary(result)</font></p>  <p><font color="#0000ff">Call:</font></p>  <p><font color="#0000ff">lm(formula = g$ごみ収集量 ~ g$人口)</font></p>  <p><font color="#0000ff">Residuals:</font></p>  <p><font color="#0000ff">Min 1Q Median 3Q Max </font></p>  <p><font color="#0000ff">-6495 -4545 -3229 1595 18787 </font></p>  <p><font color="#0000ff">Coefficients:</font></p>  <p><font color="#0000ff">Estimate Std. Error t value Pr(&gt;|t|)</font></p>  <p><font color="#0000ff">(Intercept) 4.811e+03 3.283e+03 1.466 0.165</font></p>  <p><font color="#0000ff">g$人口 2.999e-01 1.486e-02 20.175 9.55e-12 ***</font></p>  <p><font color="#0000ff">---</font></p>  <p><font color="#0000ff">Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 </font></p>  <p><font color="#0000ff">Residual standard error: 7598 on 14 degrees of freedom</font></p>  <p><font color="#0000ff">Multiple R-Squared: 0.9667, Adjusted R-squared: 0.9644 </font></p>  <p><font color="#0000ff">F-statistic: 407 on 1 and 14 DF, p-value: 9.552e-12</font></p>  <p>まず注目すべき点は、Coefficientsの部分です。ここで、</p>  <p>Estimate ：係数</p>  <p>Std. Error ：標準誤差</p>  <p>Pr(&gt;|t|) ： P値</p>  <p>を意味します。また、</p>  <p>Residual standard error：標準誤差</p>  <p>Multiple R-Squared：決定係数</p>  <p>を表しますので、この回帰分析の結果は</p>  <p><a href="http://www.moriyasu.org/WindowsLiveWriter/76768a142613_D16E/clip_image006_2.gif"><img style="border: 0px none ;" alt="clip_image006" src="http://www.moriyasu.org/WindowsLiveWriter/76768a142613_D16E/clip_image006_thumb.gif" width="239" border="0" height="73" /></a></p>  <p>となります。</p>  <p>p値は</p>  <p>帰無仮説：「回帰係数は0である」、 対立仮説：「回帰係数は0ではない」</p>  <p>に関する仮説検定のp値を意味しています。この結果から、5%の有意水準で、「a=0」は受容され、また、「b=0」は棄却されることが分かります。いいかえれば、切片は0であるが、人口はゴミ収集量に影響を与えていると考えられます。</p>  <h4>残差を読み取る</h4>  <p> 次に残差をグラフ化してみましょう。残差はresidualsという関数で得られます。</p>  <p><font color="#ff0000">&gt; residuals(result)</font></p>  <p><font color="#0000ff">1 2 3 4 5 6 7 </font></p>  <p><font color="#0000ff">-4439.2846 7557.7275 -6494.6658 8390.2205 -3355.7699 -1035.1521 -3508.3591 </font></p>  <p><font color="#0000ff">8 9 10 11 12 13 14 </font></p>  <p><font color="#0000ff">-393.1811 -6350.8365 18786.5078 10708.8111 -2682.1678 -5864.9981 -3192.3023 </font></p>  <p><font color="#0000ff">15 16 </font></p>  <p><font color="#0000ff">-4861.1871 -3265.3622</font></p>  <p>これをグラフにしてみましょう。</p>  <p><font color="#ff0000">&gt; plot(residuals(result),xlab="データNo.",ylab="残差")</font></p>  <p>次のようなグラフが表示されます。</p>  <p><a href="http://www.moriyasu.org/WindowsLiveWriter/76768a142613_D16E/clip_image008_2.gif"><img style="border: 0px none ;" alt="clip_image008" src="http://www.moriyasu.org/WindowsLiveWriter/76768a142613_D16E/clip_image008_thumb.gif" width="240" border="0" height="240" /></a></p>  <p>もし、回帰分析がうまくいっているなら、残差の点は0を中心にまんべんなくばらついているはずです。ところが、このグラフを見ると、大きくプラスの方向へ外れている点が4点あります。この4点がどの都市に相当するのかを調べてみましょう。</p>  <p> 以下のように入力すると、グラフに十字マークが表示されます。マークをプラス方向へ外れている4点に移動させ、マウスで右クリックして下さい。そのデータに対応する都市名が表示されます。表示が終わったらグラフ左上の「stop」メニューから「stop locator」を選択して下さい。</p>  <p><font color="#ff0000">&gt; identify(residuals(result),labels=d$市)</font></p>  <p><a href="http://www.moriyasu.org/WindowsLiveWriter/76768a142613_D16E/clip_image010_2.gif"><img style="border: 0px none ;" alt="clip_image010" src="http://www.moriyasu.org/WindowsLiveWriter/76768a142613_D16E/clip_image010_thumb.gif" width="240" border="0" height="240" /></a></p>  <p>この結果から、これら4点が厚木・大和・小田原・鎌倉市であることが分かりました。これらの市は大都市または観光地です。このことから、ゴミの収集量を説明するには、単に人口だけではなく、都市の規模や、観光地があるかどうかなどを考慮しなければならないことが示唆されます。</p>  <h4>練習問題</h4>  <p>小売業に関する売上高（百億円）と従業員数（百人）のデータが</p><span class="mt-enclosure mt-enclosure-file" style="display: inline;"><a href="http://www.moriyasu.org/2008/07/15/retail.csv">retail.csv</a></span><p>に保存されています。このデータを利用して散布図を描画し、単回帰モデルを推定してみましょう。</p><div><br /></div>]]>
        
    </content>
</entry>

<entry>
    <title>例題6-4</title>
    <link rel="alternate" type="text/html" href="http://www.moriyasu.org/2008/07/64.html" />
    <id>tag:www.moriyasu.org,2008://2.184</id>

    <published>2008-07-09T08:10:27Z</published>
    <updated>2008-07-14T05:30:14Z</updated>

    <summary>表6-6のデータがtab6-6.xlsに保存されています。E列に係数ダミーを作成...</summary>
    <author>
        <name>moriyasu</name>
        <uri>http://www.moriyasu.org/</uri>
    </author>
    
        <category term="研究・教育" scheme="http://www.sixapart.com/ns/types#category" />
    
    
    <content type="html" xml:lang="ja" xml:base="http://www.moriyasu.org/">
        <![CDATA[表6-6のデータが<span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/07/09/tab6-6.xls">tab6-6.xls</a></span>に保存されています。<br /><br />E列に係数ダミーを作成します。<br /><ol><li>セル E2,に「=C2*D2」と入力します。</li><li>セル E2からE16までドラッグし、下方向へコピーします。<br /></li></ol>分析ツールの「回帰分析」のメニューで以下の項目を指定し、回帰分析を行って下さい。<ol><ol><li>入力Y範囲：B1からB16</li><li>入力X範囲：D1からD16</li><li>「ラベル」にチェック</li></ol></ol>さらに、係数ダミーを加えた重回帰モデルの推定を行って下さい。<br /><ol><ol><li>入力Y範囲：B1からB16</li><li>入力X範囲：D1からE16</li><li>「ラベル」にチェック</li></ol></ol>
2つの回帰分析結果の自由度修正済み決定係数を比較して下さい。また、各回帰係数のt値を確認し、有意に0と異なるかどうか確認して下さい。<br /><br /><br />  ]]>
        
    </content>
</entry>

<entry>
    <title>例題6-3</title>
    <link rel="alternate" type="text/html" href="http://www.moriyasu.org/2008/07/63.html" />
    <id>tag:www.moriyasu.org,2008://2.183</id>

    <published>2008-07-09T08:00:09Z</published>
    <updated>2008-07-09T08:05:04Z</updated>

    <summary>表6-5のデータがtab6-5.xlsに保存されています。分析ツールの「回帰分析...</summary>
    <author>
        <name>moriyasu</name>
        <uri>http://www.moriyasu.org/</uri>
    </author>
    
    
    <content type="html" xml:lang="ja" xml:base="http://www.moriyasu.org/">
        <![CDATA[表6-5のデータが<br /><span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/07/09/tab6-5.xls">tab6-5.xls</a></span>に保存されています。<br /><br />分析ツールの「回帰分析」のメニューで以下の項目を指定し、回帰分析を行って下さい。<ol><ol><li>入力Y範囲：A1からA16</li><li>入力X範囲：B1からG16</li><li>「ラベル」にチェック</li></ol></ol><br />]]>
        
    </content>
</entry>

<entry>
    <title>例題6-2</title>
    <link rel="alternate" type="text/html" href="http://www.moriyasu.org/2008/07/62.html" />
    <id>tag:www.moriyasu.org,2008://2.182</id>

    <published>2008-07-09T07:51:16Z</published>
    <updated>2008-07-09T07:56:51Z</updated>

    <summary>表6-2のデータがtab6-2.xlsに保存されています。E列～G列に季節ダミー...</summary>
    <author>
        <name>moriyasu</name>
        <uri>http://www.moriyasu.org/</uri>
    </author>
    
    
    <content type="html" xml:lang="ja" xml:base="http://www.moriyasu.org/">
        <![CDATA[表6-2のデータが<span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/07/09/tab6-2.xls">tab6-2.xls</a></span>に保存されています。<br /><br />E列～G列に季節ダミーを作成します。<br /><ol><li>セル E2, F2, G2 にそれぞれ「=IF(B2=1,1,0)」「=IF(B2=2,1,0)」「=IF(B2=3,1,0)」と入力します。</li><li>セル E2からG22までドラッグし、下方向へコピーします。<br /></li></ol>分析ツールの「回帰分析」のメニューで以下の項目を指定し、回帰分析を行って下さい。<ol><ol><li>入力Y範囲：C1からC22</li><li>入力X範囲：D1からD22</li><li>「ラベル」にチェック</li></ol></ol>さらに、季節ダミーを加えた重回帰モデルの推定を行って下さい。<br /><ol><ol><li>入力Y範囲：C1からC22</li><li>入力X範囲：D1からG22</li><li>「ラベル」にチェック</li></ol></ol>
2つの回帰分析結果の自由度修正済み決定係数を比較して下さい。また、各回帰係数のt値を確認し、有意に0と異なるかどうか確認して下さい。<br /><br /><br /> ]]>
        
    </content>
</entry>

<entry>
    <title>例題6-1</title>
    <link rel="alternate" type="text/html" href="http://www.moriyasu.org/2008/07/61.html" />
    <id>tag:www.moriyasu.org,2008://2.181</id>

    <published>2008-07-09T07:44:59Z</published>
    <updated>2008-07-09T07:50:50Z</updated>

    <summary>表6-1のデータがtab6-1.xlsに保存されています。作付面積を横軸に、収穫...</summary>
    <author>
        <name>moriyasu</name>
        <uri>http://www.moriyasu.org/</uri>
    </author>
    
    
    <content type="html" xml:lang="ja" xml:base="http://www.moriyasu.org/">
        <![CDATA[表6-1のデータが<span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/07/09/tab6-1.xls">tab6-1.xls</a></span>に保存されています。<br /><br /><ul><li>作付面積を横軸に、収穫量を縦軸にとる散布図を作成して下さい。<br /></li></ul>分析ツールの「回帰分析」のメニューで以下の項目を指定し、回帰分析を行って下さい。<ol><ol><li>入力Y範囲：B1からB17</li><li>入力X範囲：C1からC17</li><li>「ラベル」にチェック</li></ol></ol>さらに、一時的ダミーを加えた重回帰モデルの推定を行って下さい。<br /><ol><ol><li>入力Y範囲：B1からB17</li><li>入力X範囲：C1からD17</li><li>「ラベル」にチェック</li></ol></ol>
2つの回帰分析結果の自由度修正済み決定係数を比較して下さい。<br /><br /><br />]]>
        
    </content>
</entry>

<entry>
    <title>分散分析とノンパラメトリック検定</title>
    <link rel="alternate" type="text/html" href="http://www.moriyasu.org/2008/07/post-76.html" />
    <id>tag:www.moriyasu.org,2008://2.180</id>

    <published>2008-07-08T09:03:59Z</published>
    <updated>2008-07-08T09:08:50Z</updated>

    <summary>分散分析  ある同一の部品を製作している3つの班があります。各班の製作効率に差が...</summary>
    <author>
        <name>moriyasu</name>
        <uri>http://www.moriyasu.org/</uri>
    </author>
    
    
    <content type="html" xml:lang="ja" xml:base="http://www.moriyasu.org/">
        <![CDATA[<h3>分散分析</h3>  <p>ある同一の部品を製作している3つの班があります。各班の製作効率に差があるかどうかを検証するために、各班が1個の部品を製作するための時間を複数回測定した結果が</p><span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/07/08/anova.csv">anova.csv</a></span><p>に保存されています。</p>  <p><font color="#ff0000">&gt; time &lt;- read.csv("anova.csv")</font></p>  <p><font color="#ff0000">&gt; time</font></p>  <p><font color="#0000ff">時間 班</font></p>  <p><font color="#0000ff">1 8.82 1</font></p>  <p><font color="#0000ff">2 9.26 1</font></p>  <p><font color="#0000ff">3 8.70 1</font></p>  <p><font color="#0000ff">4 8.97 1</font></p>  <p><font color="#0000ff">5 8.64 1</font></p>  <p><font color="#0000ff">6 8.29 1</font></p>  <p><font color="#0000ff">7 9.45 1</font></p>  <p><font color="#0000ff">8 9.42 1</font></p>  <p><font color="#0000ff">9 9.25 1</font></p>  <p><font color="#0000ff">10 8.21 2</font></p>  <p><font color="#0000ff">11 6.65 2</font></p>  <p>「時間」の列は製作するためにかかった時間を、「班」の列はどの班が作ったかを表しています。</p>  <p> それでは、分散分析を行います。分散分析にはoneway.testという関数を利用します。</p>  <p><font color="#ff0000">&gt; oneway.test(time$時間 ~ time$班,var.equal=T)</font></p>  <p><font color="#0000ff">One-way analysis of means</font></p>  <p><font color="#0000ff">data: time$時間 and time$班</font></p>  <p><font color="#0000ff">F = 8.0335, num df = 2, denom df = 23, p-value = 0.002260</font></p>  <p>p-valueが0.00226&lt;0.05なので、5％の有意水準で帰無仮説を棄却します。つまり、1つの部品を製作する平均時間は3班で差があるということになります。</p>  <h3>Wilcoxonの順位和検定</h3>  <p>以下のようなアンケートを実施しました。</p>  <p>問1 あなたの国籍は何ですか （日本 ・ アメリカ）</p>  <p>問2 あなたは親に反抗しますか？</p>  <p>1. よくする 2.時々する 3.あまりしない 4.ほとんどしない</p>  <p>このアンケートの結果が <br /></p><span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/07/08/wilcoxon1.csv">wilcoxon1.csv</a></span><p>に保存されています。</p>  <p><font color="#ff0000">&gt; question1 &lt;- read.csv("wilcoxon1.csv")</font></p>  <p><font color="#ff0000">&gt; question1</font></p>  <p><font color="#0000ff">国籍 回答</font></p>  <p><font color="#0000ff">1 日本 1</font></p>  <p><font color="#0000ff">2 日本 4</font></p>  <p><font color="#0000ff">3 日本 2</font></p>  <p><font color="#0000ff">4 日本 4</font></p>  <p><font color="#0000ff">5 日本 1</font></p>  <p><font color="#0000ff">6 日本 4</font></p>  <p><font color="#0000ff">7 日本 2</font></p>  <p><font color="#0000ff">8 日本 4</font></p>  <p><font color="#0000ff">9 日本 3</font></p>  <p><font color="#0000ff">10 日本 4</font></p>  <p><font color="#0000ff">11 アメリカ 3</font></p>  <p><font color="#0000ff">12 アメリカ 1</font></p>  <p>この結果から、日米で反抗的態度に差があるかどうかをWilcoxonの順位和検定を使って検証しましょう。まず、subsetを使って、日本人とアメリカ人の回答を別々に抽出します。</p>  <p><font color="#ff0000">&gt; q1jp &lt;- subset(question1,国籍 == "日本")</font></p>  <p><font color="#ff0000">&gt; q1us &lt;- subset(question1,国籍 == "アメリカ")</font></p>  <p>準備が出来たので、検定を行います。wilcox.testという関数を利用します。</p>  <p><font color="#ff0000">&gt; wilcox.test(x=q1jp$回答,y=q1us$回答,alternative="two.sided")</font></p>  <p><font color="#0000ff">Wilcoxon rank sum test with continuity correction</font></p>  <p><font color="#0000ff">data: q1jp$回答 and q1us$回答</font></p>  <p><font color="#0000ff">W = 78.5, p-value = 0.02698</font></p>  <p><font color="#0000ff">alternative hypothesis: true mu is not equal to 0 </font></p>  <p><font color="#0000ff">Warning message: </font></p>  <p><font color="#0000ff">Cannot compute exact p-value with ties in: wilcox.test.default(x = q1jp$回答, y = q1us$回答, alternative = "two.sided") </font></p>  <p>基本的にオプションの設定の仕方はt.testと同じです。たとえば、片側検定を行いたい場合は、alternative="two.sided"の代わりに、alternative="greater"または、alternative="less"を使います。</p>  <p>p-valueを見ると、0.026&lt;0.05なので、5％の有意水準で帰無仮説が棄却されます。つまり、日米で反抗的態度（の中央値）に差があるということが分かります。</p>  <h3>&nbsp;</h3>  <h3>符号検定</h3>  <p>ある病院の入院患者を対象に以下のようなアンケートを入院直後と退院直前の2回実施しました。</p>  <p>看護師はあなたの相談を良く聞いてくれましたか？</p>  <p>1. 非常に良く聞いてくれた 2. 良く聞いてくれた 3. 普通</p>  <p>4. あまり聞いてくれなかった 5. ほとんど聞いてくれなかった</p>  <p>このアンケートの結果が <br /></p><span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/07/08/signed.csv">signed.csv</a></span><br /><p>に保存されています。</p>  <p><font color="#ff0000">&gt; q2 &lt;- read.csv("signed.csv")</font></p>  <p><font color="#ff0000">&gt; q2</font></p>  <p><font color="#0000ff">回答者番号 入院直後 退院直前</font></p>  <p><font color="#0000ff">1 1 2 2</font></p>  <p><font color="#0000ff">2 2 3 2</font></p>  <p><font color="#0000ff">3 3 3 3</font></p>  <p><font color="#0000ff">4 4 4 4</font></p>  <p><font color="#0000ff">5 5 2 2</font></p>  <p><font color="#0000ff">6 6 1 1</font></p>  <p><font color="#0000ff">7 7 2 2</font></p>  <p><font color="#0000ff">8 8 3 2</font></p>  <p><font color="#0000ff">9 9 4 3</font></p>  <p><font color="#0000ff">10 10 3 3</font></p>  <p>符号検定は以下のコマンドを入力することで実行できます。</p>  <p><font color="#ff0000">&gt; x &lt;- q2$入院直後</font></p>  <p><font color="#ff0000">&gt; y &lt;- q2$退院直前</font></p>  <p><font color="#ff0000">&gt; binom.test(c(length(x[x&gt;y]),length(x[x&lt;y])),alternative="greater")</font></p>  <p><font color="#0000ff">Exact binomial test</font></p>  <p><font color="#0000ff">data: c(length(x[x &gt; y]), length(x[x &lt; y])) </font></p>  <p><font color="#0000ff">number of successes = 5, number of trials = 7, p-value = 0.2266</font></p>  <p><font color="#0000ff">alternative hypothesis: true probability of success is greater than 0.5 </font></p>  <p><font color="#0000ff">95 percent confidence interval:</font></p>  <p><font color="#0000ff">0.3412614 1.0000000 </font></p>  <p><font color="#0000ff">sample estimates:</font></p>  <p><font color="#0000ff">probability of success </font></p>  <p><font color="#0000ff">0.7142857 </font></p>  <p>p-valueは0.22(&gt;0.05)より、5%の有意水準で帰無仮説を棄却しません。つまり、入院直後と退院直前で看護に対する印象に差がないと判断されます。「alternative="greater"」は「xがyより大きい」（この場合は入院直後の方が退院直前より大きい）という対立仮説で検定することを意味します。もし、「xよりyが大きい」という対立仮説で検定したい場合、「alternative="less"」とします。</p>  <h3>&nbsp;</h3>  <h3>Kruskal-Wallis検定</h3>  <p>以下のようなアンケートを実施しました。</p>  <p>問1 あなたの国籍は何ですか （日本 ・ 中国 ・ アメリカ）</p>  <p>問2 あなたは親に反抗しますか？</p>  <p>1. よくする 2.時々する 3.あまりしない 4.ほとんどしない</p>  <p>このアンケートの結果が </p><span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/07/08/wilcoxon3.csv">wilcoxon3.csv</a></span><p>に保存されています。</p>  <p><font color="#ff0000">&gt; question3 &lt;- read.csv("wilcoxon3.csv")</font></p>  <p>検定を行うにはkruskal.testという関数を利用します。</p>  <p><font color="#ff0000">&gt; kruskal.test(question3$回答,question3$国籍)</font></p>  <p><font color="#0000ff">Kruskal-Wallis rank sum test</font></p>  <p><font color="#0000ff">data: question3$回答 and question3$国籍</font></p>  <p><font color="#0000ff">Kruskal-Wallis chi-squared = 9.8041, df = 2, p-value = 0.007431</font></p>  <p>この結果から、5％の有意水準で帰無仮説を棄却します。つまり、各国で親に対する反抗的態度に差が見られると判断されます。</p>]]>
        
    </content>
</entry>

<entry>
    <title>平均の差の検定</title>
    <link rel="alternate" type="text/html" href="http://www.moriyasu.org/2008/06/post-75.html" />
    <id>tag:www.moriyasu.org,2008://2.178</id>

    <published>2008-06-30T13:16:48Z</published>
    <updated>2008-06-30T13:30:45Z</updated>

    <summary>母集団の平均が等しいと仮定できる場合  bigclass.csvを例にとり、男女...</summary>
    <author>
        <name>moriyasu</name>
        <uri>http://www.moriyasu.org/</uri>
    </author>
    
    
    <content type="html" xml:lang="ja" xml:base="http://www.moriyasu.org/">
        <![CDATA[<h3>母集団の平均が等しいと仮定できる場合</h3>  <p>bigclass.csvを例にとり、男女間で身長の平均に差があるかどうかを検定しましょう。まず、データを読み込みます。</p>  <p><font color="#ff0000">&gt; class &lt;- read.csv("bigclass.csv")</font></p>  <p>男子と女子のデータをclassから抽出し、それぞれclass_male, class_femaleに代入します。</p>  <p><font color="#ff0000">&gt; class_male &lt;- subset(class,性別=="M")</font></p>  <p><font color="#ff0000">&gt; class_female &lt;- subset(class,性別=="F")</font></p>  <p>class_maleの内容を表示してみます。</p>  <p><font color="#ff0000">&gt; class_male</font></p>  <p><font color="#0000ff">名前 年齢 性別 身長 体重</font></p>  <p><font color="#0000ff">6 TIM 12 M 60 84</font></p>  <p><font color="#0000ff">7 JAMES 12 M 61 128</font></p>  <p><font color="#0000ff">8 ROBERT 12 M 51 79</font></p>  <p><font color="#0000ff">12 JOHN 13 M 65 98</font></p>  <p><font color="#0000ff">13 JOE 13 M 63 105</font></p>  <p><font color="#0000ff">14 MICHAEL 13 M 58 95</font></p>  <p> 準備が出来たので、男女間の身長の差の検定を行いましょう。平均の差の検定にはt.testという関数を利用します。母集団の分散が等しいと仮定しているので、var.equal=Tをオプションとして追加します。また、ここでは両側検定を行いましょう。両側検定を行うにはalternative="two.sided"というオプションを追加します。</p>  <p><font color="#ff0000">&gt; t.test(x=class_male$身長,y=class_female$身長,var.equal=T, alternative="two.sided")</font></p>  <p><font color="#0000ff">Two Sample t-test</font></p>  <p><font color="#0000ff">data: class_male$身長 and class_female$身長</font></p>  <p><font color="#0000ff">t = 2.3687, df = 38, p-value = 0.02304</font></p>  <p><font color="#0000ff">alternative hypothesis: true difference in means is not equal to 0 </font></p>  <p><font color="#0000ff">95 percent confidence interval:</font></p>  <p><font color="#0000ff">0.4390238 5.6013802 </font></p>  <p><font color="#0000ff">sample estimates:</font></p>  <p><font color="#0000ff">mean of x mean of y </font></p>  <p><font color="#0000ff">63.90909 60.88889</font></p>  <p>p-valueに注目しましょう。0.02304なので、有意水準を5%とすると0.023&lt;0.05より、帰無仮説を棄却し、対立仮説が正しいと判断します。つまり、「男女の母集団の平均身長には差がある」と判断されます。</p>  <p> 次に、対立仮説を「男子の平均身長が女子よりも高い」とする片側検定を行いましょう。</p>  <p>今回はalternative="greater"というオプションを追加します。</p>  <p><font color="#ff0000">&gt; t.test(x=class_male$身長,y=class_female$身長,var.equal=T, alternative="greater")</font></p>  <p><font color="#0000ff">Two Sample t-test</font></p>  <p><font color="#0000ff">data: class_male$身長 and class_female$身長</font></p>  <p><font color="#0000ff">t = 2.3687, df = 38, p-value = 0.01152</font></p>  <p><font color="#0000ff">alternative hypothesis: true difference in means is greater than 0 </font></p>  <p><font color="#0000ff">95 percent confidence interval:</font></p>  <p><font color="#0000ff">0.8705471 Inf </font></p>  <p><font color="#0000ff">sample estimates:</font></p>  <p><font color="#0000ff">mean of x mean of y </font></p>  <p><font color="#0000ff">63.90909 60.88889</font></p>  <p>p-valueが0.0152なので、5％の有意水準で帰無仮説が棄却され、対立仮説が正しいと判断されます。つまり、「男子の平均身長が女子よりも高い」ということになります。</p>  <h3>母集団の分散が等しいと仮定できない場合</h3>  <span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/06/30/peanuts.csv">peanuts.csv</a></span><p>は生の落花生と、炒った落花生をそれぞれ10匹のネズミに与えたときのタンパク質の摂取量です。生の落花生といった落花生でタンパク質の平均摂取量が異なるかどうか検定します。</p>  <p><font color="#ff0000">&gt; peanuts &lt;- read.csv("peanuts.csv")</font></p>  <p><font color="#ff0000">&gt; peanuts</font></p>  <p><font color="#0000ff">生 炒り</font></p>  <p><font color="#0000ff">1 61 55</font></p>  <p><font color="#0000ff">2 60 54</font></p>  <p><font color="#0000ff">3 56 47</font></p>  <p><font color="#0000ff">4 63 59</font></p>  <p><font color="#0000ff">5 56 51</font></p>  <p><font color="#0000ff">6 63 61</font></p>  <p><font color="#0000ff">7 59 57</font></p>  <p><font color="#0000ff">8 56 54</font></p>  <p><font color="#0000ff">9 44 62</font></p>  <p><font color="#0000ff">10 61 58</font></p>  <p> 仮説検定にはt.testを利用しますが、今回はvar.equal=Fというオプションを追加します。</p>  <p><font color="#ff0000">&gt; t.test(x=peanuts$生,y=peanuts$炒り,var.equal=F, alternative="two.sided")</font></p>  <p><font color="#0000ff">Welch Two Sample t-test</font></p>  <p><font color="#0000ff">data: peanuts$生 and peanuts$炒り</font></p>  <p><font color="#0000ff">t = 0.9185, df = 17.347, p-value = 0.371</font></p>  <p><font color="#0000ff">alternative hypothesis: true difference in means is not equal to 0 </font></p>  <p><font color="#0000ff">95 percent confidence interval:</font></p>  <p><font color="#0000ff">-2.716617 6.916617 </font></p>  <p><font color="#0000ff">sample estimates:</font></p>  <p><font color="#0000ff">mean of x mean of y </font></p>  <p><font color="#0000ff">57.9 55.8</font></p>  <p>p-valueが0.371なので、有意水準を5%とすると、0.371&gt;0.05より、帰無仮説を棄却できません。つまり、生の落花生と、炒った落花生でも、ネズミが摂取するタンパク質の平均に差はないと判断されます。帰無仮説を「生の落花生の方がタンパク質摂取量の平均値が大きい」とする片側検定は次のようになります。</p>  <p><font color="#ff0000">&gt; t.test(x=peanuts$生,y=peanuts$炒り,var.equal=F, alternative="greater")</font></p>  <p><font color="#0000ff">Welch Two Sample t-test</font></p>  <p><font color="#0000ff">data: peanuts$生 and peanuts$炒り</font></p>  <p><font color="#0000ff">t = 0.9185, df = 17.347, p-value = 0.1855</font></p>  <p><font color="#0000ff">alternative hypothesis: true difference in means is greater than 0 </font></p>  <p><font color="#0000ff">95 percent confidence interval:</font></p>  <p><font color="#0000ff">-1.872925 Inf </font></p>  <p><font color="#0000ff">sample estimates:</font></p>  <p><font color="#0000ff">mean of x mean of y </font></p>  <p><font color="#0000ff">57.9 55.8</font></p>  <p> この結果から、有意水準を5％とするならば、片側検定と同じ結果になることが分かります。</p>  <h4>2つの標本に対応がある場合</h4>  <p>10人の被験者の体温を電子式体温計と水銀式体温計で測った結果が</p><span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/06/30/temperature.csv">temperature.csv</a></span><p>に保存されています。</p>  <p><font color="#ff0000">&gt; temp &lt;- read.csv("temperature.csv")</font></p>  <p><font color="#ff0000">&gt; temp</font></p>  <p><font color="#0000ff">電子式 水銀式</font></p>  <p><font color="#0000ff">1 37.21 37.02</font></p>  <p><font color="#0000ff">2 37.12 36.88</font></p>  <p><font color="#0000ff">3 37.04 37.19</font></p>  <p><font color="#0000ff">4 37.45 37.27</font></p>  <p><font color="#0000ff">5 36.93 36.83</font></p>  <p><font color="#0000ff">6 36.96 36.96</font></p>  <p><font color="#0000ff">7 37.23 36.92</font></p>  <p><font color="#0000ff">8 37.15 37.23</font></p>  <p><font color="#0000ff">9 37.22 37.02</font></p>  <p><font color="#0000ff">10 37.05 36.78</font></p>  <p> これは対応のあるデータなので、t.testにpaired=Tというオプションを付加します。</p>  <p><font color="#ff0000">&gt; t.test(x=temp$電子式,y=temp$水銀式, paired=T,alternative="two.sided")</font></p>  <p><font color="#0000ff">Paired t-test</font></p>  <p><font color="#0000ff">data: temp$電子式 and temp$水銀式</font></p>  <p><font color="#0000ff">t = 2.5765, df = 9, p-value = 0.02987</font></p>  <p><font color="#0000ff">alternative hypothesis: true difference in means is not equal to 0 </font></p>  <p><font color="#0000ff">95 percent confidence interval:</font></p>  <p><font color="#0000ff">0.01537252 0.23662748 </font></p>  <p><font color="#0000ff">sample estimates:</font></p>  <p><font color="#0000ff">mean of the differences </font></p>  <p><font color="#0000ff">0.126</font></p>  <p>p-valueから、5％の有意水準で帰無仮説「2つの種類の体温計で測った体温の平均値に差がない」が棄却され、「平均値に差がある」と判断されます。</p>  <p> 片側検定も同様に行えます。</p>  <p><font color="#ff0000">&gt; t.test(x=temp$電子式,y=temp$水銀式, paired=T,alternative="greater")</font></p>  <p><font color="#0000ff">Paired t-test</font></p>  <p><font color="#0000ff">data: temp$電子式 and temp$水銀式</font></p>  <p><font color="#0000ff">t = 2.5765, df = 9, p-value = 0.01493</font></p>  <p><font color="#0000ff">alternative hypothesis: true difference in means is greater than 0 </font></p>  <p><font color="#0000ff">95 percent confidence interval:</font></p>  <p><font color="#0000ff">0.0363543 Inf </font></p>  <p><font color="#0000ff">sample estimates:</font></p>  <p><font color="#0000ff">mean of the differences </font></p>  <p><font color="#0000ff">0.126</font></p>  <h4>練習問題</h4>  <span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/06/30/restaurant.csv">restaurant.csv</a></span><p>1. ある地域には2つのレストランがある。ある1年間の営業日の中から無作為に12日を選び、両レストランの売り上げを記録したデータが</p><p>である。このデータから両レストランの平均売上に差があるといえるか検定しなさい。</p>  <p>2. 東京電力と東芝の1959年1月から2001年12月までの月間株価収益率が、</p><span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/06/30/stockreturn.csv">stockreturn.csv</a></span><p>に保存されている。このデータをつかって、2つの銘柄の収益率の平均に差があるかどうかを有意水準5％で検定しなさい。</p><div><br /></div>]]>
        
    </content>
</entry>

<entry>
    <title>クロス集計表とモザイク図の作成、独立性の検定</title>
    <link rel="alternate" type="text/html" href="http://www.moriyasu.org/2008/06/post-74.html" />
    <id>tag:www.moriyasu.org,2008://2.177</id>

    <published>2008-06-17T10:12:07Z</published>
    <updated>2008-06-17T10:17:55Z</updated>

    <summary>クロス集計表の作成  carsurvey.csvはアメリカの消費者から無作為に3...</summary>
    <author>
        <name>moriyasu</name>
        <uri>http://www.moriyasu.org/</uri>
    </author>
    
    
    <content type="html" xml:lang="ja" xml:base="http://www.moriyasu.org/">
        <![CDATA[<h3>クロス集計表の作成</h3>  <span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/06/17/carsurvey.csv">carsurvey.csv</a>はアメリカの消費者から無作為に303名を選び、その消費者と所有車の属性をアンケート調査した結果です。このデータから、モザイク図とクロス集計表を作成してみましょう。</span>  <p>まず、データをRに読み込みます。</p>  <p><font color="#ff0000">&gt; car &lt;- read.csv("carsurvey.csv")</font></p>  <p>データの中身を確認してみましょう。</p>  <p><font color="#ff0000">&gt; car</font></p>  <p><font color="#0000ff">性別 既未婚 年齢 生産国 サイズ タイプ</font></p>  <p><font color="#0000ff">1 男性 既婚 34 米国 大型 ファミリー</font></p>  <p><font color="#0000ff">2 男性 未婚 36 日本 小型 スポーツ</font></p>  <p><font color="#0000ff">3 男性 既婚 23 日本 小型 ファミリー</font></p>  <p><font color="#0000ff">4 男性 未婚 29 米国 大型 ファミリー</font></p>  <p>このデータから、既婚者・未婚者で車の好みが異なるかどうかを検証してみましょう。つまり、「既未婚」の列と、「タイプ」の列を使ってクロス集計表とモザイク図を作成します。</p>  <p> クロス集計表を作成するにはtableという関数を利用します。</p>  <p><font color="#ff0000">&gt; marital_cartype &lt;- table(car$既未婚,car$タイプ)</font></p>  <p> 代入した変数の中身を確認すると、クロス集計表が表示されます。</p>  <p><font color="#ff0000">&gt; marital_cartype</font></p>  <p><font color="#0000ff">スポーツ ファミリー ワーク</font></p>  <p><font color="#0000ff">既婚 45 119 32</font></p>  <p><font color="#0000ff">未婚 55 36 16</font></p>  <p>&nbsp;</p>  <h4>モザイク図の作成</h4>  <p> 次にこのクロス集計表からモザイク図を作成します。Mosaicplotという関数を利用します。</p>  <p><font color="#ff0000">&gt; mosaicplot(marital_cartype,main="既未婚と車の種類")</font></p>  <p><a href="http://www.moriyasu.org/WindowsLiveWriter/9d1c619ea452_10DEB/clip_image002%5B4%5D.gif"><img style="border: 0px none ;" alt="clip_image002[4]" src="http://www.moriyasu.org/WindowsLiveWriter/9d1c619ea452_10DEB/clip_image002%5B4%5D_thumb.gif" border="0" height="240" width="240" /></a></p>  <h4>&nbsp;</h4>  <h4>独立性の仮説検定</h4>  <p> 結婚の有無と車の選好が独立（無関係）かどうかを仮説検定しましょう。帰無仮説と対立仮説はそれぞれ、</p>  <p>帰無仮説：結婚の有無と車の選好が独立。</p>  <p>帰無仮説：結婚の有無と車の選好が独立ではない。</p>  <p>です。</p>  <p><font color="#ff0000">&gt; chisq.test(marital_cartype)</font></p>  <p><font color="#0000ff">Pearson's Chi-squared test</font></p>  <p><font color="#0000ff">data: marital_cartype </font></p>  <p><font color="#0000ff">X-squared = 26.9629, df = 2, p-value = 1.397e-06</font></p>  <p>ここで注意しなければならないところは「p-value」です。この値が有意水準よりも小さければ帰無仮説が棄却されます。もし有意水準を一般的な5%にすると1.397e-06&lt;0.05より、帰無仮説が棄却されます(1.397e-06は<a href="http://www.moriyasu.org/WindowsLiveWriter/9d1c619ea452_10DEB/clip_image004%5B4%5D.gif"><img style="border: 0px none ;" alt="clip_image004[4]" src="http://www.moriyasu.org/WindowsLiveWriter/9d1c619ea452_10DEB/clip_image004%5B4%5D_thumb.gif" border="0" height="21" width="179" /></a>を意味します)。つまり結婚の有無と車の選好は独立ではないと考えられます。</p>  <p> 「X-squared」と「df」はそれぞれ検定統計値と自由度を表します。これらも仮説検定では重要な情報ですが、今回はこれには触れません。</p>  <h4>&nbsp;</h4>  <h4>練習問題</h4>  <p> 「生産国」と「サイズ」、「既未婚」と「サイズ」についてもそれぞれ独立性の検定を行って下さい。</p>]]>
        
    </content>
</entry>

<entry>
    <title>例題5-5</title>
    <link rel="alternate" type="text/html" href="http://www.moriyasu.org/2008/06/55.html" />
    <id>tag:www.moriyasu.org,2008://2.176</id>

    <published>2008-06-11T06:57:04Z</published>
    <updated>2008-06-11T07:19:24Z</updated>

    <summary>表5-8のデータがtab5-8.xlsに保存されています。このデータを使って、1...</summary>
    <author>
        <name>moriyasu</name>
        <uri>http://www.moriyasu.org/</uri>
    </author>
    
    
    <content type="html" xml:lang="ja" xml:base="http://www.moriyasu.org/">
        <![CDATA[表5-8のデータが<a href="http://www.moriyasu.org/2008/06/11/tab5-8.xls">tab5-8.xls</a>に保存されています。このデータを使って、1996年以前と97年以降で通信支出と国内家計最終消費支出の間に構造変化が生じたかF検定を行います。<br /><br />分析ツールの「回帰分析」を使って、3回回帰分析を行います。<br /><ol><li>前期（1990年～96年まで）<br /></li></ol><ol><ol><li>入力Y範囲：B1からB8</li><li>入力X範囲：C1からC8</li><li>一覧の出力先：A18</li><li>「ラベル」にチェック</li></ol></ol>&nbsp;&nbsp;&nbsp; 残差2乗和は分散分析表の「残差」と「変動」が交差するセルに出力されます。<br /><br />2. 後期（98年～2004年）<br /><ol><ol><li>入力Y範囲：B9からB16</li><li>入力X範囲：C9からC16</li><li>一覧の出力先：A37</li><li>「ラベル」に<b>チェックしない</b></li></ol></ol>
3. 全期間<br /><ol><ol><li>入力Y範囲：B1からB16</li><li>入力X範囲：C1からC16</li><li>一覧の出力先：A56</li><li>「ラベル」にチェック</li></ol></ol><br />F値をセルA76に計算します。<br />「=(C68-(C30+C49))/(C30+C49)*(7+8-2*(1+1))/(1+1)」をセルA76に入力します。<br /><br />
<br /> ]]>
        
    </content>
</entry>

<entry>
    <title>例題5-4</title>
    <link rel="alternate" type="text/html" href="http://www.moriyasu.org/2008/06/54.html" />
    <id>tag:www.moriyasu.org,2008://2.175</id>

    <published>2008-06-11T05:01:05Z</published>
    <updated>2008-06-11T11:05:24Z</updated>

    <summary>表5-7のデータがtab5-7.xlsに保存されています。分析ツールの「回帰分析...</summary>
    <author>
        <name>moriyasu</name>
        <uri>http://www.moriyasu.org/</uri>
    </author>
    
    
    <content type="html" xml:lang="ja" xml:base="http://www.moriyasu.org/">
        <![CDATA[表5-7のデータが<a href="http://www.moriyasu.org/2008/06/11/tab5-7.xls">tab5-7.xls</a>に保存されています。<br /><br />分析ツールの「回帰分析」のメニューで以下の設定をし、回帰分析を行って下さい。<ol><ol><li>入力Y範囲：B1からB11</li><li>入力X範囲：C1からD11</li><li>「ラベル」にチェック</li></ol></ol>回帰係数のF検定に関するF値は、分散分析表中の「観測された分散比」の下の数値です。<br /><br /><table style="border-collapse: collapse; width: 54pt;" border="0" cellpadding="0" cellspacing="0" width="72"><col style="width: 54pt;" width="72"><col>
  <tbody></tbody><tbody><tr style="height: 13.5pt;" height="18"></tr></tbody></table> ]]>
        
    </content>
</entry>

<entry>
    <title>例題5-3</title>
    <link rel="alternate" type="text/html" href="http://www.moriyasu.org/2008/06/53.html" />
    <id>tag:www.moriyasu.org,2008://2.174</id>

    <published>2008-06-11T04:37:38Z</published>
    <updated>2008-06-11T04:55:35Z</updated>

    <summary>表5-4のデータがtab5-4.xlsに保存されています。分析ツールの「回帰分析...</summary>
    <author>
        <name>moriyasu</name>
        <uri>http://www.moriyasu.org/</uri>
    </author>
    
    
    <content type="html" xml:lang="ja" xml:base="http://www.moriyasu.org/">
        <![CDATA[表5-4のデータが<a href="http://www.moriyasu.org/2008/06/11/tab5-4.xls">tab5-4.xls</a>に保存されています。<br /><br />分析ツールの「回帰分析」のメニューで以下の項目を指定し、回帰分析を行って下さい。<ol><ol><li>入力Y範囲：C1からC16</li><li>入力X範囲：B1からB16</li><li>「ラベル」にチェック</li></ol></ol><br /><ul><li>残差の標準誤差は、「回帰統計」中の「標準誤差」に表示されています。</li><li>回帰係数の標準誤差は「切片」および「GDP]と、「標準誤差」が交差するセルに表示されています。</li><li>ｔ値は「切片」および「GDP]と、「ｔ」が交差するセルに表示されています。</li></ul><br /><br /> ]]>
        
    </content>
</entry>

<entry>
    <title>例題4-6</title>
    <link rel="alternate" type="text/html" href="http://www.moriyasu.org/2008/06/46.html" />
    <id>tag:www.moriyasu.org,2008://2.173</id>

    <published>2008-06-11T04:30:28Z</published>
    <updated>2008-06-11T10:13:17Z</updated>

    <summary>表4-4のデータがtab4-4.xlsに保存されています。このデータを使って、出...</summary>
    <author>
        <name>moriyasu</name>
        <uri>http://www.moriyasu.org/</uri>
    </author>
    
    
    <content type="html" xml:lang="ja" xml:base="http://www.moriyasu.org/">
        <![CDATA[表4-4のデータが<a href="http://www.moriyasu.org/2008/06/11/tab4-4.xls">tab4-4.xls</a>に保存されています。このデータを使って、出生児平均余命を被説明変数とする回帰分析を行います。<br /><br /><ol><li>分析ツールの「回帰分析」のメニューで以下の設定をした回帰分析を行って下さい。</li><ol><li>入力Y範囲：B1からB18</li><li>入力X範囲：C1からD18</li><li>「ラベル」にチェック</li></ol><li>さらに、以下の設定をした回帰分析を行って下さい。</li><ol><li>入力Y範囲：B1からB18</li><li>入力X範囲：C1からE18</li><li>「ラベル」にチェック</li></ol></ol>2つの回帰分析結果の自由度修正済み決定係数を比較して下さい。<br /><br />]]>
        
    </content>
</entry>

<entry>
    <title>例題4-7</title>
    <link rel="alternate" type="text/html" href="http://www.moriyasu.org/2008/06/47.html" />
    <id>tag:www.moriyasu.org,2008://2.172</id>

    <published>2008-06-11T04:19:53Z</published>
    <updated>2008-06-11T04:27:48Z</updated>

    <summary>表4-5のデータがtab4-5.xlsに保存されています。年齢を横軸に、給与額を...</summary>
    <author>
        <name>moriyasu</name>
        <uri>http://www.moriyasu.org/</uri>
    </author>
    
    
    <content type="html" xml:lang="ja" xml:base="http://www.moriyasu.org/">
        <![CDATA[表4-5のデータが<a href="http://www.moriyasu.org/2008/06/11/tab4-5.xls">tab4-5.xls</a>に保存されています。<br /><br /><ol><li>年齢を横軸に、給与額を縦軸にとる散布図を描いてください。</li><li>給与額を被説明変数、給与額とその2乗値を説明変数にする回帰分析を行います。</li><ol><li>セルC2に「=B2^2」と入力し、C13まで下方向にコピーします。</li><li>分析ツールの「回帰分析」を利用し、</li><ol><li>入力Y範囲：A1からA13</li><li>入力X範囲：B1からC13</li><li>「ラベル」にチェック</li></ol></ol></ol><br />]]>
        
    </content>
</entry>

</feed>
