<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0">
    <channel>
        <title>森保研究室</title>
        <link>http://www.moriyasu.org/</link>
        <description>長崎大学経済学部准教授 森保洋 のウェブサイトです。</description>
        <language>ja</language>
        <copyright>Copyright 2008</copyright>
        <lastBuildDate>Wed, 09 Jul 2008 17:10:27 +0900</lastBuildDate>
        <generator>http://www.sixapart.com/movabletype/</generator>
        <docs>http://www.rssboard.org/rss-specification</docs>
        
        <item>
            <title>例題6-4</title>
            <description><![CDATA[表6-6のデータが<span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/07/09/tab6-6.xls">tab6-6.xls</a></span>に保存されています。<br /><br />E列に係数ダミーを作成します。<br /><ol><li>セル E2,に「=C2*D2」と入力します。</li><li>セル E2からE16までドラッグし、下方向へコピーします。<br /></li></ol>分析ツールの「回帰分析」のメニューで以下の項目を指定し、回帰分析を行って下さい。<ol><ol><li>入力Y範囲：B1からB16</li><li>入力X範囲：D1からD16</li><li>「ラベル」にチェック</li></ol></ol>さらに、係数ダミーを加えた重回帰モデルの推定を行って下さい。<br /><ol><ol><li>入力Y範囲：B1からB16</li><li>入力X範囲：D1からE16</li><li>「ラベル」にチェック</li></ol></ol>
2つの回帰分析結果の自由度修正済み決定係数を比較して下さい。また、各回帰係数のt値を確認し、有意に0と異なるかどうか確認して下さい。<br /><br /><br />  ]]></description>
            <link>http://www.moriyasu.org/2008/07/64.html</link>
            <guid>http://www.moriyasu.org/2008/07/64.html</guid>
            
            
            <pubDate>Wed, 09 Jul 2008 17:10:27 +0900</pubDate>
        </item>
        
        <item>
            <title>例題6-3</title>
            <description><![CDATA[表6-5のデータが<br /><span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/07/09/tab6-5.xls">tab6-5.xls</a></span>に保存されています。<br /><br />分析ツールの「回帰分析」のメニューで以下の項目を指定し、回帰分析を行って下さい。<ol><ol><li>入力Y範囲：A1からA16</li><li>入力X範囲：B1からG16</li><li>「ラベル」にチェック</li></ol></ol><br />]]></description>
            <link>http://www.moriyasu.org/2008/07/63.html</link>
            <guid>http://www.moriyasu.org/2008/07/63.html</guid>
            
            
            <pubDate>Wed, 09 Jul 2008 17:00:09 +0900</pubDate>
        </item>
        
        <item>
            <title>例題6-2</title>
            <description><![CDATA[表6-2のデータが<span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/07/09/tab6-2.xls">tab6-2.xls</a></span>に保存されています。<br /><br />E列～G列に季節ダミーを作成します。<br /><ol><li>セル E2, F2, G2 にそれぞれ「=IF(B2=1,1,0)」「=IF(B2=2,1,0)」「=IF(B2=3,1,0)」と入力します。</li><li>セル E2からG22までドラッグし、下方向へコピーします。<br /></li></ol>分析ツールの「回帰分析」のメニューで以下の項目を指定し、回帰分析を行って下さい。<ol><ol><li>入力Y範囲：C1からC22</li><li>入力X範囲：D1からD22</li><li>「ラベル」にチェック</li></ol></ol>さらに、季節ダミーを加えた重回帰モデルの推定を行って下さい。<br /><ol><ol><li>入力Y範囲：C1からC22</li><li>入力X範囲：D1からG22</li><li>「ラベル」にチェック</li></ol></ol>
2つの回帰分析結果の自由度修正済み決定係数を比較して下さい。また、各回帰係数のt値を確認し、有意に0と異なるかどうか確認して下さい。<br /><br /><br /> ]]></description>
            <link>http://www.moriyasu.org/2008/07/62.html</link>
            <guid>http://www.moriyasu.org/2008/07/62.html</guid>
            
            
            <pubDate>Wed, 09 Jul 2008 16:51:16 +0900</pubDate>
        </item>
        
        <item>
            <title>例題6-1</title>
            <description><![CDATA[表6-1のデータが<span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/07/09/tab6-1.xls">tab6-1.xls</a></span>に保存されています。<br /><br /><ul><li>作付面積を横軸に、収穫量を縦軸にとる散布図を作成して下さい。<br /></li></ul>分析ツールの「回帰分析」のメニューで以下の項目を指定し、回帰分析を行って下さい。<ol><ol><li>入力Y範囲：B1からB17</li><li>入力X範囲：C1からC17</li><li>「ラベル」にチェック</li></ol></ol>さらに、一時的ダミーを加えた重回帰モデルの推定を行って下さい。<br /><ol><ol><li>入力Y範囲：B1からB17</li><li>入力X範囲：C1からD17</li><li>「ラベル」にチェック</li></ol></ol>
2つの回帰分析結果の自由度修正済み決定係数を比較して下さい。<br /><br /><br />]]></description>
            <link>http://www.moriyasu.org/2008/07/61.html</link>
            <guid>http://www.moriyasu.org/2008/07/61.html</guid>
            
            
            <pubDate>Wed, 09 Jul 2008 16:44:59 +0900</pubDate>
        </item>
        
        <item>
            <title>分散分析とノンパラメトリック検定</title>
            <description><![CDATA[<h3>分散分析</h3>  <p>ある同一の部品を製作している3つの班があります。各班の製作効率に差があるかどうかを検証するために、各班が1個の部品を製作するための時間を複数回測定した結果が</p><span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/07/08/anova.csv">anova.csv</a></span><p>に保存されています。</p>  <p><font color="#ff0000">&gt; time &lt;- read.csv("anova.csv")</font></p>  <p><font color="#ff0000">&gt; time</font></p>  <p><font color="#0000ff">時間 班</font></p>  <p><font color="#0000ff">1 8.82 1</font></p>  <p><font color="#0000ff">2 9.26 1</font></p>  <p><font color="#0000ff">3 8.70 1</font></p>  <p><font color="#0000ff">4 8.97 1</font></p>  <p><font color="#0000ff">5 8.64 1</font></p>  <p><font color="#0000ff">6 8.29 1</font></p>  <p><font color="#0000ff">7 9.45 1</font></p>  <p><font color="#0000ff">8 9.42 1</font></p>  <p><font color="#0000ff">9 9.25 1</font></p>  <p><font color="#0000ff">10 8.21 2</font></p>  <p><font color="#0000ff">11 6.65 2</font></p>  <p>「時間」の列は製作するためにかかった時間を、「班」の列はどの班が作ったかを表しています。</p>  <p> それでは、分散分析を行います。分散分析にはoneway.testという関数を利用します。</p>  <p><font color="#ff0000">&gt; oneway.test(time$時間 ~ time$班,var.equal=T)</font></p>  <p><font color="#0000ff">One-way analysis of means</font></p>  <p><font color="#0000ff">data: time$時間 and time$班</font></p>  <p><font color="#0000ff">F = 8.0335, num df = 2, denom df = 23, p-value = 0.002260</font></p>  <p>p-valueが0.00226&lt;0.05なので、5％の有意水準で帰無仮説を棄却します。つまり、1つの部品を製作する平均時間は3班で差があるということになります。</p>  <h3>Wilcoxonの順位和検定</h3>  <p>以下のようなアンケートを実施しました。</p>  <p>問1 あなたの国籍は何ですか （日本 ・ アメリカ）</p>  <p>問2 あなたは親に反抗しますか？</p>  <p>1. よくする 2.時々する 3.あまりしない 4.ほとんどしない</p>  <p>このアンケートの結果が <br /></p><span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/07/08/wilcoxon1.csv">wilcoxon1.csv</a></span><p>に保存されています。</p>  <p><font color="#ff0000">&gt; question1 &lt;- read.csv("wilcoxon1.csv")</font></p>  <p><font color="#ff0000">&gt; question1</font></p>  <p><font color="#0000ff">国籍 回答</font></p>  <p><font color="#0000ff">1 日本 1</font></p>  <p><font color="#0000ff">2 日本 4</font></p>  <p><font color="#0000ff">3 日本 2</font></p>  <p><font color="#0000ff">4 日本 4</font></p>  <p><font color="#0000ff">5 日本 1</font></p>  <p><font color="#0000ff">6 日本 4</font></p>  <p><font color="#0000ff">7 日本 2</font></p>  <p><font color="#0000ff">8 日本 4</font></p>  <p><font color="#0000ff">9 日本 3</font></p>  <p><font color="#0000ff">10 日本 4</font></p>  <p><font color="#0000ff">11 アメリカ 3</font></p>  <p><font color="#0000ff">12 アメリカ 1</font></p>  <p>この結果から、日米で反抗的態度に差があるかどうかをWilcoxonの順位和検定を使って検証しましょう。まず、subsetを使って、日本人とアメリカ人の回答を別々に抽出します。</p>  <p><font color="#ff0000">&gt; q1jp &lt;- subset(question1,国籍 == "日本")</font></p>  <p><font color="#ff0000">&gt; q1us &lt;- subset(question1,国籍 == "アメリカ")</font></p>  <p>準備が出来たので、検定を行います。wilcox.testという関数を利用します。</p>  <p><font color="#ff0000">&gt; wilcox.test(x=q1jp$回答,y=q1us$回答,alternative="two.sided")</font></p>  <p><font color="#0000ff">Wilcoxon rank sum test with continuity correction</font></p>  <p><font color="#0000ff">data: q1jp$回答 and q1us$回答</font></p>  <p><font color="#0000ff">W = 78.5, p-value = 0.02698</font></p>  <p><font color="#0000ff">alternative hypothesis: true mu is not equal to 0 </font></p>  <p><font color="#0000ff">Warning message: </font></p>  <p><font color="#0000ff">Cannot compute exact p-value with ties in: wilcox.test.default(x = q1jp$回答, y = q1us$回答, alternative = "two.sided") </font></p>  <p>基本的にオプションの設定の仕方はt.testと同じです。たとえば、片側検定を行いたい場合は、alternative="two.sided"の代わりに、alternative="greater"または、alternative="less"を使います。</p>  <p>p-valueを見ると、0.026&lt;0.05なので、5％の有意水準で帰無仮説が棄却されます。つまり、日米で反抗的態度（の中央値）に差があるということが分かります。</p>  <h3>&nbsp;</h3>  <h3>符号検定</h3>  <p>ある病院の入院患者を対象に以下のようなアンケートを入院直後と退院直前の2回実施しました。</p>  <p>看護師はあなたの相談を良く聞いてくれましたか？</p>  <p>1. 非常に良く聞いてくれた 2. 良く聞いてくれた 3. 普通</p>  <p>4. あまり聞いてくれなかった 5. ほとんど聞いてくれなかった</p>  <p>このアンケートの結果が <br /></p><span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/07/08/signed.csv">signed.csv</a></span><br /><p>に保存されています。</p>  <p><font color="#ff0000">&gt; q2 &lt;- read.csv("signed.csv")</font></p>  <p><font color="#ff0000">&gt; q2</font></p>  <p><font color="#0000ff">回答者番号 入院直後 退院直前</font></p>  <p><font color="#0000ff">1 1 2 2</font></p>  <p><font color="#0000ff">2 2 3 2</font></p>  <p><font color="#0000ff">3 3 3 3</font></p>  <p><font color="#0000ff">4 4 4 4</font></p>  <p><font color="#0000ff">5 5 2 2</font></p>  <p><font color="#0000ff">6 6 1 1</font></p>  <p><font color="#0000ff">7 7 2 2</font></p>  <p><font color="#0000ff">8 8 3 2</font></p>  <p><font color="#0000ff">9 9 4 3</font></p>  <p><font color="#0000ff">10 10 3 3</font></p>  <p>符号検定は以下のコマンドを入力することで実行できます。</p>  <p><font color="#ff0000">&gt; x &lt;- q2$入院直後</font></p>  <p><font color="#ff0000">&gt; y &lt;- q2$退院直前</font></p>  <p><font color="#ff0000">&gt; binom.test(c(length(x[x&gt;y]),length(x[x&lt;y])),alternative="greater")</font></p>  <p><font color="#0000ff">Exact binomial test</font></p>  <p><font color="#0000ff">data: c(length(x[x &gt; y]), length(x[x &lt; y])) </font></p>  <p><font color="#0000ff">number of successes = 5, number of trials = 7, p-value = 0.2266</font></p>  <p><font color="#0000ff">alternative hypothesis: true probability of success is greater than 0.5 </font></p>  <p><font color="#0000ff">95 percent confidence interval:</font></p>  <p><font color="#0000ff">0.3412614 1.0000000 </font></p>  <p><font color="#0000ff">sample estimates:</font></p>  <p><font color="#0000ff">probability of success </font></p>  <p><font color="#0000ff">0.7142857 </font></p>  <p>p-valueは0.22(&gt;0.05)より、5%の有意水準で帰無仮説を棄却しません。つまり、入院直後と退院直前で看護に対する印象に差がないと判断されます。「alternative="greater"」は「xがyより大きい」（この場合は入院直後の方が退院直前より大きい）という対立仮説で検定することを意味します。もし、「xよりyが大きい」という対立仮説で検定したい場合、「alternative="less"」とします。</p>  <h3>&nbsp;</h3>  <h3>Kruskal-Wallis検定</h3>  <p>以下のようなアンケートを実施しました。</p>  <p>問1 あなたの国籍は何ですか （日本 ・ 中国 ・ アメリカ）</p>  <p>問2 あなたは親に反抗しますか？</p>  <p>1. よくする 2.時々する 3.あまりしない 4.ほとんどしない</p>  <p>このアンケートの結果が </p><span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/07/08/wilcoxon3.csv">wilcoxon3.csv</a></span><p>に保存されています。</p>  <p><font color="#ff0000">&gt; question3 &lt;- read.csv("wilcoxon3.csv")</font></p>  <p>検定を行うにはkruskal.testという関数を利用します。</p>  <p><font color="#ff0000">&gt; kruskal.test(question3$回答,question3$国籍)</font></p>  <p><font color="#0000ff">Kruskal-Wallis rank sum test</font></p>  <p><font color="#0000ff">data: question3$回答 and question3$国籍</font></p>  <p><font color="#0000ff">Kruskal-Wallis chi-squared = 9.8041, df = 2, p-value = 0.007431</font></p>  <p>この結果から、5％の有意水準で帰無仮説を棄却します。つまり、各国で親に対する反抗的態度に差が見られると判断されます。</p>]]></description>
            <link>http://www.moriyasu.org/2008/07/post_76.html</link>
            <guid>http://www.moriyasu.org/2008/07/post_76.html</guid>
            
            
            <pubDate>Tue, 08 Jul 2008 18:03:59 +0900</pubDate>
        </item>
        
        <item>
            <title>平均の差の検定</title>
            <description><![CDATA[<h3>母集団の平均が等しいと仮定できる場合</h3>  <p>bigclass.csvを例にとり、男女間で身長の平均に差があるかどうかを検定しましょう。まず、データを読み込みます。</p>  <p><font color="#ff0000">&gt; class &lt;- read.csv("bigclass.csv")</font></p>  <p>男子と女子のデータをclassから抽出し、それぞれclass_male, class_femaleに代入します。</p>  <p><font color="#ff0000">&gt; class_male &lt;- subset(class,性別=="M")</font></p>  <p><font color="#ff0000">&gt; class_female &lt;- subset(class,性別=="F")</font></p>  <p>class_maleの内容を表示してみます。</p>  <p><font color="#ff0000">&gt; class_male</font></p>  <p><font color="#0000ff">名前 年齢 性別 身長 体重</font></p>  <p><font color="#0000ff">6 TIM 12 M 60 84</font></p>  <p><font color="#0000ff">7 JAMES 12 M 61 128</font></p>  <p><font color="#0000ff">8 ROBERT 12 M 51 79</font></p>  <p><font color="#0000ff">12 JOHN 13 M 65 98</font></p>  <p><font color="#0000ff">13 JOE 13 M 63 105</font></p>  <p><font color="#0000ff">14 MICHAEL 13 M 58 95</font></p>  <p> 準備が出来たので、男女間の身長の差の検定を行いましょう。平均の差の検定にはt.testという関数を利用します。母集団の分散が等しいと仮定しているので、var.equal=Tをオプションとして追加します。また、ここでは両側検定を行いましょう。両側検定を行うにはalternative="two.sided"というオプションを追加します。</p>  <p><font color="#ff0000">&gt; t.test(x=class_male$身長,y=class_female$身長,var.equal=T, alternative="two.sided")</font></p>  <p><font color="#0000ff">Two Sample t-test</font></p>  <p><font color="#0000ff">data: class_male$身長 and class_female$身長</font></p>  <p><font color="#0000ff">t = 2.3687, df = 38, p-value = 0.02304</font></p>  <p><font color="#0000ff">alternative hypothesis: true difference in means is not equal to 0 </font></p>  <p><font color="#0000ff">95 percent confidence interval:</font></p>  <p><font color="#0000ff">0.4390238 5.6013802 </font></p>  <p><font color="#0000ff">sample estimates:</font></p>  <p><font color="#0000ff">mean of x mean of y </font></p>  <p><font color="#0000ff">63.90909 60.88889</font></p>  <p>p-valueに注目しましょう。0.02304なので、有意水準を5%とすると0.023&lt;0.05より、帰無仮説を棄却し、対立仮説が正しいと判断します。つまり、「男女の母集団の平均身長には差がある」と判断されます。</p>  <p> 次に、対立仮説を「男子の平均身長が女子よりも高い」とする片側検定を行いましょう。</p>  <p>今回はalternative="greater"というオプションを追加します。</p>  <p><font color="#ff0000">&gt; t.test(x=class_male$身長,y=class_female$身長,var.equal=T, alternative="greater")</font></p>  <p><font color="#0000ff">Two Sample t-test</font></p>  <p><font color="#0000ff">data: class_male$身長 and class_female$身長</font></p>  <p><font color="#0000ff">t = 2.3687, df = 38, p-value = 0.01152</font></p>  <p><font color="#0000ff">alternative hypothesis: true difference in means is greater than 0 </font></p>  <p><font color="#0000ff">95 percent confidence interval:</font></p>  <p><font color="#0000ff">0.8705471 Inf </font></p>  <p><font color="#0000ff">sample estimates:</font></p>  <p><font color="#0000ff">mean of x mean of y </font></p>  <p><font color="#0000ff">63.90909 60.88889</font></p>  <p>p-valueが0.0152なので、5％の有意水準で帰無仮説が棄却され、対立仮説が正しいと判断されます。つまり、「男子の平均身長が女子よりも高い」ということになります。</p>  <h3>母集団の分散が等しいと仮定できない場合</h3>  <span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/06/30/peanuts.csv">peanuts.csv</a></span><p>は生の落花生と、炒った落花生をそれぞれ10匹のネズミに与えたときのタンパク質の摂取量です。生の落花生といった落花生でタンパク質の平均摂取量が異なるかどうか検定します。</p>  <p><font color="#ff0000">&gt; peanuts &lt;- read.csv("peanuts.csv")</font></p>  <p><font color="#ff0000">&gt; peanuts</font></p>  <p><font color="#0000ff">生 炒り</font></p>  <p><font color="#0000ff">1 61 55</font></p>  <p><font color="#0000ff">2 60 54</font></p>  <p><font color="#0000ff">3 56 47</font></p>  <p><font color="#0000ff">4 63 59</font></p>  <p><font color="#0000ff">5 56 51</font></p>  <p><font color="#0000ff">6 63 61</font></p>  <p><font color="#0000ff">7 59 57</font></p>  <p><font color="#0000ff">8 56 54</font></p>  <p><font color="#0000ff">9 44 62</font></p>  <p><font color="#0000ff">10 61 58</font></p>  <p> 仮説検定にはt.testを利用しますが、今回はvar.equal=Fというオプションを追加します。</p>  <p><font color="#ff0000">&gt; t.test(x=peanuts$生,y=peanuts$炒り,var.equal=F, alternative="two.sided")</font></p>  <p><font color="#0000ff">Welch Two Sample t-test</font></p>  <p><font color="#0000ff">data: peanuts$生 and peanuts$炒り</font></p>  <p><font color="#0000ff">t = 0.9185, df = 17.347, p-value = 0.371</font></p>  <p><font color="#0000ff">alternative hypothesis: true difference in means is not equal to 0 </font></p>  <p><font color="#0000ff">95 percent confidence interval:</font></p>  <p><font color="#0000ff">-2.716617 6.916617 </font></p>  <p><font color="#0000ff">sample estimates:</font></p>  <p><font color="#0000ff">mean of x mean of y </font></p>  <p><font color="#0000ff">57.9 55.8</font></p>  <p>p-valueが0.371なので、有意水準を5%とすると、0.371&gt;0.05より、帰無仮説を棄却できません。つまり、生の落花生と、炒った落花生でも、ネズミが摂取するタンパク質の平均に差はないと判断されます。帰無仮説を「生の落花生の方がタンパク質摂取量の平均値が大きい」とする片側検定は次のようになります。</p>  <p><font color="#ff0000">&gt; t.test(x=peanuts$生,y=peanuts$炒り,var.equal=F, alternative="greater")</font></p>  <p><font color="#0000ff">Welch Two Sample t-test</font></p>  <p><font color="#0000ff">data: peanuts$生 and peanuts$炒り</font></p>  <p><font color="#0000ff">t = 0.9185, df = 17.347, p-value = 0.1855</font></p>  <p><font color="#0000ff">alternative hypothesis: true difference in means is greater than 0 </font></p>  <p><font color="#0000ff">95 percent confidence interval:</font></p>  <p><font color="#0000ff">-1.872925 Inf </font></p>  <p><font color="#0000ff">sample estimates:</font></p>  <p><font color="#0000ff">mean of x mean of y </font></p>  <p><font color="#0000ff">57.9 55.8</font></p>  <p> この結果から、有意水準を5％とするならば、片側検定と同じ結果になることが分かります。</p>  <h4>2つの標本に対応がある場合</h4>  <p>10人の被験者の体温を電子式体温計と水銀式体温計で測った結果が</p><span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/06/30/temperature.csv">temperature.csv</a></span><p>に保存されています。</p>  <p><font color="#ff0000">&gt; temp &lt;- read.csv("temperature.csv")</font></p>  <p><font color="#ff0000">&gt; temp</font></p>  <p><font color="#0000ff">電子式 水銀式</font></p>  <p><font color="#0000ff">1 37.21 37.02</font></p>  <p><font color="#0000ff">2 37.12 36.88</font></p>  <p><font color="#0000ff">3 37.04 37.19</font></p>  <p><font color="#0000ff">4 37.45 37.27</font></p>  <p><font color="#0000ff">5 36.93 36.83</font></p>  <p><font color="#0000ff">6 36.96 36.96</font></p>  <p><font color="#0000ff">7 37.23 36.92</font></p>  <p><font color="#0000ff">8 37.15 37.23</font></p>  <p><font color="#0000ff">9 37.22 37.02</font></p>  <p><font color="#0000ff">10 37.05 36.78</font></p>  <p> これは対応のあるデータなので、t.testにpaired=Tというオプションを付加します。</p>  <p><font color="#ff0000">&gt; t.test(x=temp$電子式,y=temp$水銀式, paired=T,alternative="two.sided")</font></p>  <p><font color="#0000ff">Paired t-test</font></p>  <p><font color="#0000ff">data: temp$電子式 and temp$水銀式</font></p>  <p><font color="#0000ff">t = 2.5765, df = 9, p-value = 0.02987</font></p>  <p><font color="#0000ff">alternative hypothesis: true difference in means is not equal to 0 </font></p>  <p><font color="#0000ff">95 percent confidence interval:</font></p>  <p><font color="#0000ff">0.01537252 0.23662748 </font></p>  <p><font color="#0000ff">sample estimates:</font></p>  <p><font color="#0000ff">mean of the differences </font></p>  <p><font color="#0000ff">0.126</font></p>  <p>p-valueから、5％の有意水準で帰無仮説「2つの種類の体温計で測った体温の平均値に差がない」が棄却され、「平均値に差がある」と判断されます。</p>  <p> 片側検定も同様に行えます。</p>  <p><font color="#ff0000">&gt; t.test(x=temp$電子式,y=temp$水銀式, paired=T,alternative="greater")</font></p>  <p><font color="#0000ff">Paired t-test</font></p>  <p><font color="#0000ff">data: temp$電子式 and temp$水銀式</font></p>  <p><font color="#0000ff">t = 2.5765, df = 9, p-value = 0.01493</font></p>  <p><font color="#0000ff">alternative hypothesis: true difference in means is greater than 0 </font></p>  <p><font color="#0000ff">95 percent confidence interval:</font></p>  <p><font color="#0000ff">0.0363543 Inf </font></p>  <p><font color="#0000ff">sample estimates:</font></p>  <p><font color="#0000ff">mean of the differences </font></p>  <p><font color="#0000ff">0.126</font></p>  <h4>練習問題</h4>  <span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/06/30/restaurant.csv">restaurant.csv</a></span><p>1. ある地域には2つのレストランがある。ある1年間の営業日の中から無作為に12日を選び、両レストランの売り上げを記録したデータが</p><p>である。このデータから両レストランの平均売上に差があるといえるか検定しなさい。</p>  <p>2. 東京電力と東芝の1959年1月から2001年12月までの月間株価収益率が、</p><span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/06/30/stockreturn.csv">stockreturn.csv</a></span><p>に保存されている。このデータをつかって、2つの銘柄の収益率の平均に差があるかどうかを有意水準5％で検定しなさい。</p><div><br /></div>]]></description>
            <link>http://www.moriyasu.org/2008/06/post_75.html</link>
            <guid>http://www.moriyasu.org/2008/06/post_75.html</guid>
            
            
            <pubDate>Mon, 30 Jun 2008 22:16:48 +0900</pubDate>
        </item>
        
        <item>
            <title>クロス集計表とモザイク図の作成、独立性の検定</title>
            <description><![CDATA[<h3>クロス集計表の作成</h3>  <span class="mt-enclosure mt-enclosure-file"><a href="http://www.moriyasu.org/2008/06/17/carsurvey.csv">carsurvey.csv</a>はアメリカの消費者から無作為に303名を選び、その消費者と所有車の属性をアンケート調査した結果です。このデータから、モザイク図とクロス集計表を作成してみましょう。</span>  <p>まず、データをRに読み込みます。</p>  <p><font color="#ff0000">&gt; car &lt;- read.csv("carsurvey.csv")</font></p>  <p>データの中身を確認してみましょう。</p>  <p><font color="#ff0000">&gt; car</font></p>  <p><font color="#0000ff">性別 既未婚 年齢 生産国 サイズ タイプ</font></p>  <p><font color="#0000ff">1 男性 既婚 34 米国 大型 ファミリー</font></p>  <p><font color="#0000ff">2 男性 未婚 36 日本 小型 スポーツ</font></p>  <p><font color="#0000ff">3 男性 既婚 23 日本 小型 ファミリー</font></p>  <p><font color="#0000ff">4 男性 未婚 29 米国 大型 ファミリー</font></p>  <p>このデータから、既婚者・未婚者で車の好みが異なるかどうかを検証してみましょう。つまり、「既未婚」の列と、「タイプ」の列を使ってクロス集計表とモザイク図を作成します。</p>  <p> クロス集計表を作成するにはtableという関数を利用します。</p>  <p><font color="#ff0000">&gt; marital_cartype &lt;- table(car$既未婚,car$タイプ)</font></p>  <p> 代入した変数の中身を確認すると、クロス集計表が表示されます。</p>  <p><font color="#ff0000">&gt; marital_cartype</font></p>  <p><font color="#0000ff">スポーツ ファミリー ワーク</font></p>  <p><font color="#0000ff">既婚 45 119 32</font></p>  <p><font color="#0000ff">未婚 55 36 16</font></p>  <p>&nbsp;</p>  <h4>モザイク図の作成</h4>  <p> 次にこのクロス集計表からモザイク図を作成します。Mosaicplotという関数を利用します。</p>  <p><font color="#ff0000">&gt; mosaicplot(marital_cartype,main="既未婚と車の種類")</font></p>  <p><a href="http://www.moriyasu.org/WindowsLiveWriter/9d1c619ea452_10DEB/clip_image002%5B4%5D.gif"><img style="border: 0px none ;" alt="clip_image002[4]" src="http://www.moriyasu.org/WindowsLiveWriter/9d1c619ea452_10DEB/clip_image002%5B4%5D_thumb.gif" border="0" height="240" width="240" /></a></p>  <h4>&nbsp;</h4>  <h4>独立性の仮説検定</h4>  <p> 結婚の有無と車の選好が独立（無関係）かどうかを仮説検定しましょう。帰無仮説と対立仮説はそれぞれ、</p>  <p>帰無仮説：結婚の有無と車の選好が独立。</p>  <p>帰無仮説：結婚の有無と車の選好が独立ではない。</p>  <p>です。</p>  <p><font color="#ff0000">&gt; chisq.test(marital_cartype)</font></p>  <p><font color="#0000ff">Pearson's Chi-squared test</font></p>  <p><font color="#0000ff">data: marital_cartype </font></p>  <p><font color="#0000ff">X-squared = 26.9629, df = 2, p-value = 1.397e-06</font></p>  <p>ここで注意しなければならないところは「p-value」です。この値が有意水準よりも小さければ帰無仮説が棄却されます。もし有意水準を一般的な5%にすると1.397e-06&lt;0.05より、帰無仮説が棄却されます(1.397e-06は<a href="http://www.moriyasu.org/WindowsLiveWriter/9d1c619ea452_10DEB/clip_image004%5B4%5D.gif"><img style="border: 0px none ;" alt="clip_image004[4]" src="http://www.moriyasu.org/WindowsLiveWriter/9d1c619ea452_10DEB/clip_image004%5B4%5D_thumb.gif" border="0" height="21" width="179" /></a>を意味します)。つまり結婚の有無と車の選好は独立ではないと考えられます。</p>  <p> 「X-squared」と「df」はそれぞれ検定統計値と自由度を表します。これらも仮説検定では重要な情報ですが、今回はこれには触れません。</p>  <h4>&nbsp;</h4>  <h4>練習問題</h4>  <p> 「生産国」と「サイズ」、「既未婚」と「サイズ」についてもそれぞれ独立性の検定を行って下さい。</p>]]></description>
            <link>http://www.moriyasu.org/2008/06/post_74.html</link>
            <guid>http://www.moriyasu.org/2008/06/post_74.html</guid>
            
            
            <pubDate>Tue, 17 Jun 2008 19:12:07 +0900</pubDate>
        </item>
        
        <item>
            <title>例題5-5</title>
            <description><![CDATA[表5-8のデータが<a href="http://www.moriyasu.org/2008/06/11/tab5-8.xls">tab5-8.xls</a>に保存されています。このデータを使って、1996年以前と97年以降で通信支出と国内家計最終消費支出の間に構造変化が生じたかF検定を行います。<br /><br />分析ツールの「回帰分析」を使って、3回回帰分析を行います。<br /><ol><li>前期（1990年～96年まで）<br /></li></ol><ol><ol><li>入力Y範囲：B1からB8</li><li>入力X範囲：C1からC8</li><li>一覧の出力先：A18</li><li>「ラベル」にチェック</li></ol></ol>&nbsp;&nbsp;&nbsp; 残差2乗和は分散分析表の「残差」と「変動」が交差するセルに出力されます。<br /><br />2. 後期（98年～2004年）<br /><ol><ol><li>入力Y範囲：B9からB16</li><li>入力X範囲：C9からC16</li><li>一覧の出力先：A37</li><li>「ラベル」に<b>チェックしない</b></li></ol></ol>
3. 全期間<br /><ol><ol><li>入力Y範囲：B1からB16</li><li>入力X範囲：C1からC16</li><li>一覧の出力先：A56</li><li>「ラベル」にチェック</li></ol></ol><br />F値をセルA76に計算します。<br />「=(C68-(C30+C49))/(C30+C49)*(7+8-2*(1+1))/(1+1)」をセルA76に入力します。<br /><br />
<br /> ]]></description>
            <link>http://www.moriyasu.org/2008/06/55.html</link>
            <guid>http://www.moriyasu.org/2008/06/55.html</guid>
            
            
            <pubDate>Wed, 11 Jun 2008 15:57:04 +0900</pubDate>
        </item>
        
        <item>
            <title>例題5-4</title>
            <description><![CDATA[表5-7のデータが<a href="http://www.moriyasu.org/2008/06/11/tab5-7.xls">tab5-7.xls</a>に保存されています。<br /><br />分析ツールの「回帰分析」のメニューで以下の設定をし、回帰分析を行って下さい。<ol><ol><li>入力Y範囲：B1からB11</li><li>入力X範囲：C1からD11</li><li>「ラベル」にチェック</li></ol></ol>回帰係数のF検定に関するF値は、分散分析表中の「観測された分散比」の下の数値です。<br /><br /><table style="border-collapse: collapse; width: 54pt;" border="0" cellpadding="0" cellspacing="0" width="72"><col style="width: 54pt;" width="72"><col>
  <tbody></tbody><tbody><tr style="height: 13.5pt;" height="18"></tr></tbody></table> ]]></description>
            <link>http://www.moriyasu.org/2008/06/54.html</link>
            <guid>http://www.moriyasu.org/2008/06/54.html</guid>
            
            
            <pubDate>Wed, 11 Jun 2008 14:01:05 +0900</pubDate>
        </item>
        
        <item>
            <title>例題5-3</title>
            <description><![CDATA[表5-4のデータが<a href="http://www.moriyasu.org/2008/06/11/tab5-4.xls">tab5-4.xls</a>に保存されています。<br /><br />分析ツールの「回帰分析」のメニューで以下の項目を指定し、回帰分析を行って下さい。<ol><ol><li>入力Y範囲：C1からC16</li><li>入力X範囲：B1からB16</li><li>「ラベル」にチェック</li></ol></ol><br /><ul><li>残差の標準誤差は、「回帰統計」中の「標準誤差」に表示されています。</li><li>回帰係数の標準誤差は「切片」および「GDP]と、「標準誤差」が交差するセルに表示されています。</li><li>ｔ値は「切片」および「GDP]と、「ｔ」が交差するセルに表示されています。</li></ul><br /><br /> ]]></description>
            <link>http://www.moriyasu.org/2008/06/53.html</link>
            <guid>http://www.moriyasu.org/2008/06/53.html</guid>
            
            
            <pubDate>Wed, 11 Jun 2008 13:37:38 +0900</pubDate>
        </item>
        
        <item>
            <title>例題4-6</title>
            <description><![CDATA[表4-4のデータが<a href="http://www.moriyasu.org/2008/06/11/tab4-4.xls">tab4-4.xls</a>に保存されています。このデータを使って、出生児平均余命を被説明変数とする回帰分析を行います。<br /><br /><ol><li>分析ツールの「回帰分析」のメニューで以下の設定をした回帰分析を行って下さい。</li><ol><li>入力Y範囲：B1からB18</li><li>入力X範囲：C1からD18</li><li>「ラベル」にチェック</li></ol><li>さらに、以下の設定をした回帰分析を行って下さい。</li><ol><li>入力Y範囲：B1からB18</li><li>入力X範囲：C1からE18</li><li>「ラベル」にチェック</li></ol></ol>2つの回帰分析結果の自由度修正済み決定係数を比較して下さい。<br /><br />]]></description>
            <link>http://www.moriyasu.org/2008/06/46.html</link>
            <guid>http://www.moriyasu.org/2008/06/46.html</guid>
            
            
            <pubDate>Wed, 11 Jun 2008 13:30:28 +0900</pubDate>
        </item>
        
        <item>
            <title>例題4-7</title>
            <description><![CDATA[表4-5のデータが<a href="http://www.moriyasu.org/2008/06/11/tab4-5.xls">tab4-5.xls</a>に保存されています。<br /><br /><ol><li>年齢を横軸に、給与額を縦軸にとる散布図を描いてください。</li><li>給与額を被説明変数、給与額とその2乗値を説明変数にする回帰分析を行います。</li><ol><li>セルC2に「=B2^2」と入力し、C13まで下方向にコピーします。</li><li>分析ツールの「回帰分析」を利用し、</li><ol><li>入力Y範囲：A1からA13</li><li>入力X範囲：B1からC13</li><li>「ラベル」にチェック</li></ol></ol></ol><br />]]></description>
            <link>http://www.moriyasu.org/2008/06/47.html</link>
            <guid>http://www.moriyasu.org/2008/06/47.html</guid>
            
            
            <pubDate>Wed, 11 Jun 2008 13:19:53 +0900</pubDate>
        </item>
        
        <item>
            <title>例題4-4</title>
            <description><![CDATA[表4-2のデータが、<a href="http://www.moriyasu.org/2008/06/11/tab4-2.xls">tab4-2.xls</a>に保存されています。このデータを使って回帰分析を行います。<br /><br />分析ツールの「回帰分析」のメニューで<ol><ol><li>入力Y範囲：B1からB11</li><li>入力X範囲：C1からD11</li><li>「ラベル」にチェック</li></ol></ol> 「補正R2」と記されているセルの横の数値が自由度修正済み決定係数です。]]></description>
            <link>http://www.moriyasu.org/2008/06/44.html</link>
            <guid>http://www.moriyasu.org/2008/06/44.html</guid>
            
            
            <pubDate>Wed, 11 Jun 2008 13:09:22 +0900</pubDate>
        </item>
        
        <item>
            <title>散布図の描画と相関係数の計算</title>
            <description><![CDATA[<h3>&#160;</h3>  <p>各都道府県のデータを使って、各変数間の散布図の描画と相関係数の計算を行いましょう。まず、データを読み込みます。</p>  <p><font color="#ff0000">&gt; pref &lt;- read.csv(&quot;prefectures.csv&quot;)</font></p>  <p>prefと入力すると、prefに代入されたデータが表示されます。</p>  <p><font color="#0000ff">県コ..ド 県名 面積 人口 持家比率 地方交付税 地方税収 商店数 電力消費量 自動車保有</font></p>  <p><font color="#0000ff">1 1 北海道 83408 5666 54 694 543 63 8623 2065</font></p>  <p><font color="#0000ff">2 2 青森 9606 1507 72 234 113 22 2128 459</font></p>  <p><font color="#0000ff">3 3 岩手 15274 1429 73 239 118 21 2088 464</font></p>  <p><font color="#0000ff">4 4 宮城 7284 2287 61 159 234 30 3468 812</font></p>  <p><font color="#0000ff">5 5 秋田 11613 1227 80 216 101 20 1733 404</font></p>  <p> 以下では各県の「面積」～「自動車保有」の列だけを利用して分析を進めていくので、必要な列だけを取り出します。</p>  <p><font color="#ff0000">&gt; pref2 &lt;- pref[3:10]</font></p>  <p>上の命令は変数prefの3列目から10列目をとりだし、変数pref2に代入せよという意味です。</p>  <p><font color="#ff0000">&gt; pref2</font></p>  <p><font color="#0000ff">面積 人口 持家比率 地方交付税 地方税収 商店数 電力消費量 自動車保有</font></p>  <p><font color="#0000ff">1 83408 5666 54 694 543 63 8623 2065</font></p>  <p><font color="#0000ff">2 9606 1507 72 234 113 22 2128 459</font></p>  <p><font color="#0000ff">3 15274 1429 73 239 118 21 2088 464</font></p>  <p><font color="#0000ff">4 7284 2287 61 159 234 30 3468 812</font></p>  <p><font color="#0000ff">5 11613 1227 80 216 101 20 1733 404</font></p>  <p> 各変数間の散布図を作成します。pairsという関数を利用します。</p>  <p><font color="#ff0000">&gt; pairs(pref[3:10],gap=0) #gap=0 は各散布図間の空白を0にする</font></p>  <p><a href="http://www.moriyasu.org/WindowsLiveWriter/d78b3901edb8_D3AC/clip_image002_2.gif"><img style="border-right: 0px; border-top: 0px; border-left: 0px; border-bottom: 0px" height="240" alt="clip_image002" src="http://www.moriyasu.org/WindowsLiveWriter/d78b3901edb8_D3AC/clip_image002_thumb.gif" width="240" border="0" /></a></p>  <p>各変数間の相関係数を計算します。相関係数を計算する関数はcorです。</p>  <p><font color="#ff0000">&gt; cor(pref2)</font></p>  <p><font color="#0000ff">面積 人口 持家比率 地方交付税 地方税収 商店数 電力消費量 自動車保有</font></p>  <p><font color="#0000ff">面積 1.00000000 0.1121399 -0.10981581 0.86357637 0.01554832 0.09766679 0.04847636 0.1749191</font></p>  <p><font color="#0000ff">人口 0.11213987 1.0000000 -0.80391731 -0.15413683 0.72394462 0.97563958 0.99193483 0.9689834</font></p>  <p><font color="#0000ff">持家比率 -0.10981581 -0.8039173 1.00000000 0.05355635 -0.50281434 -0.81125287 -0.80544938 -0.7503827</font></p>  <p><font color="#0000ff">地方交付税 0.86357637 -0.1541368 0.05355635 1.00000000 -0.18031202 -0.15466839 -0.22705848 -0.1073727</font></p>  <p><font color="#0000ff">地方税収 0.01554832 0.7239446 -0.50281434 -0.18031202 1.00000000 0.76653324 0.75725724 0.6397272</font></p>  <p><font color="#0000ff">商店数 0.09766679 0.9756396 -0.81125287 -0.15466839 0.76653324 1.00000000 0.98409466 0.9264742</font></p>  <p><font color="#0000ff">電力消費量 0.04847636 0.9919348 -0.80544938 -0.22705848 0.75725724 0.98409466 1.00000000 0.9407229</font></p>  <p><font color="#0000ff">自動車保有 0.17491910 0.9689834 -0.75038274 -0.10737274 0.63972724 0.92647417 0.94072291 1.0000000</font></p>]]></description>
            <link>http://www.moriyasu.org/2008/06/post_73.html</link>
            <guid>http://www.moriyasu.org/2008/06/post_73.html</guid>
            
            
            <pubDate>Tue, 10 Jun 2008 15:02:06 +0900</pubDate>
        </item>
        
        <item>
            <title>データ・アナリシス：第1回レポート課題について</title>
            <description>講義中に第1回レポートについての資料を配付しました。欠席して受け取っていない院生さんは、森保まで連絡下さい。 </description>
            <link>http://www.moriyasu.org/2008/06/1_4.html</link>
            <guid>http://www.moriyasu.org/2008/06/1_4.html</guid>
            
                <category domain="http://www.sixapart.com/ns/types#category">研究・教育</category>
            
            
            <pubDate>Mon, 09 Jun 2008 18:47:30 +0900</pubDate>
        </item>
        
    </channel>
</rss>
