2008年度

Rによる調査データの整理

2007年度社会調査法

講義資料は以下のところに置いてあります。
ダウンロード

内容を見たりするのにはユーザ名とパスワードが必要です。

社会調査実習(2005年度)

今年度は、今までとは異なって、「ティーム・ティーチング」(http://www.abetaka.jp/riron/sin/sin10.html)の態勢で授業をやっています。

社会調査実習BLOG」(http://ab.cocolog-nifty.com/sr05)を作成し、実習関係ファイルをまとめて置いています。ユーザー名とパスワードが必要です。

SPSSではなくPSPP

http://ab.cocolog-nifty.com/blog/2005/02/spsspspp.html

エクセルで相関係数やカイ2乗値などを計算する

ユールの関連係数と四分点相関係数の比較
カイ2乗値の計算等
カイ2乗分布表の代わり
(参考:SPSSコマンドによる表。 ダンプカーでショッピングに行くようなこと。)

VassarStats」というサイトが、「Cramer's V」という言葉をグーグルで検索したときに見つかりました。統計的計算をウェッブ上で(JavaScriptで)おこなうことのできるサイトです。ここを使えばエクセルもいりません。作者は、心理学者のRichard Lowry氏。
列数、行数を設定してからマスの中にデータを入れれば、カイ2乗値やクラマー係数などを求めることができます。
Vassarstatsthumb

エクセルでクロス集計(続)

Lancs1thumb
3重のクロス集計。下記の資料には、エクセルでクロス集計をおこなう場合のやり方が具体的に示されています。

Analysing Data with Pivot Tables←「Excel for Social Scientists」の一部
(Centre for Applied Statistics, Lancaster University)

IF関数を使ったRECODE(カテゴリーのコードの変更)についても解説されています。類似のカテゴリーの合併をおこなうことが主な目的です。やってみると以下のようになります。
Recodethumb
1 and 2 into 1
3 and 4 into 2
とするために、「=IF(D2=1,1,IF(D2=2,1,IF(D2=9,9,2)))」という式を使っています。「1は1に、それ以外で、2も1に、それ以外で、9は9に、それ以外は2に」と読むことができます。
OR関数も使って「=IF(OR(D2=1,D2=2),1,IF(OR(D2=3,D2=4),2,IF(D2=9,9)))」としても同じ結果です。最後に並んでいる「)」の数は、「IF」の数と一致させます。言うまでもないことですが、最初の(一番上の)セルに式(関数)を入れて、その後は、それを残りのすべてのセルに貼り付ければ、自動的に各セルに合った式が入ります。なお、エクセルの解説書によれば、「ネストは、1つの関数の中で最大7階層まで」という制限があるようです。式の最後に「)」を8個までつけられるということになり、8回の「枝分かれ」をさせることができます。つまり、カテゴリーを再分類する場合、カテゴリー数は最大で9にすることができるということです。
recodeの例(エクセルのファイル)

エクセルでクロス集計

Pivot

エクセルのピボットテーブルを利用したクロス集計の例を示します。例の中で、団体類型(類似団体の類型)というのは、人口と第2次・第3次産業人口比率によるものです。「類似団体別市町村財政指数表」で使われているということです。
クロス集計の例(エクセルのファイル)

3重のクロス集計も、エクセルで、特定の変数(いわゆる「第3変数」)をキーにしてデータ全体の「並び替え」をやって、第3変数でデータをグループ化すれば、2重のクロス集計の場合と同じ方法でおこなうことが可能。(しかし、そのようにしなくても、変数のリストから新しい変数を選んで隣に並べるだけで3重のクロス集計が可能。)

クロス集計における連続的変数の扱いについてですが、「数値を指定した基準値の倍数に切り捨てる」FLOORという関数を使うという方法があります。例えば、5の倍数に切り捨てるならば、5以上10未満が5となり、10以上15未満が10となるということです。
FLOOR関数の使用例(エクセルのファイル)

クロス集計の数値がおかしい場合(セルに度数が表示されていない場合)、ピボットテーブルのフィールドの設定で「集計の方法」として「データの個数」を選ぶ必要があります。「データフィールドが数値の場合は『合計』が、文字列の場合は『データの個数』が集計結果として表示される」というのが、「ピボットテーブルの初期設定」であるということです(『Excel 2000 for Windows SUPER MASTER』(エクスメディア)456ページ)。「合計」というのは、この場合は、変数の数値を商品の価格のようにとらえて度数(個数?)と掛け合わせたものになっており、クロス集計の目的に合っていません。フィールドの設定のメニューは、「レイアウト」のメニューの「データ」領域にドラッグした変数をダブルクリックして出すことができます。また、表ができた後に、表の内側でマウスで右クリックしたときのメニューからも「フィールドの設定」をおこなうことができます。
Pivot2

上の図にある「オプション」をクリックすると、以下のようなメニューが現れ、「計算の種類」の設定を変更すれば列パーセントや行パーセントを表示することができます――「度数」のかわりに。
Pivot3

利用したデータの出所は、下記のサイト。
福岡県市町村要覧(http://www.fmw.or.jp/data/youran.html)

エクセルでクロス集計をすることについて、最初に参考にしたのは、下記の本の第7章。付録のCD-ROMに例題のエクセルファイルが収録されているので便利。「集計表のレイアウト」で「性格」を「データ」のところに配置したときに起こる問題――「データの個数」ではなく「合計」が表示されること――について触れたあればよかったと思います。分類コードとして数値を用いるならば必ず起こることなので。
桶井良幸・桶井貞美『Excelで学ぶ統計解析』(ナツメ社、2003年)

下記のサイトには、「専門のプログラムやマクロを使わず、Excelだけでアンケートを集計する方法を紹介します」と書かれています。SPSSなどの「カーナビ付きオートマ車」のようなソフトが好きになれない人には、非常に参考になります。
SSRI統計WEBアンケート集計

記録(社会調査法2004年度)

4月15日
社会調査はどのように進めるか
なぜ○○大学に決めたのか――説明図式の例
理由分析の5段階
社会調査の方法

4月22日
作業

5月6日
二重クロス統計表と3重クロス統計表
ユールの関連係数と4分点相関係数
最大関連と完全関連

5月13日
ユールの関連係数でQ=0の場合、最大関連と完全関連の場合を例示して説明した。
最大関連では+1または-1となり、完全関連でも同じであること。
Q=+1とQ=-1の違い(同じであること)。
エラボレーションのタイプ
 Ⅰ、ⅡA、ⅡB、Ⅲ
[XY]=[XY:Z1]+[XY:Z2]+[XZ][ZY]の式の意味
共通の先行変数と媒介変数

5月20日
エラボレーションのタイプ
式に基づいて解説した。
(Ⅴについては再度触れる予定)
s×t表の場合の属性相関係数
φ係数
クラマー係数
chi squareの値の計算
宿題

5月27日
エラボレーションについての解説
式の説明
交互作用とは
「ウェイト付きの和」とは

6月3日
統計的検定(2.3)
二つの比率の差の検定

6月10日
統計的検定
テキストの「作業」
片側検定と両側検定
平均、標準偏差
エクセル・ファイル(2つの比率の差の検定)

6月17日
統計的検定の復習
(帰無仮説、第一種の過誤と第二種の過誤、片側検定と両側検定、2つの比率の差の検定、カイ2乗検定)

6月24日
系統抽出法と比率の推定
エクセルの関数で乱数を発生させる方法
比率の推定の標本誤差
作業

7月1日
調査票の作成(2.9)

7月8日
調査票の作成

7月15日
2種類の調査票の完成

次回までに、「面接調査」を各グループでおこなうこと。
集計は、次回の授業時間中におこなう予定。

7月22日
調査票の集計
検定についての説明

各グループで、集計結果表、調査票のコピー1部をレポート提出ボックスに提出してください。
検定結果は、8月5日の試験の時に集めます。各自で(グループでではなく)提出してください。

8月5日
試験実施

テキスト、ノート、その他何を持ち込んでもかまいません。
電卓を持ち込んでもかまいませんが、電卓がないと困るような問題にはしないつもりです。
授業で行った「作業」を理解しているかをみる問題を出す予定です。

chi squareを計算する表

ファイルのダウンロード←授業の時に示した表がPDFファイルになっています。

chi squareの計算については、テキストの78ページと79ページを参照してください。

5月6日に提出するもの

「クロス集計とエラボレイション」(2.4)

「作業」の(1)から(4)までの作業経過を示し、結果の考察をおこなってください。
各自でA4の用紙に記入し、次回の講義(5月6日)の時に提出してください。

わからないところがあれば、いつでも質問してください。「コメント」を受け付けます。下の「コメント」のところをクリックして書き込んでください。

«SASの使い方