そろそろ重回帰分析に向うぞ(1)。

今日も引き続き。
「性別」と「年代」が「同性愛嫌悪」変数に効いている変数だということは、前日までの独立性の検定でわかっている。それ以外に回帰式に組み込めそうな変数を拾い上げたいと思う。
また、(今日やるかわからないけれど)年代変数が効いているのが「コーホート効果」なのか「加齢効果」なのかの見通しをつけたいとも思う。

まず「世帯収入」変数から。これはJGSS-2001面接票の問33をそのまま使った。(http://ssjda.iss.u-tokyo.ac.jp/chosa-hyo/0250c_1.html

問33 〔回答票49〕 あなたの世帯全体の昨年一年間の収入についておうかがいします。税金を差し引き前の収入でお答えください。株式配当、年金、不動産収入などすべての収入を合わせてください。この中のどれにあてはまりますか。(N:2790)
[調査員注:尋ねられたら「残業額も含む」と答える。]

1 (ア) なし              0.3
2 (イ) 70万円未満           1.0
3 (ウ) 70?100万円未満         1.4
4 (エ) 100?130万円未満        1.6
5 (オ) 130?150万円未満        1.4
6 (カ) 150?250万円未満        4.6
7 (キ) 250?350万円未満        7.6
8 (ク) 350?450万円未満        7.9
9 (ケ) 450?550万円未満        6.2
10 (コ) 550?650万円未満        5.4
11 (サ) 650?750万円未満        4.9
12 (シ) 750?850万円未満        5.1
13 (ス) 850?1,000万円未満       6.7
14 (セ) 1,000?1,200万円未満      5.6
15 (ソ) 1,200?1,400万円未満      2.9
16 (タ) 1,400?1,600万円未満      1.4
17 (チ) 1,600?1,850万円未満      0.9
18 (ツ) 1,850?2,300万円未満      0.7
19 (テ) 2,300万円以上↓         0.5
20 回答したくない            11.5
21 わからない              21.5
無回答                 0.9

↓(19の場合、具体的に)(N:14)
約(  )万円
  2,300万円         7.1
  2,500万円         14.3
  4,000万円         7.1
  無回答           71.4

見てもわかるとおり、使える回答は1?19で、20、21、「無回答」は欠損値(非該当)として扱わなければならない(さしあたり)。これが2790サンプル中947件もあるのだ。まあ、「わからない」が21.5%ってのもすごい数値だけど。てきとーでいいから答えろよ!
で、カイ二乗検定してみた。
「同性間」4値の場合:

世帯収入
カイ二乗 自由度 P値 判定  
127.7745747 54 6.44138E-08 ** **:1%有意,*:5%有意

これはクロス表見ても、直感的によくわからないので、「同性間」2値の場合についても独立性検定して、折れ線グラフを作ってみた。

世帯収入
カイ二乗 自由度 P値 判定  
471.7260635 6 1.03266E-98 ** **:1%有意,*:5%有意

線はなだらかだけど、直感的に低所得層が同性愛嫌悪の傾向にあるということはいえると思う。

次に、「階層帰属意識」を見てみよう。これは留置票のQ11。(http://ssjda.iss.u-tokyo.ac.jp/chosa-hyo/0250c_2.html

Q11 かりに現在の日本の社会全体を、以下の5つの層にわけるとすれば、あなた自身は、どれに入ると思いますか。(N:2790)

1 上                  0.6
2 中の上               10.3
3 中の中               47.8
4 中の下               33.3
5 下                  6.4
無回答                 1.7

数字だけ見ると、「中の下」と答える人が多いかな、という印象を受ける。これ、面白いことに、「同性愛2値」とクロス表作ると、先の「世帯収入」とムジュンする。

階層帰属意識
カイ二乗 自由度 P値 判定
11.64732775 4 0.020175883 * **:1%有意,*:5%有意

独立性検定は5%有意に留まっているものの、グラフを見ると、「上」「中の上」「中の中」「中の下」の順に「同性愛嫌悪」は下がっていっている。ただ、「上」と答えているのがたったの0.6%で、「世帯収入」が2300万以上が0.5%だから(その層は先のグラフで見てもわかるように、「同性愛嫌悪」がちょっとだけ跳ね上がる)、「上」に関してはよくわからない。問題は「中の下」‐「良い」の45.2%という高い数値だね。
これは検討するかもしれない(制限時間による)。