社会言語学の基礎 -3-
文中の空欄にはいる語句を(英単語の場合は半角で)書き、チェックボタンで確認しなさい。
(1)
とは、データの総和をデータ数で割った値である。すべてのデータの情報が盛り込まれる一方で、異常値(はずれ値)の影響を受けやすい。
(2)
は、データを大小順に並べたとき中央に位置するデータの値。データ数が偶数のときは、中央の2つのデータの平均値を求める。
(3)
データが左右対称に分布するとき、平均値、中央値、最頻値の値が一致するが、データが正に歪曲した分布をするとき、3つの値のうち、
が最も大きな値をとる。
(4)
各データの値と平均値の差を
という。各データと平均値の差の総和は0になる。
(5)
標本データの偏差平方和を(データ数 - 1)で割って求めた値を標本
という。この値は数量データのばらつきを表す値として用いられる。
(6)
標本分散の平方根の値を
といい、数量データのばらつきを表す値として用いられる。。
(7)
異なるデータセット同士でも散らばり具合を比較できるように、( 標準偏差 / 平均値 * 100 )という式で求める値を
という。。
(8)
分布のひずみ具合(左対称の度合い)を表す尺度を
という。この値は、もし分布が左右対称なら0、分布が左寄りなら正の値、分布が右寄りなら負の値をとる。
(9)
すべてのデータを小さい順に並べたとき、ちょうど下から4分の1(25%)の所に位置する値を第1の四分位数(Q
1
)、下から4分の3(75%)の所に位置する値を第3の四分位数(Q
3
)といい、その差の値を四分位
という。
(10)
日本人男性の体重の値を集めるとそのデータは単峰型の分布を示すが、日本人男女の体重を混ぜ合わせて調査すると、そのデータは
型の分布を示すと予想される。