色々な数字/データがありますが、それをみてどう考えるかって難しいですよね。
数字に惑わされる場合もあります。
また、世の中にいろいろな数字/データがありますが、示し方によって大きく印象が異なり、それによって印象も異なりますし、統計結果を素直に信じすぎるのも、考えものなところもあります。
ですが、今の世の中にとって、データ/数字はとてもありふれたものになっており、切り離せないところもあります。
というわけで、私なりに1〜4までは統計の計算などはなく、データを見る方はみな知っておいた方がいい or 知っている範囲 と考えています。
5に関しては研究をする方々は必要、論文を読んだり、データを見るだけの方も何をしているか知っておいたほうが良いと思います。
1.データの背景を知る
データをみて、今はこうなっているんだと感じることも多いでしょう。
もしかしたら、その考えは勘違いかもしれない・・・
まず、基本を抑えるという意味でも、そのデータがどのように調査された結果なのかを知ることが重要。その解釈は奥が深く、難しい・・・
全例調査であればともかく、標本調査に関してはどのようなデータにおいても偏りがどうしても出てしまいます。
- 全例調査?標本調査(サンプル調査)?
- データの背景は?
2.データの落とし穴を知る
色々な統計データ、数字を見るうえでも落とし穴を知る必要はあります。この話は意外と面白いと感じていただける方も多いのではないかなと思います。
- 偽相関
3.代表的な数字とは
平均値は様々なところで、見ることが多い、データの中心を示す数字。ですが、他にも中央値・最頻値もデータの中央を示す数値です。それらのよく言われる特徴を示したいと思います。
それ以外にもデータを特徴を示す数値があります。
- 平均値
- 中央値
- 最頻値
- 四部位値
- 分散
- とがり値
4.表の特性を知る
数字の入った表を示されると、それはそれで大切だと思うのですが、グラフ/図にしていただくと見やすくなりますよね。そんな図を色々と紹介していきたいと思います。
私に知らない図があるかもしれません。新しいものを見つければ、それもupできたらと思います。
- 折れ線グラフ
- 棒グラフ
- 箱ひげ図
5.統計解析
データを取ったときに出てきた数値はたまたまの結果かもしれない・・・・
どのような調査にも、そのような可能性は常につきまといます。じゃ、本当はどうなのか・・・
そんなときに必要なのが、統計解析。
大学で研究を行った人ではお世話になった方も多いのではないでしょうか?
近代看護教育の生みの親とされる、かの有名なフロレンス ナイチンゲールもこの統計の発展に努めたとされるので、このような手法を用いて・・・・ いたかは定かではありませんが(正確には、私はわかりませんが)、様々な有用な情報を明らかに示すために統計の手法を使ったとされています。
当時も統計を使って証明し、周りの人々に大切さを示したのかもしれませんね。
- データの関係をしる
- 相関係数
- 回帰直線:
- 解析のの基本
- αエラー、βエラー
- 検定と推定
- 2つのデータを解析する
- T検定
- χ二乗検定
- フィッシャーの正確検定
- データの影響要因を調べる
- 回帰分析
- 重回帰分析
- ロジスティク回帰分析
- Cox比例ハザードモデル
6.データ・統計に使えるソフト/アプリ
統計解析の計算を手で行うのは大変。そのため、統計ソフトが販売されてます。大学や会社で使用できれば、有料のソフト/アプリを使用するのは可能ですが、個人で購入できるものは限られます。
ただ、ありふれたソフトだと、行える解析もあまりなく・・・
ということもあり、それらについて記載していけたらと思います。
- EXCEL
- EXCEL統計
- スプレットシート
- R・Rstudio・EZR
- SPSS
- JMP
- Python
データ/数字の意味を知ることで世の中にあふれたデータが、そのままの解釈でよいか、そ
統計に悩む方々は多く、私もその一人です。今も悩む時がありますが・・・
これらを読んでいただいてから、しっかりとした専門書の橋渡しができれば、理解もすすむ・・・ と、いいなと思います。
記事を書き進むに連れて、これも必要と思ったものがあれば、書き加えていきたいと思います。
ちなみに、順番通りに記載するとは限りません。まぁ、これらをのんびり書いていけたらと思います。
コメント