Rってなに? 無料で使える統計解析ソフト?

statistics

私も薬剤師をしながら研究をしていますが、統計処理は重要です。が、統計解析ソフトがないと難しい。

勤務している施設に統計解析ソフトがある場合には良いのですが、統計解析ソフトがないときには手計算・・・ はなかなか厳しい。EXCELだと「フィッシャーの正確確率検定」のような一般的に使用されている検定方法も対応していないことがあります。

まぁ、数式を入れ込めばできることはできますが・・・

そのような場合に、私は「R」を使用して解析をしていました。そのRについて、簡単にお伝えしていきたいと思います。

統計解析ソフトはどんなものがある?

統計解析ソフトは様々なものがあり、知っている限り下記に記載してみました。

有料一部有料無料
SPSS
SAS
JMP
EXCEL(EXCEL統計)
STATA
Stata
R studio
R
EZR

他にも多々あるとは思います。

上記の表以外では、AI・機械学習でも有名な「Python」が統計の分野でも有名です。
Pythonはプログラミング言語であり無料で使えますが、anacondaでは条件によっては有料になる場合があります。ですが、現在は高校生の授業で使用されていることもあるプログラミング言語であり、一度学んだことのある方々にとっては使いやすいかもしれませんし、今後発展していく言語かもしれません。

これらの統計ソフトを個人で導入するには、高額な費用などから選べるものが狭まります。実際にも私が個人でSPSSを購入しようとIBMに費用を聞いたことがありますが、スタッフの方が困っていました。

その中で、「R」は個人で導入可能で、信頼のある無料の統計解析ソフトになります。

Rとは

「R」はプログラミング言語で、だれでも無料で使用できます。

この「R」の特徴の一つにPackageを追加して解析手法を増やすことができることがあります。
このPackageとは世界中の研究者など様々な方が開発・更新したプログラムであり、「R」にインストールすることで使用できる解析手法を増やすことができます。
このPackageは徐々に増えています。

上記がRの画面になりますが、「>」のあとにプログラミング言語を入力して解析を進めていきます。

この1画面でどのように解析するかというと、EXCELのデータをRに読み込ませて、そのデータを加工して、統計解析を行っていきます。

ただ、このソフトだと読み込ませたデータを見ながら、プログラムを書くことはできないし、実際にやってみると大変です。
そこでRを使った、より使用しやすいソフトが開発されています。

EZRとは

「R」をもとに開発された統計解析ソフトの一つに「EZR」があります。マウス操作だけで解析できるソフトで、「R」よりも使いやすいソフトだと思います。詳しくは下記ホームページで調べるのが良いと思います。

無料統計ソフトEZR (Easy R)
メニュー操作でRの統計解析ができるフリーソフトEZRを紹介しています。

最近でも様々な論文で見かけることが多くなったソフトであり、様々な統計解析が可能です。
Rほど多機能ではありませんが、十分に使える機能を有していますし、日本語の解説があることも使いやすい要因になると思います。

R studioとは

R studioを使用してきた私としては「R」をより見やすくしたソフトという印象で印象です。無料版と有料版がありますが、私は無料版を使用しています。

R studioを始める、次の画面になります。

Rの時は1つだけのウインドウだったのが、今回は4つになっているのがわかると思います。
それぞれを確認しながら統計解析を行うことができます。

Rの画面では「プログラミングを実行・結果の算出(左下)」の部分があったのですが、4つになったことで、確認しながら解析を行うことが可能です。

例えば、EXCELやGoogleスプレットのデータを読み込ませれば、「取り込んだデータを示す(右上)」と記載したところに表示されますし、パッケージを読み込ませるのには「packagesを示したり 図や表を示したり・・・(右下)」チェックをいれるだけで読み込まれますし、図を作成した時にも使用されます。

解析時には、「プログラミングを行う(右上)」でプログラミングを記載して実行することで「プログラミングを実行・結果の算出(左下)」に書いたプログラムが移動/実行されることで解析が進みます。

私が「R」で解析を行う上では必須のソフトになります。

Rでの解析

Rではプログラミングを行うようにして解析をしていきます。

たとえば、身長の平均を算出しようとしたときに

154cm , 155cm , 155cm, 160cm , 146cm , 170cm

があったとします。これを「height」という表題をつけてRに読み込ませます。すると下記のようなデータが読み込まれます。

height(154 , 155 , 155, 160 , 146 , 170)

平均値はMean関数を使います。Mean関数の使い方は下記のように使用します。

      mean(“表題”)   “表題”の部分に表題を入力する  

つまり、今回のheightの平均を算出しようとすると

>Mean(height)

と入力すると回答が得られます。

このようにプログラミングのようなものを記載するので、使う場合にはどのような関数があるか調べる必要があります。

ですが、使用している方も多いためか、情報も多量にありますし、webや解説本も多く存在します。調べながら解析を行っていくことでも、可能だと思います。

参考)

【初学者向け】「R」言語とは?R言語についてわかりやすく解説!
https://aiacademy.jp/media/?p=1123

0からのプログラミング奮闘記
https://note.com/eiko_dokusho/n/n1564e6045e34

コメント

タイトルとURLをコピーしました