統計に強いって噂のR言語ってなに?〜R言語入門編〜

2017.10.23/データサイエンス

R言語では統計・解析のための、様々なライブラリ(パッケージ)や関数がたくさん用意されています。最近話題になっているビッグデータやマーケティング方面まで様々な分野で利用されるようになってきています。

R言語で利用できる関数を覚えれば覚えるほどR言語をより便利なツールとして使いこなすことができるようになります。最初は”魔法のコトバ”と思って使ってみてください。

統計学の予備知識がない人でも短期間の学習で、ある程度は使いこなせるようになるところも魅力の一つです。
今回はこのR言語についてご紹介します。

R言語について

R言語とは、オープンソースのフリーソフトウェアであり、プログラミング言語の一種です。
そして、統計的なデータ解析・データ分析に特化したスクリプト言語です。
フリーソフトなので、誰でもタダで利用できます。ありがたや〜
とても便利で、無料なのがとても良い点ですが、注意も必要です。
メリット・デメリットを下記にまとめました! 

メリット

・無料で使用できる
・様々な解析のライブラリが登録されている
・処理結果のグラフ等をPDFファイルや各種画像形式で保存できる
・各ライブラリーに論文名が記載されている
・データもソフトの中に含まれているのですぐに試してみることができる
・スクリプトのサンプルがほとんどのヘルプファイルに記載されている
・新しいライブラリーもすぐにリストから選択して取り込むことができる
・Windows、Mac、LinuxいずれのOSでも利用出来る 

デメリット

・文字入力のインターフェイス(CUI)であるため、なれるまで少し時間がかかる
・同一目的のライブラリーが複数あるため、自分の利用目的で最良のものが分かりにくい
・個人の責任で利用するのが原則のため、バグがないか検証する必要がある
・データ量が多い場合には、処理速度が遅いと感じることもある 

いままでエクセルでデータを扱っておりそろそろデータ量が膨大になってきてマクロでは捌ききれなくなった方、R言語を検討してみてはいかがでしょうか?

R言語のインストール

R言語を扱うための実行環境を以下のサイトからインストールして下さい。
日本語版のR言語がインストール出来ます。
Windows環境の方は”Download R for Windows”をクリック、
Mac環境の方は”Download R for (Mac) OS X”をクリックしてインストールしてください。
パッケージのダウンロードが完了したら、インストーラーを起動して、後は指示にしたがってポチポチと・・・ 

https://cran.ism.ac.jp/

R Studioのインストール

R Studioとは、いわゆるR言語の開発環境です。R言語のスクリプトファイル、実行console、グラフスペース、読み込んだデータの一覧などが見やすく配置されます。

R言語のインストール時にまとめて、R Studioの導入をおすすめします。
以下のサイトから自分の使用しているOSにあわせてダウンロードしてください。

https://www.rstudio.com/products/rstudio/download/

ダウンロードしたファイルを開いてインストールをします。
インストールしてアプリケーションフォルダに「R studio」があれば、インストール完了です。 

とりあえずR言語に触れてみよう

さあ!とりあえず何もわからないままでも一度R言語に触れてみましょう!
R言語には標準として準備されているサンプルデータがあります。
今回は、「あやめ」(アイリス)という花3種(setosa / versicolor / virginica)の
がく片の長さと幅と花弁の長さと幅の変数のセンチメートル単位のデータを利用します! 

↓あやめの花

R Studioでサンプルデータを出力してみる

R Studioを開いて、Console画面に

​iris

と入力してエンターを押してみましょう。
下記のように格納されているデータがコンソール画面に出力されます。 

サンプルデータをグラフ化してみよう

では次にデータを見える化してみましょう!
Lattice Graphics のグラフ用パッケージを読み込みヒストグラムを作図してみましょう!
…難しく考えず下記のコマンドをコピペで実行してみてください! 

library(lattice) 
histogram(~ Sepal.Length, data=iris) 

上記のように右下にデータを可視化されたグラフが表示されたと思います。
さらに下記のコマンドを入力してみてください! 

plot(Petal.Length ~ Sepal.Length, data=iris)

また違ったグラフが生成されました!
生成されたグラフは画像として書き出すことが可能となります。 

まとめ

R言語についてほんとに触り程度ですがご紹介でした!
すこしはR言語の可能性を感じていただけましたでしょうか?

まだR言語の初歩の初歩をご説明しただけですが、
R言語を極めれば今までエクセルで頑張っていた作業が一瞬で終わったりするなんてこともあります。

プログラミングだからといって変に苦手意識を持たずR言語にふれてみてください。
またこのサイトで非常に便利なR言語についてご紹介していきます!

では!