R言語とは
R言語とは、統計やデータ解析に特化したオープンソースのプログラミング言語です。
R言語は、1990 年代にニュージーランドのオークランド大学の研究者によって開発され、統計処理言語である「S言語」やデータ処理が得意な「Scheme」をベースとし、C言語や PHP といった汎用言語ではなく、統計解析分野に特化した言語として進化してきました。
昨今では、医療分野やビジネスでも統計学が注目されており、それに伴って R言語の需要も高まっています。
多くの企業で R言語が使われており、有名な企業で言うと Facebook や Google、Uber、Airbnb などがあります。
R言語の特徴
オープンソースで誰でも利用できる
R言語はオープンソースのプログラミング言語であるため、利用するのにライセンスを購入する必要がなく、誰でも手軽に利用を始められます。
また、R言語は拡張性も高く、パッケージのカスタマイズもでき、再配布もできます。そのため、世界中の開発者コミュニティによって発展しました。数あるコミュニティのなかでも、R Development Core Team や CRAN (the Comprehensive R Archive Network) が有名です。
ベクトル処理が行える
このベクトルとは、数学的には「単一の数では表現できないいくつかの量」を意味します。ベクトル処理も同じ意味合いで、データをベクトル化し、データの関連性を見つけるものです。ベクトル処理をすれば、膨大な数値データを一つのまとまりとして処理でき、短いコードで効率的に統計処理を行えます。
このベクトル処理に必要なさまざまな関数が豊富に提供されているのも R言語がデータサイエンスに活用される大きな理由です。
データの可視化 グラフ化ができる
R言語はグラフを使ったデータの可視化も得意としています。R言語には簡単にグラフを描画する関数やオプションが数多く備わっており、なかでも「Ggplot2」や「Plotly」というライブラリが人気です。
R言語で膨大なデータをグラフとして可視化することで、分析や解析がしやすくなります。
たとえば、「hist(data)」というソースコードでヒストグラムを作成できますし、ほかにも plot関数で散布図や折れ線グラフ、barplot関数で棒グラフを作成することもできます。
このように、R言語では、統計分析に用いるグラフのフォーマットを細かく設定し、簡単に描画できるため、グラフ作成にも R言語が用いられることが多いです。
統計分野のパッケージが豊富
R言語は統計解析のために作られた言語であるため、統計関連の豊富なパッケージを備えており、抜群の威力を発揮します。パッケージとは、オブジェクトや関数をひとまとめにしたものを指し、パッケージを利用することで、コーディングの手間が省けて開発の効率化ができます。
前述したコミュニティ、CRAN には 18,887 ものパッケージがあり、日々増えています。
このように多種多様で豊富なパッケージがあることでさまざまな業界で R言語が活用できています。
ただ、逆に言えば、多くのパッケージが散在しているため、しっかり活用するには事前にパッケージの知識をつけ、目的に適したものを選ぶことです。
OSに依存しない
R言語はマルチプラットホームのため、OS 環境に制限されません。
多くのユーザが開発に携われてデータの共有もしやすいです。
他の言語やツールとの互換性が高い
R言語は非常に互換性が高く、C言語や C++、Python、Java、SAS、SPSS といった多く言語やデータベースやシステム、BIツールとも連携しやすいです。
R言語でできること
R言語は、さまざまな業界や場面で使われますが、R言語を使用することでどのようなことが実現できるのか解説します。
統計解析
R言語は、統計解析に最適な言語です。それは、特徴でも述べたとおり、データ解析や、データのグラフ化に優れているからです。また、統計解析陽のパッケージが豊富にあることや世界中のユーザから配布された知見を手軽に利用できるのもRが統計解析に適している一因です。
機械学習
機械学習とは、膨大なデータからパターンを見つけて、分析することであり、これは統計解析に特化したR言語の得意分野です。
R言語が活かせる職業
機械学習エンジニア
機械学習エンジニアは、機械学習システムの開発を行うエンジニアを指します。設計から構築、運用、保守まで、一連の流れを担当します。
R言語には「dplyer」や「stringr」などのその機械学習システムの構築に利用できるパッケージも豊富に備わっているため、R言語を使ったシステム開発を行うことも多いです。
データエンジニア
データエンジニアとは、データ分析のためのシステムやツール、データベースなどの開発を行うエンジニアを指します。
データエンジニアが開発したシステムを使って、データサイエンティストがデータ分析をするのが一般的です。
データサイエンティスト
データサイエンティストとは、膨大なデータから統計解析やデータ分析を行い、ビジネスに活用できる有用な知見を見出し、意思決定をサポートする職掌です。昨今、データを活用する重要性が高まってきたことで、データサイエンティストも注目されるようになりました。
データアナリスト
データアナリストは、膨大な情報からデータ分析を行い、課題解決の提案をする職掌です。
AIエンジニア
AIエンジニアは、人工知能システムの設計、開発、運用を行うエンジニアを指します。AIエンジニアは一般的にプログラミング分野とアナリティクス分野に分かれています。
R言語とPythonの違い
R言語と Python はどちらも、統計解析を得意としています。そのため、どちらを学ぶべきか迷っている人もいるでしょう。そこで、両者の違いについて解説します。
第一に利用している層が異なります。R言語は研究者が多くいの対し、Pythonユーザの大半はプログラマやエンジニアが占めます。これには両者に以下のような違いがあるからです。
統計解析に特化したR言語
R言語は統計解析のために開発された言語のため、統計学、統計解析に関しては抜群の威力を発揮します。
逆に言ってしまえば、統計解析以外の分野には不向きといえます。また、R言語だけの知識を深めても、肝心の統計学に関する知識がなければうまく活用することはできないので、その知識も併せて学習しておきましょう。
処理速度や汎用性に優れている
処理速度や汎用性に長ける Python は統計解析も得意です。しかし、どちらかというと Python はコーディング向きの言語でシステムやアプリの開発におけるデータ処理に適しています。
このような違いがあるため、言語を学習する目的や将来のキャリア形成によって学ぶ言語を選択しましょう。
また、統計解析や機械学習などに興味がある方は Python と R言語両方を学ぶのも手です。
データを反復的に収集、分析し、仮説を組み立てるという探索型のデータ解析作業には R言語を利用し、それで得られた最適化モデルでシステムに組み込むのには一度、組んだプログラムを再利用できる Python を使うなど、用途によって使い分けるのが理想でしょう。
統計解析のスペシャリストとして活躍していきたいのであれば R言語を勉強するのがおすすめで、一方で、統計解析だけではなく、Webアプリも作成したいという場合は Python がおすすめです。
R言語はどんな人におすすめ?
分析が得意、好きな人
R言語は、統計解析に強みのある言語であるため、習得することで分析能力が高まり、面白みを感じられるでしょう。
Excelユーザ
Excelユーザが R言語を習得すれば、効率的にセルの計算を行える上に関数の貼り付けミスなどのリスクも避けられるなど、Excel よりも高性能なグラフを作成できます。
プログラミングに関する知識が浅い
ソースコードは難しくないのでプログラミングの知識がない方が統計をスタートする場合はR言語がおすすめです。ただ、有用に使いこなすには統計分析に関する知識も必要です。
Rの環境構築
R言語のメンテナンスを行う The Comprehensive R Archive Network (CRAN) の Webページから R言語をインストールします。
本記事では、バージョン 4.2.2 をインストールした場合の解説ですが、異なるバージョンでも操作方法は変わらないため問題ありません。その時点での最新のバージョンをインストールしてください。
「Download R for Linux」「Download R for macOS」「Download R for Windows」のなかから使用する OS に合わせて選択してください。
Macの場合
「R-4.2.2-arm64.pkg」をクリックするとダウンロードが開始されます。ダウンロード中にパスコードを求められた場合はパスコードを入力してください。
Windowsの場合
「base」をクリックし、「Download R 4.4.2 for Windows」をクリックするとダウンロードが開始されます。
基本的に「続ける」をクリックしていきます。
途中でソフトウェア使用許諾契約への同意を求められるため、目を通してから同意してください。
最後にインストール先を選択し、インストールをクリックすればインストールが開始されます。
コンソール単体でも R言語を利用できますが、RStudio というソフトを合わせて利用することでより便利に利用できます。このRStudio というのは R言語の統合開発環境で、データの読み込みや保存、プログラムの作成、実行、処理結果の表示、パッケージの管理などが簡単に行えます。PC にインストールして使うのが一般的ですが、RStudio Cloud というクラウドサービスもあるため、ブラウザからでも利用できます。
ターミナルでRを起動する
ターミナルを起動し、下記のコマンドを打ち込めば R を実行できます。
R
上記コマンドを入力すると下記のようにシェルが立ち上がります。

RStudioの起動確認
RStudio のアイコンをクリックして起動するとターミナルと同様にシェルが立ち上がります。