Pythonで機械学習を始めてみたいけど
どのようなツールやパッケージをそろえればいいの?
とお悩みのあなたに、ここではPythonで機械学習をはじめるために必要なライブラリである「Anaconda」について、
- Anacondaとは
- Anacondaのダウンロード
- Anacondaのインストール
- Anacondaに含まれるライブラリ
などについて解説していきます。Anacondaをインストールしておけば、必要なライブラリを手動でインストールする手間が省けますので、ぜひインストールしておきましょう。
※ここではMacOSを元に解説しています。
なお、Pythonの記事については、こちらにまとめています。
Anacondaとは
Anacondaは機械学習やディープラーニングなどの用途や、データサイエンティスト向けに必要なライブラリが多数含まれているパッケージです。
科学技術計算など、複雑な計算を行う上で必要なライブラリが多く含まれており、Anacondaをインストールすることで計算用のライブラリを1つずつpipコマンドでインストールする手間が省けます。
そのため、初心者の方はあらかじめAnacondaをインストールしておくことにより、機械学習に必要な環境が一通り揃うといったメリットがあります。
Anacondaのダウンロード
Anacondaを公式サイトよりパッケージをダウンロードします。以下、スクリーンショットが少し古いものですが、ほぼ同じ流れでインストールができます。
https://www.python.jp/install/windows/anaconda/install_anaconda.html
2018年現在パッケージはAnaconda 5.3、Python自体のバージョンは「Python 3.7 version」と「Python 2.7 version」の2種類があります。特別な理由が無い限り3.Xのバージョンをダウンロードしておきましょう。
「Download」ボタンをクリックすればダウンロードが開始します。以下のような画面が表示されます。興味があれば登録しましょう。(無視しても大丈夫です。)
Anacondaのインストール
ダウンロードした「Anaconda[ここにバージョンが書かれています]-MacOSX-x86_64.pkg」パッケージをダブルクリックします。
①「ようこそAnaconda3インストーラへ」が表示されますので「続ける」をクリックします。
②「大切な情報」にて「続ける」をクリックします。
③「使用承諾契約」にて「続ける」をクリックします。続けて「同意する」をクリックします。
④「インストール先の選択」にてインストール方法を選択して「続ける」をクリックし、続けて「インストール」をクリックします。
※インストールには2.17GB以上が必要ですので、あらかじめ十分に空き容量があるか確認しておきましょう。
⑤ 「Microsoft Visual Studio Code」をインストールする場合は「Install Microsoft VSCode」をクリックします。インストールしない場合はそのまま「続ける」をクリックします。
※ VSCode(Visual Studio Code)はPythonを始めとして、様々なプログラミング言語の開発ができるテキストエディタです。
手軽に拡張機能をインストールできて、非常に便利です。まだ自分のMacにインストールされていない場合は、入れておきましょう。
⑥これでインストールは完了です!
Anacondaのライブラリ
ここではAnacondaに含まれるライブラリについて紹介しておきます。
Scikit-Learn
Scikit-Learnはさまざまな機械学習のためのアルゴリズムが用意されており、機械学習の分野において最も重要なライブラリとなります。
公式サイト:
引用元:scikit-learn http://scikit-learn.org/stable/index.html
Jupyter Notebook
Jupyter Notebookはブラウザ上でプログラムを実行するための環境で、機械学習などでデータ解析する際によく使われているツールです。ノートブック形式でプログラムを実行しながら解析ができるため、非常に有用なツールとなります。
公式サイト:
http://jupyter.org/
NumPy
NumPyはPythonで科学技術計算を行うときに基本的な多次元配列や線形代数、フーリエ変換などの数学関数に特化したライブラリです。
SciPy
SciPyはNumPyでできる科学技術計算に加えて数学関数の最適化や信号処理、統計分布などが可能なライブラリです。NumPyやSciPyはscikit-learnでも使われています。
Matplotlib
MatplotlibはPythonの科学技術計算向けのグラフ描画ライブラリです。折れ線グラフやヒストグラム、散布図などの可視化についてサポートしています。
Pandas
Pandasはデータを変換・解析するためのライブラリです。DataFrameというデータ構造を元に構成されていて、データをSQLのように使用することができます。
機械学習を勉強してみたいあなたに
Anacondaをインストールしたら、次はこれらについてより実践的な勉強がしたくなります。機械学習の分野はとても奥が深く、習得するにはさまざまな知識も必要になってきます。もしも独学での習得が難しい時は、侍エンジニアがサポートします!
侍エンジニアでは機械学習についてのレッスンを開講しています。マンツーマンのレッスンなので、あなたの理解度や目標に合わせて、インストラクターと一緒にカリキュラムを作っていくことができます。
という目的があるならば、「その目的を達成するための最短経路のカリキュラム」をご提案します。それだけでなく、「周辺知識を手広く学びながら目的に近づいていくカリキュラム」を作ることもできますよ。
[su_button url=”https://lp.sejuku.net/lp1_blog_01/?cid=ai_btn1_55939″ target=”blank” background=”#409fdf” color=”#fff88f” size=”10″ center=”yes” radius=”10″ icon=”icon: external-link” icon_color=”#fff88f” text_shadow=”0px 0px 10px #808080″]侍エンジニアとは?
詳細はこちらから[/su_button]
気になる方は「無料カウンセリング」に申し込んでみることをおすすめします!
まとめ
ここではAnacondaについて、
- Anacondaとは
- Anacondaのダウンロード
- Anacondaのインストール
- Anacondaに含まれるライブラリ
などについて解説しました。Anacondaをインストールしておけば、機械学習で基本となるライブラリを手動でインストールする手間が省けますので、ぜひインストールしておきましょう!