NumPyをインストールするための唯一必要なものは、Pythonそのものだけです。 もしまだPythonをイントールしておらず、最もシンプルなインストール方法をお探しなら、Anaconda Distributionの使用をおすすめします。これにはPython、NumPy、および科学計算やデータサイエンスでよく使われる様々な多くのパッケージが含まれています。
NumPyはconda
、pip
、macOSやLinuxのパッケージマネージャー、または ソースコードからインストールすることが出来ます。 詳細な手順については、以下の Python と Numpyの インストールガイド を参照してください。
CONDA
conda
を使用する場合、 defaults
または conda-forge
のチャンネルから NumPy をインストールできます。
# base envにインストールするのでなく、environmentを作成するのがベストプラクティスです
conda create -n my-env
conda activate my-env
# conda-forgeからインストールする場合
conda config --env --add channels conda-forge
# インストールコマンド
conda install numpy
PIP
pip
を使用する場合、以下のようにNumPyをインストールできます:
pip install numpy
またpipを使う場合、仮想環境を使うことをおすすめします。 再現可能なインストールを参照ください。 こちらの記事では仮想環境を使う詳細について説明されています。
Pythonパッケージのインストールと管理は複雑なので、ほとんどのタスクには数多くの代替ツールがあります。 このガイドでは、読者に最適な(または最も人気のある) 方法と明確な指針を提供したいと思います。 このガイドでは、一般的なオペレーティングシステムとハードウェア上での、 Python、NumPy、PyData (または数値計算) スタックのユーザに焦点を当てています。
まずはユーザの経験レベルと、関心のあるOSに基づいた推奨方法から説明していきたいと思います。 PythonやNumPyの経験が「初級」と「上級」の間の方は、シンプルにインストールしたい場合は「初級」を、より長い視点にたったベストプラクティスに沿ってインストールしたい方は「上級」を参照ください。
Windows、macOS、Linuxのすべてのユーザー向けには:
base
のconda環境を出来るだけ小さく保って下さい。 そして、一つか二つ個別のconda environment
を使って、作業中のタスクやプロジェクトに必要なパッケージをインストールしましょう。個人的な好みや、下記のcondaとpipの違いを理解した上で、pip/PyPIベースの方法を使いたいユーザーには、下記をお勧めします:
パッケージの管理は難しいため、たくさんのツールが存在しています。 ウェブ開発と汎用的なPython開発には、こちらのようなpipを補完する ツール があります。 ハイパフォーマンスコンピューティング(HPC)では、 Spack を使うことを検討して下さい。 NumPyのほとんどのユーザーにとっては、 conda と pip が最も広く利用されているツールです。
pip
と conda
がPythonパッケージをインストールするための2つの主要なツールです。 これら二つのツールの機能は部分的に重複しますが(例えば、両方とも numpy
をインストールできます)、一緒に動作することもできます。 ここでは、pip とcond の主要な違いについて説明します。 これは、パッケージをどのように効果的に管理するかを理解したい場合、重要な知識です。
2つ目の違いは、pipはPython Packaging Index(PyPI) からパッケージをインストールするのに対し、condaは独自のチャンネル(一般的には “defaults “や “conda-forge “など) からインストールすることです。 PyPIは最大のパッケージ管理システムですが、人気のある全てのパッケージがcondaでも利用可能です。
最初の違いは、condaは複数言語に対応可能で、Python自体をインストールできることです。 pip はシステム上の特定の Python にインストールされ、パッケージはそのPython用にのみインストールします。 PyPIは、最大のパッケージ管理システムですが、すべての代表的なパッケージは、condaにも利用可能です。
3つ目の違いは、condaはパッケージ、依存関係、環境を管理するための統合されたソリューションであるのに対し、pipでは環境や複雑な依存関係を扱うために別のツール(たくさん存在しています!
ライブラリが更新されると、コードの実行結果が変わったり、コードが完全に 壊れたりする可能性があります。 なので重要なことは、使用しているパッケージの組み合わせと各バージョンのセットを再構築できるようにしておくことです。 ベストプラクティスは次の通りです:
NumPy は他の Python パッケージに依存していませんが、高速な線形代数ライブラリに依存しています。 典型的には、インテル® MKLやOpenBLASがこれにあたります。 ユーザーは、これらの線形代数ライブラリのインストールを心配する必要はありません (NumPyのインストール方法に、あらかじめ含まれているためです)。 高度なユーザーは、使用されているBLASがパフォーマンスや、動作、ディスク上のサイズに影響を与えるため、より詳細を知りたがるかもしれません。
pipでインストールされるPyPI上の NumPy wheelは、OpenBLASを使ってビルドされます。 つまりwheelにはOpenBLASライブラリが含まれています。 そのため、ユーザが(例えば)SciPyも同じようにインストールした場合、ディスク上にOpenBLASのコピーをNumPyのものと2つ持つことになります
condaのデフォルトチャンネルでは、NumPy はインテル® MKLを使ってビルドされます。 MKLはNumPyのインストール時に、独立したパッケージとしてユーザー環境にインストールされます。
conda-forgeのチャンネルでは、NumPyはダミーの「BLAS」パッケージを使ってビルドされています。 ユーザーがconda-forgeからNumPyをインストールすると、BLASパッケージが実際のライブラリと一緒にインストールされます。 デフォルトはOpenBLASですが、MKL(default チャンネルの場合)や BLIS、またはBLASを利用することもできます。
OpenBLASは約30MBですが、MKLパッケージはOpenBLASよりもはるかに大きく、ディスク上の約700MBです。
MKLは通常、OpenBLASよりも少し速く、より安定した解を得られます。
インストールサイズ、パフォーマンスとロバスト性に加えて、考慮すべき2つの点があります:
np.dot
のような関数呼び出しにマルチスレッドを使用し、スレッド数はビルド時オプションと環境変数の両方で決定されます。 多くの場合、すべての CPU コアが使用されます。 これにユーザーにとっては予想外のことかもしれません。 NumPy 自体は、関数呼び出しを自動的に並列化しないからです。 自動並列化により、一般にはパフォーマンスが向上しますが、逆にパフォーマンスが悪化する場合もあります。 例えば、Daskやscikit-learn、multiprocessingなど別のレベルの並列化を使用している場合です。インストールに失敗した場合に、下記のエラーメッセージが表示される場合は、 トラブルシューティング ImportError を参照してください。
IMPORTANT: PLEASE READ THIS FOR ADVICE ON HOW TO SOLVE THIS ISSUE!
Importing the numpy c-extensions failed. This error can happen for different reasons, often due to issues with your setup.