第2部では、より実用的なスクリプト開発に向けて、ローカルでのPythonの使い方、公開されたサードパーティのパッケージを使う方法を学びます。
それでは実際にサードパーティのパッケージをインストールして、Python コードから利用してみましょう。
Note
サードパーティパッケージは、第三者が公開しているパッケージのことです。
パッケージ内には、コマンドラインツールや Pythonスクリプトから使えるモジュール郡などが含まれています。
このモジュールはライブラリと呼ばれます。
サードパーティパッケージは、 pip (ピップ) を用いて自分の環境にインストールことができます。
pipを用いてインストールできるサードパーティのパッケージは、 Python Package Index (PyPI(パイピーアイ): https://pypi.python.org/pypi) に登録されています。
PyPIには、DjangoやFlaskといったWeb開発のためのフレームワークをはじめ、 numpyなどの数値計算ライブラリやプロビジョニングツールのAnsibleなど、 様々なパッケージが登録されており、pipを用いて簡単にインストールすることができます。
これらのパッケージは実際にプロダクト開発などに利用されています。 また、ライセンス次第ですが、多くのパッケージは無料で使うことができます。
もちろんこれから使うライブラリもPyPIに登録されているのでpipを用いてインストールすることができます。
pipのインストール方法はOSによって異なります。
| Ubuntu: | get-pip.py |
|---|---|
| Windows/OSX: | 公式インストーラーにバンドル |
Note
$ の後にコマンドが続いている表記は、
ターミナル・コマンドプロンプトでコマンドを入力することを想定しています。
$ python my_script.py
Windows/OSX の場合、 Pythonをインストールした際にpipも一緒にインストールされており、 別途インストールする必要はありません。
Warning
ただし、Pythonの公式 (python.org) のインストーラ以外でインストールした場合はこの限りではありません。
Ubuntuにpipをインストールするには、PyPIが配布している get-pip.py というインストールスクリプトを用います。
以下のコマンドでpipをインストールします。
$ curl https://bootstrap.pypa.io/get-pip.py | sudo python3
Caution!
python コマンドではなく python3 コマンドを使うことに注意してください。
python コマンドを使うと、 Python 2 用に pip がインストールされてしまいます。
Ubuntu では、今後も引き続き python コマンドではなく python3 コマンドを用います
Note
curl コマンドがインストールされていない場合は、
sudo apt-get install -y curl でインストールできます。
このままだとpipでパッケージインストール時にroot権限が必要となるので、 ホームディレクトリ下のパッケージインストール用ディレクトリにインストールされるように設定します。
$ mkdir -p ~/.config/pip/ $ echo -e '[install]\nuser = yes' > ~/.config/pip/pip.conf
これでインストールは完了です。
次に、pipが正しくインストールされているかを確認しましょう。
以下のコマンドを実行してください。
$ pip --version pip 9.0.1 from /usr/local/lib/python3.5/dist-packages (python 3.5)
この出力はそれぞれ次のような意味です。
pip 9.0.1pip のバージョンfrom /usr/local/lib/python3.5/dist-packagespipでインストールされたパッケージが配置されるディレクトリ(python 3.5)pip が動いてるPythonのバージョン
この出力から以下のことが確認できれば、無事にpipがインストールできています
- pip のバージョンが 9 以上 (
9.0.1など) - Python のバージョンが3.5以上
Note
Windows の方へ: ディレクトリとはWindowsでいうフォルダーに相当するものです。
はじめに今回つかうライブラリを紹介します。
1. 「画像ファイルをプログラムで扱ってみよう」では、 Pillow (ピロウ) という画像処理用のライブラリを利用します
Pillowは画像処理を行うライブラリで、画像の縮小や切り取りをはじめ、 様々な画像編集を行うことができます。
2. 「WEBサイトの情報をPythonを使って抽出してみよう」では、HTTPライブラリの Requests (リクエスツ) と、HTMLの解析を行える Beautiful Soup 4 (ビューティフル・スープ) というライブラリを利用します
RequestsだけでもWEBサイトの情報を取得する事は可能ですが、今回はより実用的なスクレイピングを行う為にBeautifulSoup4と組み合わせて使います。
Note
HTTPとは?: HTTPとは、サーバとクライアントがHTML等の情報を送受信するためのプロトコル(通信のルール)です。
Note
サーバー、クライアントとは?: 普段みなさんがブラウザでアクセスしているWEBサイトはHTTPというプロトコルを使ってデータを取得し、ブラウザが表示しています。このとき通信先をサーバ、通信するアプリケーションをクライアントと呼びます。Requestsはブラウザと同じようにサーバからHTTPでデータを取得するクライアントツールです
Note
HTMLとは?: HTML(HyperText Markup Language)は、WEBページを作成するために開発された言語です。 WEBページのほとんどはHTMLで作られています。
pipがインストールできたので、第3部にて使用するライブラリをダウンロードしてみましょう。
pipでパッケージをインストールするには pip install コマンドを使います。
以下のコマンドを実行して、ライブラリをインストールしてください。
$ pip install Pillow $ pip install requests $ pip install beautifulsoup4
では、インストールができたことを確認してみましょう。
インストールされているパッケージを確認するには、 pip list コマンドを実行します
$ pip list Pillow (3.3.1) requests (2.18.3) beautifulsoup4 (4.6.0)
() の左側がインストールしたパッケージ名、内側がパッケージのバージョンです。
ライブラリが無事インストールされていれば、上記のような表示が得られます。
Note
インストールしたタイミングによってはバージョンが異なる場合がありますが問題ありません。
Note
インストールしたパッケージを削除するには、 pip uninstall パッケージ名 というコマンド使います。
例えば、 Pillow を削除するには pip uninstall Pillow とします。
第2部では次のことを学びました。
- [ ] pipのインストール
- [ ] pipによるサードパーティパッケージのインストール
3部 ではこれらを踏まえて、より実用的なスクリプトの作成方法について学びます。

