クローリング スクレイピングに向けたPython開発環境を構築

前回の記事「クローリング・スクレイピングとは? 副業効率化のための基礎知識」ではクローリング&スクレイピングに関する概念を理解しました。

今回はクローリング&スクレイピングを学習・実践するための環境を構築していきます。

参考書籍の「Pythonクローリング&スクレイピング[増補改訂版] -データ収集・解析のための実践開発ガイド」では、macかUbuntuでenvを使って環境構築構築していますが、今回はWindows環境なのでAnacondaを使うことにします。

Anacondaの利用には賛否あると思いますが、手軽さを重視したいと思います。

Anacondaとは

Anacondaは、Pythonの開発環境構築を簡単にしてくれるパッケージです。

通常であれば一つ一つやらなければならない面倒な導入作業をまとめてやってくれます。

  • Pythonのインストール
  • よく使うライブラリの導入

仮想環境の作成も簡単にできるので、私は結構こちらを利用しています。

環境

  • CPU: Intel(R) Core(TM) i5-1035G4 CPU @ 1.10GHz 1.50 GHz
  • メモリ: 8.00 GB
  • ディスク: SSD
  • OS: Windows10 20H2

Anaconda導入手順

インストーラをダウンロード

Anacondaの公式サイトからインストーラをダウンロードします。

Get Started」をクリックします。

Download Anaconda installers」をクリックします。

64-Bit Graphical Installer」をクリックするとダウンロードが始まります。
(ここは自身の環境に合わせたものを選択してください。)

Anacondaのインストール

ダウンロードしたインストーラをダブルクリックで起動します。

Next」を押します。

I Agree」ボタンを押します。

Just Me」を選んで「Next」ボタンを押します。

インストール先を選択します。

Destination Folder」がインストール先となりますが、日本語が混じっているとうまく動かない場合があります。
もしユーザー名に日本語を含んでいる場合、インストール先を変更しましょう。

Next」ボタンを押します。

Add Anaconda3 to my PATH environment variable」にはチェックを入れないほうがよいそうです。
システムにすでにPythonがインストール済みの場合は「Register Anaconda3 as my default Python 3.8」のチェックを外しておいてください。

Install」ボタンを押すとインストールが開始されます。

Next」ボタンを押します。

インストールが完了しました。
Next」ボタンを押します。

とりあえずチェックは全て外して「Finish」ボタンを押します。

仮想環境作成

次に仮想環境を作成します。

仮想環境とは

ここでいう仮想環境とは、仮想的なPython実行環境を指します。

一般的に、開発アプリケーションによって必要なライブラリは異なります。

今回はクローリング&スクレイピング用のライブラリを導入しますが、ディープラーニング目的であればそれ用のライブラリを導入することになります。

Pythonの実行環境が一つしかない場合、各アプリケーションのために導入したライブラリでごちゃごちゃとしてしまいます。

そこで開発アプリケーションごと専用のなPythonの実行環境を作ってあげる方法が思いつきます。

これが仮想環境と呼ばれるもので、定義をファイルに書き出して別のパソコンに移すなんてことも可能です。

Python標準で仮想環境をサポートしていますが、今回はAnacondaの仮想環境機能を使っていきます。

仮想環境作成方法

まずAnacondaを起動します。

スタートメニューに「Anaconda Navigator」が登録されているので、クリックします。

初回起動の場合は少し時間がかかります。

次のような画面が表示されます。
左側のメニューから「Environments」をクリックします。

Create」をクリックします。

仮想環境の名前を入力し、「Python」にチェックが入った状態で「Create」ボタンを押します。

仮想環境が出来上がりました。

作成した仮想環境が自動的に実行状態になります。

仮想環境の切り替えは、別の環境(上記だとbaseやanaconda3)をクリックするだけです。

まとめ

今回は「クローリング スクレイピングに向けたPython開発環境を構築」という内容でお伝えしました。

今回の学び

  • Anacondaを使うとPyton開発環境が簡単に構築できる
  • 仮想環境を使うとアプリケーションごとに専用の環境が用意できる

次回はAnacondaにスクレイピング用ライブラリの導入を行っていく予定です。

この記事が皆さんのお役に立てば幸いです。

最新情報をチェックしよう!