deepblueインターン生の中山です. 前回Colaboratoryを使ったword2vecについての記事を書いたのですが,その関連記事になります.ちょっとしたtipsの様な内容です.
 ( 注:2019年10月7日時点での記事になります.Colaboratoryが更新されて仕様が変わることもあるので,ご了承ください. )

[toc]

対象の読者

  • Google Colaboratory 初心者
  • データを毎回ローカルからアップロードするのがめんどくさいと感じている方

前回まで

 前回までは,ローカル環境からデータをあげて読み込んでいました.本当は前の記事で説明しても良かったのですが,本質的ではないので省いてしまいました.
 ローカルのアップロードをコードで書くとこのような感じです.

from google.colab import files
uploaded = files.upload()

 これで,ローカルからデータをアップロードすることができました.

 このやり方も間違ってはいないのですが,毎回毎回アップロードするのはめんどくさいです.そこで,Driveから簡単に落とす方法があります.そのやり方について以下に書きます.

Driveから落とす手順

データをDriveにアップロード

 まず,当たり前なのですが, Drive上の任意の場所にデータをアップロードします.今回は,同じディレクトリ内に置いておきます.

Driveをマウント

 次にDriveのマウントを行います.Colaboiratoryの左端に大なりのようなマークがあると思います.それをクリックします.

 これをクリックすると,左側に『ドライブをマウント』というボタンが出てくると思います.それをクリックします.

 すると,以下のような新たなセルができることが確認できます.

from google.colab import drive
drive.mount('/content/drive')

 これを,実行するとこのようなURLが登場すると思います.

 このURLをクリックします.すると,認証のページに飛ぶと思うので,認証を行います.そこで,authorization codeが得られるので,下の枠内に張り付けてください.

 左側を確認すると『 drive』ができていることがわかります.これで,マウントが完了となります.

データの読み込み

 これを押して自分の欲しいデータの場所まで移動します.データを見つけたら,右クリックからパスのコピーを選択します.

 これで,あとは通常通りデータを読み込むだけです.データを読み込む際にコピーしたパスを利用します.

import pandas as pd
data = pd.read_csv('/content/drive/My Drive/nakayama/blog/iris.data', header=None)

まとめ

 以上で,ColaboratoryのデータをDriveから読み込むことができます.毎回データを読み込むのが煩わしい方などは試してみてください.

(著:中山 翔太)

Deepblueでは統計やAIの平和的活用を一緒に取り組んでいただける方を募集してます。詳しくはRecruitをご覧ください。

関連記事