deepblueインターン生の中山です. 前回Colaboratoryを使ったword2vecについての記事を書いたのですが,その関連記事になります.ちょっとしたtipsの様な内容です.
( 注:2019年10月7日時点での記事になります.Colaboratoryが更新されて仕様が変わることもあるので,ご了承ください. )
[toc]
対象の読者
- Google Colaboratory 初心者
- データを毎回ローカルからアップロードするのがめんどくさいと感じている方
前回まで
前回までは,ローカル環境からデータをあげて読み込んでいました.本当は前の記事で説明しても良かったのですが,本質的ではないので省いてしまいました.
ローカルのアップロードをコードで書くとこのような感じです.
from google.colab import files
uploaded = files.upload()
これで,ローカルからデータをアップロードすることができました.

このやり方も間違ってはいないのですが,毎回毎回アップロードするのはめんどくさいです.そこで,Driveから簡単に落とす方法があります.そのやり方について以下に書きます.
Driveから落とす手順
データをDriveにアップロード
まず,当たり前なのですが, Drive上の任意の場所にデータをアップロードします.今回は,同じディレクトリ内に置いておきます.
Driveをマウント
次にDriveのマウントを行います.Colaboiratoryの左端に大なりのようなマークがあると思います.それをクリックします.

これをクリックすると,左側に『ドライブをマウント』というボタンが出てくると思います.それをクリックします.

すると,以下のような新たなセルができることが確認できます.
from google.colab import drive
drive.mount('/content/drive')
これを,実行するとこのようなURLが登場すると思います.

このURLをクリックします.すると,認証のページに飛ぶと思うので,認証を行います.そこで,authorization codeが得られるので,下の枠内に張り付けてください.

左側を確認すると『 drive』ができていることがわかります.これで,マウントが完了となります.

データの読み込み
これを押して自分の欲しいデータの場所まで移動します.データを見つけたら,右クリックからパスのコピーを選択します.

これで,あとは通常通りデータを読み込むだけです.データを読み込む際にコピーしたパスを利用します.
import pandas as pd
data = pd.read_csv('/content/drive/My Drive/nakayama/blog/iris.data', header=None)
まとめ
以上で,ColaboratoryのデータをDriveから読み込むことができます.毎回データを読み込むのが煩わしい方などは試してみてください.
(著:中山 翔太)
関連記事
Deepblueでは統計やAIの平和的活用を一緒に取り組んでいただける方を募集してます。詳しくはRecruitをご覧ください。