Colab: 三種保存Pandas DataFrame內容的方法

Table of Contents

Table of Contents


本文將會示範三種保存Pandas DataFrame內容的方法

  • 下載成CSV格式的檔案。
  • 儲存為CSV格式檔案到Google硬碟上。
  • 儲存為Google試算表(Spreadsheet)檔案到Google硬碟上。

Youtube

下載成CSV格式的檔案

使用DataFrame的to_csv方法將DataFrame的內容轉成CSV檔案。
之後使用files.download方法讓程式來執行檔案下載。

from google.colab import files

df.to_csv('output.csv', encoding = 'utf-8-sig') 
files.download('output.csv')

儲存為CSV格式檔案到Google硬碟上

首先,必須先導入drive程式庫,然後執行mount方法。
這裡會將我的Google硬碟對應至/content/drive的路徑下。

第二步,使用open方法開啟檔案,並將其作為to_csv方法的參數去執行產生CSV檔案。

from google.colab import drive

drive.mount('/content/drive')
path = '/content/drive/MyDrive/output.csv'

with open(path, 'w', encoding = 'utf-8-sig') as f:
  df.to_csv(f)

儲存為Google試算表(Spreadsheet)檔案到Google硬碟上

這裡將使用gspread程式庫來幫助我處理google試算表。
所以要先導入gspread程式庫並執行認證
(關於gspread詳細的使用方式,可以參考Google Colab: 用gspread處理Google Spreadsheet的資料)

之後,需要一個試算表用來保存資料,所以準備一個試算表後取得他的key
在下面的程式碼中,直接將DataFrame內的資料存放到試算表中從sheet1!A1開始的位置。

!pip install gspread

from google.colab import auth
from oauth2client.client import GoogleCredentials
import gspread
import pandas as pd

# Auth
auth.authenticate_user()
gc = gspread.authorize(GoogleCredentials.get_application_default())

spreadsheet_key = 'my_spreadsheet_key'
workbook = gc.open_by_key(spreadsheet_key)

workbook.values_update(
  'sheet!A1',
  params={
      'valueInputOption': 'USER_ENTERED'
  },
  body={
      'values': [df.columns.values.tolist()] + df.values.tolist()
  }
)

以上就是本文所示範的三種方式。
希望對你有所幫助。