Google スプレッドシートを Python のオブジェクトとしてダウンロードしました。
最初にディスクに保存せずに、openpyxl を使用してワークブックを使用するにはどうすればよいですか?
xlrd がこれを実行できることはわかっています:
book = xlrd.open_workbook(file_contents=downloaded_spreadsheet.read())
「downloaded_spreadsheet」は、ダウンロードした xlsx ファイルをオブジェクトとして表します。
xlrd の代わりに、xlsx のサポートが優れている (と読んだ) ため、openpyxl を使用したいと思います。
今のところこれを使っています...
#!/usr/bin/python
import openpyxl
import xlrd
# which to use..?
import re, urllib, urllib2
class Spreadsheet(object):
def __init__(self, key):
super(Spreadsheet, self).__init__()
self.key = key
class Client(object):
def __init__(self, email, password):
super(Client, self).__init__()
self.email = email
self.password = password
def _get_auth_token(self, email, password, source, service):
url = "https://www.google.com/accounts/ClientLogin"
params = {
"Email": email, "Passwd": password,
"service": service,
"accountType": "HOSTED_OR_GOOGLE",
"source": source
}
req = urllib2.Request(url, urllib.urlencode(params))
return re.findall(r"Auth=(.*)", urllib2.urlopen(req).read())[0]
def get_auth_token(self):
source = type(self).__name__
return self._get_auth_token(self.email, self.password, source, service="wise")
def download(self, spreadsheet, gid=0, format="xls"):
url_format = "https://spreadsheets.google.com/feeds/download/spreadsheets/Export?key=%s&exportFormat=%s&gid=%i"
headers = {
"Authorization": "GoogleLogin auth=" + self.get_auth_token(),
"GData-Version": "3.0"
}
req = urllib2.Request(url_format % (spreadsheet.key, format, gid), headers=headers)
return urllib2.urlopen(req)
if __name__ == "__main__":
email = "[email protected]" # (your email here)
password = '.....'
spreadsheet_id = "......" # (spreadsheet id here)
# Create client and spreadsheet objects
gs = Client(email, password)
ss = Spreadsheet(spreadsheet_id)
# Request a file-like object containing the spreadsheet's contents
downloaded_spreadsheet = gs.download(ss)
# book = xlrd.open_workbook(file_contents=downloaded_spreadsheet.read(), formatting_info=True)
#It works.. alas xlrd doesn't support the xlsx-funcionality that i want...
#i.e. being able to read the cell-colordata..
Google スプレッドシートの特定のセルからカラーデータを取得するのに何ヶ月も苦労しているので、どなたか助けていただければ幸いです。(Google API がサポートしていないことは承知しています。)
ベストアンサー1
ドキュメントにはload_workbook
次のように書かれています:
#:param filename: the path to open or a file-like object
..だから、いつでもそれが可能でした。パスを読み込むか、ファイルのようなオブジェクトを受け取ります。 によって返されたファイルのようなオブジェクトを次urlopen
のように に変換するだけで済みましたbytestream
。
from io import BytesIO
wb = load_workbook(filename=BytesIO(input_excel.read()))
Google スプレッドシート内のすべてのデータを読み取ることができます。