私はExcelファイルを使ってPythonで作成したデータを保存したいと思っています。問題は、既存のExcelファイルにシートを追加できないことです。ここでは、この問題を解決するためのサンプルコードを提案します。
import pandas as pd
import numpy as np
path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx"
x1 = np.random.randn(100, 2)
df1 = pd.DataFrame(x1)
x2 = np.random.randn(100, 2)
df2 = pd.DataFrame(x2)
writer = pd.ExcelWriter(path, engine = 'xlsxwriter')
df1.to_excel(writer, sheet_name = 'x1')
df2.to_excel(writer, sheet_name = 'x2')
writer.save()
writer.close()
このコードは、2 つの DataFrame をそれぞれ「x1」と「x2」という名前の 2 つのシートに保存します。2 つの新しい DataFrame を作成し、同じコードを使用して 2 つの新しいシート「x3」と「x4」を追加しようとすると、元のデータが失われます。
import pandas as pd
import numpy as np
path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx"
x3 = np.random.randn(100, 2)
df3 = pd.DataFrame(x3)
x4 = np.random.randn(100, 2)
df4 = pd.DataFrame(x4)
writer = pd.ExcelWriter(path, engine = 'xlsxwriter')
df3.to_excel(writer, sheet_name = 'x3')
df4.to_excel(writer, sheet_name = 'x4')
writer.save()
writer.close()
4 つのシート ('x1'、'x2'、'x3'、'x4') を含む Excel ファイルが必要です。'xlsxwriter' が唯一の「エンジン」ではなく、'openpyxl' があることは知っています。この問題についてすでに他の人が書いていることも知りましたが、それでもやり方がわかりません。
ここから抜粋したコードリンク
import pandas
from openpyxl import load_workbook
book = load_workbook('Masterfile.xlsx')
writer = pandas.ExcelWriter('Masterfile.xlsx', engine='openpyxl')
writer.book = book
writer.sheets = dict((ws.title, ws) for ws in book.worksheets)
data_filtered.to_excel(writer, "Main", cols=['Diff1', 'Diff2'])
writer.save()
動作すると言われていますが、どのように動作するのか理解するのは困難です。このコンテキストで「ws.title」、「ws」、および「dict」が何なのか理解できません。
「x1」と「x2」を保存し、ファイルを閉じて再度開き、「x3」と「x4」を追加する最適な方法はどれですか?
ベストアンサー1
ありがとうございます。同じ問題を抱えている他の人にとって、完全な例が役に立つと思います。
import pandas as pd
import numpy as np
path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx"
x1 = np.random.randn(100, 2)
df1 = pd.DataFrame(x1)
x2 = np.random.randn(100, 2)
df2 = pd.DataFrame(x2)
writer = pd.ExcelWriter(path, engine = 'xlsxwriter')
df1.to_excel(writer, sheet_name = 'x1')
df2.to_excel(writer, sheet_name = 'x2')
writer.close()
ここでは Excel ファイルを生成しますが、私の理解では、それが「xslxwriter」エンジンまたは「openpyxl」エンジンのどちらで生成されるかは実際には問題ではありません。
元のデータを失わずに書き込みたいときは
import pandas as pd
import numpy as np
from openpyxl import load_workbook
path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx"
book = load_workbook(path)
writer = pd.ExcelWriter(path, engine = 'openpyxl')
writer.book = book
x3 = np.random.randn(100, 2)
df3 = pd.DataFrame(x3)
x4 = np.random.randn(100, 2)
df4 = pd.DataFrame(x4)
df3.to_excel(writer, sheet_name = 'x3')
df4.to_excel(writer, sheet_name = 'x4')
writer.close()
このコードは役に立ちます!