PythonとpandasでCSVファイルを読み込もうとしたら、いつもはうまくいくpd.read_csv()が突然エラーを吐き出して、処理が止まってしまった…。そんな経験はありませんか?特に、様々なシステムから出力された生データを扱う際によく遭遇するのがこの問題です。
PythonにはCSV形式のデータを扱うためのCSVモジュールがあります。ですがデータ処理といえばPandasという有名なライブラリがあります。Pandasはcsvだけでなく、Excel形式のデータ(拡張子が.xls、.xlsxのやつ)、JSONやHTML形式のデータが扱えます。 ではcsvデータ ...
次にCSVファイルをPythonで読み込んで、中身のデータを確認していきます。分析するのは前回の記事でも使ったコンビニエンスストアの売り上げと関連情報をまとめたデータ「sales_data.csv」です。 今回の分析に利用するデータの中身。コンビニエンスストアの ...