こんにちは。新卒3年目のKです。 厳密な定義は一旦置き、本記事で使用するメモリエラーの定義は、「プロセスに割り当てられたメモリ(RAM)の残容量を超えるメモリ使用があった際に起こるエラー(PythonではMemoryErrorと表記)」とします。 メモリエラーの ...
Pythonで、pandasのDataFrameの複数列の文字列を結合する方法を2つご紹介します。 ラベル「Pref」「City」「Town」の列の文字列を結合します。 出力結果は下記です。 戻り値は、Series型です。 出力結果は下記です。 こちらも戻り値は、Series型です。 2.データ内に ...
2日目の基調講演は、 Masaaki Horikoshi氏による 「pandasでのOSS活動事例と最初の一歩」 です。Horikoshi氏はPythonでデータ分析を行う際のパッケージとして有名なpandas、 ならびに並列・ 分散処理するパッケージであるDaskのコア開発メンバーをつとめています。