パンダの列の名前を変更する:初心者向けガイド
そのため、PythonPandasデータフレームの列の名前を変更する必要があります。それは可能ですか?はい、そうです。 rename()
を使用します 個々の列の名前を変更するメソッドまたは「columns」属性を使用して、新しい列ヘッダーのセットをデータフレームに割り当てます。
このガイドでは、Pandasデータフレームの個々の列と複数の列の名前を変更する方法について説明します。これらのテクニックを使い始めるのに役立つ2つの例を紹介します。
パンダの単一の列の名前を変更する
Pandasデータフレームは、データを格納するグリッドです。データは、行と列を使用してテーブルに格納されます。データフレームの各軸には独自のラベルがあります。
rename()
を使用して単一の列の名前を変更します 関数。このメソッドを使用すると、新しい列を作成せずに列見出しを変更できるので便利です。
Pandasデータフレームオブジェクトを見てください:
import pandas as pd books = { "name": ["The Great Gatsby", "To Kill a Mockingbird", "The Count of Monte Cristo"], "author": ["F. Scott Fitzgerald", "Harper Lee", "Alexandre Dumas"], "sold": [42, 53, 39] } books_frame = pd.DataFrame(books)
「name」、「author」、および「sold」は列見出しです。このデータフレームには、3つの列と3つの行があります。コンソールに印刷することでデータフレームを確認できます。
print(books_frame)
データフレームは期待どおりに表示されます。
| 名前 | 作成者 | 販売済み |
グレートギャツビー | F。スコットフィッツジェラルド | 42 | |
1 | アラバマ物語を殺す | ハーパーリー | 53 |
2 | モンテクリストの数 | アレクサンドルデュマ | 39 |
参加者の81%は、ブートキャンプに参加した後、自分たちの技術的な仕事の見通しについてより自信を持っていると述べました。今日のブートキャンプにマッチしましょう。
平均的なブートキャンプの卒業生は、ブートキャンプの開始から最初の仕事を見つけるまで、キャリアの移行に6か月も費やしませんでした。
次に、列の名前を「販売済み」から「コピー販売済み」に変更します。これは、rename()
を使用して行うことができます 方法:
books_frame.rename(columns = {"sold": "copies sold"}, inplace=True)
rename()
で1つのパラメーターを指定します メソッド:列。このパラメーターは、名前を変更する列のリストを受け入れます。
また、columnsパラメーターの値としてディクショナリを指定します。 「販売済み」とは、名前を変更する列の名前を指します。 「販売されたコピー」とは、古い名前を置き換える名前を指します。
コードを実行して、列のリストをコンソールに出力してみましょう:
books_frame.rename(columns = {"copies": "copies sold"}, inplace=True) print(books_frame.columns)
コードは次のようになります:
Index(['name', 'author', 'copies sold'], dtype='object')
「販売済み」列の名前が「販売済みコピー」に変更されました。
パンダの複数の列の名前を変更する
rename()
を使用します 複数の列の名前を変更するメソッド。これを行うには、「columns」パラメーターに割り当てられたディクショナリに複数の列値を指定します。
「name」ヘッダーを「BookName」に変更し、「sold」を「CopiesSold」に変更しましょう:
books_frame.rename(columns= { "sold": "Book Name", "name": "Book Name" }, inplace=True) print(books_frame.columns)
rename()
メソッドは列の名前を変更します。私たちのコードは次を返します:
Index(['Book Name', 'author', 'Book Name'], dtype='object') "name" and "sold" are renamed. "author" remains the same.
パンダのすべての列の名前を変更
「columns」属性に新しい列見出しのリストを割り当てることにより、Pandasデータフレームのすべての列の名前を変更します。このアプローチは、テーブル内のすべての列の名前を変更する場合にのみ機能します。名前を同じにする必要がある列を除外することはできません。
最後の例の列見出しを見直します。
- 「名前」は「本のタイトル」になります
- 「作成者」は「作成者名」になる必要があります
- 「コピー」は「販売されたコピーの数」になる必要があります
データフレームにこれらの変更を加えます。まず、新しい列名でリストを作成し、それを「columns」属性変数に割り当てます。
books_frame.columns = ["Book Title", "Author Name", "Number of Copies Sold"] print(books_frame.columns)
コードは次のようになります:
Index(['Book Title', 'Author Name', 'Number of Copies Sold'], dtype='object')
コードによってすべての列の名前が変更されました。
結論
rename()
メソッドを使用すると、Pandasの1つ以上の列名の名前を変更できます。 「columns」属性の値を再割り当てすることにより、Pandasデータフレームでこれを行います。
これで、専門家のようにパンダの列の名前を変更する準備が整いました!
-
PythonPandasの列で階層化された箱ひげ図
Pythonクラスの列で階層化された箱ひげ図を作成するには、次の手順を実行できます- ステップ 図のサイズを設定し、サブプロット間およびサブプロットの周囲のパディングを調整します。 2次元、サイズ変更可能、潜在的に異種の表形式データのPandasデータフレームを作成します。 データセットのヒストグラムを計算します。 列で始まる箱ひげ図を作成します。 図を表示するには、 show()を使用します メソッド。 例 import pandas as pd import numpy as np from matplotlib import pyplot as plt
-
パンダのCSVファイルのインデックス番号で列名の名前を変更します
columns.values()を使用すると、CSVファイルのインデックス番号で列名の名前を簡単に変更できます。 以下は、MicrosoftExcelで開いたCSVファイルの内容であるとしましょう- 列名の名前を変更します。最初に、CSVファイルからPandasDataFrameにデータをロードします- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") CSVからすべての列名を表示- dataFrame.columns 次に、列名の名前を変更します- dataFrame.co