Python-PandasDataFrameの列名と行インデックスを変更します
Pandasは、Python標準ライブラリでは利用できないデータ分析のための多くの機能を提供するPythonライブラリです。そのような機能の1つは、データフレームの使用です。それらは、列と行を表す長方形のグリッドです。データフレームを作成するときに、列の名前を決定し、その後のデータ操作でそれらを参照します。ただし、データフレームの作成後に列の名前を変更する必要がある場合があります。この記事では、それを実現する方法を説明します。
rename()の使用
この方法を使用して列と行の両方のインデックスを変更できるため、これが最も推奨される方法です。古い値と新しい値をキーと値のペアのディクショナリとしてこのメソッドに渡し、データフレームを新しい名前で保存します。
例
import pandas as pd df = pd.DataFrame({ 'ColumnA': [23, 92, 32], 'ColumnB': [54, 76, 43], 'ColumnC': [16, 45, 10] }, index=['10-20', '20-30', '30-40']) df_renamed = df.rename(columns={'ColumnA': 'Col1', 'ColumnB': 'Col2', 'ColumnC': 'Col3'}, index={'10-20': '1', '20-30': '2', '30-40': '3'}) print(df) print("\n",df_renamed)
出力
上記のコードを実行すると、次の結果が得られます。
ColumnA ColumnB ColumnC 10-20 23 54 16 20-30 92 76 45 30-40 32 43 10 Col1 Col2 Col3 1 23 54 16 2 92 76 45 3 32 43 10
df.columnsの使用
df.columnsには、新しい列名を直接割り当てることができます。データフレームが再度使用されると、新しい列名が参照されます。
例
import pandas as pd df = pd.DataFrame({ 'ColumnA': [23, 92, 32], 'ColumnB': [54, 76, 43], 'ColumnC': [16, 45, 10] }, index=['10-20', '20-30', '30-40']) df.columns=["Length","Breadth","Depth"] print(df)
出力
上記のコードを実行すると、次の結果が得られます。
Length Breadth Depth 10-20 23 54 16 20-30 92 76 45 30-40 32 43 10
プレフィックスを追加することにより
Pandasデータフレームは、列名にプレフィックスとサフィックスを追加するためのメソッドを提供します。このメソッドを使用して、各列名に追加される目的のプレフィックスを追加するだけです。
例
import pandas as pd df = pd.DataFrame({ 'ColA': [23, 92, 32], 'ColB': [54, 76, 43], 'ColC': [16, 45, 10] }, index=['10-20', '20-30', '30-40']) print(df.add_prefix('Jan-'))
出力
上記のコードを実行すると、次の結果が得られます。
Jan-ColA Jan-ColB Jan-ColC 10-20 23 54 16 20-30 92 76 45 30-40 32 43 10
-
PythonのPandasDataFrameのすべての行に関数を適用します
このチュートリアルでは、リストの最も一般的な方法について学習します。 つまり、 append() およびextend() 。それらを1つずつ見てみましょう。 apply() これは、DataFrameのすべての行に関数を適用するために使用されます。たとえば、それぞれの数値をすべて乗算して新しい列として追加する場合は、apply()メソッドが役立ちます。それを達成するためのさまざまな方法を見てみましょう。 例 #pandas packageimport pandas as pd#function to multiplydef multiply(x、y):return x * y#dataFr
-
Pythonでのデータ分析と視覚化?
Pythonは、主にnumpy、pandas、matplotlib、seabornなどのデータ分析と視覚化のための多数のライブラリを提供します。このセクションでは、numpyの上に構築されたオープンソースライブラリであるデータ分析と視覚化のためのpandasライブラリについて説明します。 これにより、迅速な分析とデータのクリーニングと準備を行うことができます。Pandasには、以下で説明する多数の組み込みの視覚化機能も用意されています。 インストール パンダをインストールするには、ターミナルで以下のコマンドを実行します- pipinstall pandas Orweにはanacondaが