Python
 Computer >> コンピューター >  >> プログラミング >> Python

Pythonの既存のデータフレームに新しい列を追加するにはどうすればよいですか?


データフレームは2次元のデータ構造であり、データは行と列の形式で表形式で保存されます。

SQLデータテーブルまたはExcelシート表現として視覚化できます。次のコンストラクターを使用して作成できます-

pd.Dataframe(data, index, columns, dtype, copy)

新しい列は、さまざまな方法でデータフレームに追加できます。

最初に一連のデータ構造を形成し、これを追加の列として既存のデータフレームに渡すことによって、新しい列が作成される方法の1つを見てみましょう。

動作中のコードを見てみましょう-

import pandas as pd
my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']),
'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd'])}
my_df = pd.DataFrame(my_data)
print("The dataframe is :")
print(my_df)
print ("Adding a new column to the dataframe by passing it as a Series structure :")
my_df['ef']=pd.Series([56, 78, 32],index=['a','b','c'])
print("After adding a new column to the dataframe, :")
print(my_df)

出力

The dataframe is :
   ab   cd
a  1.0  1
b  8.0  2
c  7.0  0
d  NaN  9
Adding a new column to the dataframe by passing it as a Series structure :
After adding a new column to the dataframe, :
    ab  cd  ef
a  1.0  1   56.0
b  8.0  2  78.0
c  7.0  0  32.0
d  NaN  9  NaN

説明

  • 必要なライブラリがインポートされ、使いやすいようにエイリアス名が付けられています。

  • キーと値のペアが1つのディクショナリに存在するディクショナリデータ構造が作成されます。

  • このようにして、複数の辞書が作成され、リストに保存されます。

  • キーと値のペアの「値」は、実際にはシリーズデータ構造です。

  • インデックスは、カスタマイズされた値のリストでもあります。

  • この辞書は、後で「パンダ」ライブラリにある「データフレーム」関数にパラメータとして渡されます

  • データフレームは、ディクショナリ値のリストをパラメータとして渡すことによって作成されます。

  • 別の新しい列が作成され、その列に値が初期化されます。

  • この新しい列は、元のデータフレームにインデックス付けされます。

  • このようにして、新しい列がデータフレームにバインドされます。

  • データフレームはコンソールに印刷されます。

−「NaN」という単語は「数値ではない」を意味します。これは、特定の[row、col]値に有効なエントリがないことを意味します。


  1. Python Pandasでデータフレーム列の値をX軸ラベルとして設定するにはどうすればよいですか?

    Python Pandasでデータフレーム列の値をX軸ラベルとして設定するには、 xticksを使用できます。 plot()の引数で メソッド。 ステップ 図のサイズを設定し、サブプロット間およびサブプロットの周囲のパディングを調整します。 column1キーのパンダを使用してデータフレームを作成します 。 plot()を使用してPandasデータフレームをプロットします X軸の列としてcolumn1を使用するメソッド。 図を表示するには、 show()を使用します メソッド。 例 import pandas as pd from matplotlib impo

  2. Pythonのscikit-learnでグレースケール画像に特定の色合いを追加するにはどうすればよいですか?

    「R」、「G」、「B」の値が変更され、元の画像に適用されて、必要な色合いが得られます。 以下は、scikit-learnを使用して同じものを実装するPythonプログラムです。 Scikit-learnは、一般にsklearnとして知られ、機械学習アルゴリズムを実装する目的で使用されるPythonのライブラリです- 例 import matplotlib.pyplot as plt from skimage import data from skimage import color path = "path to puppy_1.jpg" orig_img = io.im