Pandas Pythonでデータフレーム内の特定の列の標準偏差を見つける方法は?
標準偏差は、データセット内の値がどのように分散しているかを示します。また、データセット内の値がデータセット内の列の算術平均からどれだけ離れているかも示します。
場合によっては、本質的に数値である特定の列の標準偏差を取得する必要があります。ここでstd()関数を使用できます。平均を計算する必要のある列にデータフレームのインデックスを付けることができ、ドット演算子を使用して平均関数を呼び出すことができます。
列のインデックスを渡して、標準偏差を見つけることもできます。
同じのデモンストレーションを見てみましょう-
例
import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])} print("The dataframe is :") my_df = pd.DataFrame(my_data) print(my_df) print("The standard deviation of column 'Age' is :") print(my_df['Age'].std()) print("The standard deviation of column 'value' is :") print(my_df['value'].std())
出力
The dataframe is : Name Age value 0 Tom 45 8.79 1 Jane 67 23.24 2 Vin 89 31.98 3 Eve 12 78.56 4 Will 23 90.20 The standard deviation of column 'Age' is : 31.499206339207976 The standard deviation of column 'value' is : 35.747101700697364>
説明
-
必要なライブラリがインポートされ、使いやすいようにエイリアス名が付けられています。
-
キーと値で構成されるシリーズの辞書が作成されます。値は実際にはシリーズのデータ構造です。
-
この辞書は、後で「パンダ」ライブラリにある「データフレーム」関数にパラメータとして渡されます
。 -
データフレームはコンソールに印刷されます。
-
数値を含む特定の列の標準偏差を計算することを検討しています。
-
「std」関数は、ドット演算子を使用して列の名前を指定することにより、データフレームで呼び出されます。
-
数値列の標準偏差がコンソールに出力されます。
-
Python Pandas –単一の列から一意の値を検索します
単一の列から一意の値を見つけるには、unique()メソッドを使用します。 Pandas DataFrameに従業員レコードがあるとします。2人の従業員が同じような名前を持つ可能性があるため、名前が繰り返される可能性があります。その場合、一意の従業員名が必要な場合は、DataFrameにunique()を使用してください。 まず、必要なライブラリをインポートします。ここでは、pdをエイリアスとして設定しています- import pandas as pd まず、DataFrameを作成します。ここでは、2つの列があります- dataFrame = pd.DataFrame( &
-
Python-PandasDataFrameからnull行を削除する方法
Pandas DataFrameのnull行を削除するには、dropna()メソッドを使用します。以下が、いくつかのNaN、つまりnull値を含むCSVファイルであるとしましょう- read_csv()を使用してCSVファイルを読み取ってみましょう。 CSVはデスクトップにあります- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") dropna()-を使用してnull値を削除します dataFrame = dataFrame.dropna() 例 以下は完全なコードです-