Python
 Computer >> コンピューター >  >> プログラミング >> Python

Pandas Pythonでデータフレームの数値を含む列の平均を取得するにはどうすればよいですか?


特定の列の平均値、または数値を含むすべての列の平均値を取得する必要がある場合があります。ここで、mean()関数を使用できます。

「平均」という用語は、すべての値の合計を求め、それをデータセット内の値の総数で割ることを意味します。

同じのデモンストレーションを見てみましょう-

import pandas as pd
my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),
'Age':pd.Series([45, 67, 89, 12, 23]),
'value':pd.Series([8.79,23.24,31.98,78.56,90.20])
}
print("The dataframe is :")
my_df = pd.DataFrame(my_data)
print(my_df)
print("The mean is :")
print(my_df.mean())

出力

The dataframe is :
   Name Age  value
0  Tom  45   8.79
1  Jane 67   23.24
2  Vin  89   31.98
3  Eve  12   78.56
4  Will 23  90.20
The mean is :
Age    47.200
value  46.554
dtype: float64

説明

  • 必要なライブラリがインポートされ、使いやすいようにエイリアス名が付けられています。

  • キーと値で構成されるシリーズの辞書が作成されます。値は実際にはシリーズのデータ​​構造です。

  • この辞書は、後で「パンダ」ライブラリにある「データフレーム」関数にパラメータとして渡されます

  • データフレームはコンソールに印刷されます。

  • 数値を含むすべての列の平均を計算することを検討しています。

  • 「平均」関数は、ドット演算子を使用してデータフレームで呼び出されます。

  • 数値列の平均がコンソールに出力されます。


  1. Python-Pandasデータフレームの列のNaNオカレンスをカウントする方法は?

    列内のNaNの出現をカウントするには、isna()を使用します。 sum()を使用して値を加算し、カウントを見つけます。 まず、必要なライブラリをそれぞれのエイリアスとともにインポートしましょう- import pandas as pd import numpy as np DataFrameを作成します。 「Units_Sold」列のNumpynp.infを使用してNaN値を設定しました- dataFrame = pd.DataFrame({"Car": ['BMW', 'Lexus', 'Tesla', 'Mu

  2. Python-PandasDataFrameからnull行を削除する方法

    Pandas DataFrameのnull行を削除するには、dropna()メソッドを使用します。以下が、いくつかのNaN、つまりnull値を含むCSVファイルであるとしましょう- read_csv()を使用してCSVファイルを読み取ってみましょう。 CSVはデスクトップにあります- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") dropna()-を使用してnull値を削除します dataFrame = dataFrame.dropna() 例 以下は完全なコードです-