Pandas Pythonでデータフレームの数値を含む列の平均を取得するにはどうすればよいですか?
特定の列の平均値、または数値を含むすべての列の平均値を取得する必要がある場合があります。ここで、mean()関数を使用できます。
「平均」という用語は、すべての値の合計を求め、それをデータセット内の値の総数で割ることを意味します。
同じのデモンストレーションを見てみましょう-
例
import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']), 'Age':pd.Series([45, 67, 89, 12, 23]), 'value':pd.Series([8.79,23.24,31.98,78.56,90.20]) } print("The dataframe is :") my_df = pd.DataFrame(my_data) print(my_df) print("The mean is :") print(my_df.mean())
出力
The dataframe is : Name Age value 0 Tom 45 8.79 1 Jane 67 23.24 2 Vin 89 31.98 3 Eve 12 78.56 4 Will 23 90.20 The mean is : Age 47.200 value 46.554 dtype: float64
説明
-
必要なライブラリがインポートされ、使いやすいようにエイリアス名が付けられています。
-
キーと値で構成されるシリーズの辞書が作成されます。値は実際にはシリーズのデータ構造です。
-
この辞書は、後で「パンダ」ライブラリにある「データフレーム」関数にパラメータとして渡されます
。 -
データフレームはコンソールに印刷されます。
-
数値を含むすべての列の平均を計算することを検討しています。
-
「平均」関数は、ドット演算子を使用してデータフレームで呼び出されます。
-
数値列の平均がコンソールに出力されます。
-
Python-Pandasデータフレームの列のNaNオカレンスをカウントする方法は?
列内のNaNの出現をカウントするには、isna()を使用します。 sum()を使用して値を加算し、カウントを見つけます。 まず、必要なライブラリをそれぞれのエイリアスとともにインポートしましょう- import pandas as pd import numpy as np DataFrameを作成します。 「Units_Sold」列のNumpynp.infを使用してNaN値を設定しました- dataFrame = pd.DataFrame({"Car": ['BMW', 'Lexus', 'Tesla', 'Mu
-
Python-PandasDataFrameからnull行を削除する方法
Pandas DataFrameのnull行を削除するには、dropna()メソッドを使用します。以下が、いくつかのNaN、つまりnull値を含むCSVファイルであるとしましょう- read_csv()を使用してCSVファイルを読み取ってみましょう。 CSVはデスクトップにあります- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") dropna()-を使用してnull値を削除します dataFrame = dataFrame.dropna() 例 以下は完全なコードです-