Python
 Computer >> コンピューター >  >> プログラミング >> Python

Pythonでデータフレームの特定の列の平均を取得するにはどうすればよいですか?


場合によっては、本質的に数値である特定の列の平均値を取得する必要があります。ここで「平均」関数を使用できます。

平均を計算する必要のある列にデータフレームのインデックスを付けることができ、ドット演算子を使用して平均関数を呼び出すことができます。

列のインデックスを渡して、平均を見つけることもできます。 mean()という用語は、すべての値の合計を見つけて、それをデータセット内の値の総数で割ることを意味します。

同じのデモンストレーションを見てみましょう-

import pandas as pd
my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])}
print("The dataframe is :")
my_df = pd.DataFrame(my_data)
print(my_df)
print("The mean of column 'Age' is :")
print(my_df['Age'].mean())
print("The mean of column 'value' is :")
print(my_df['value'].mean())

出力

The dataframe is :
   Name  Age   value
0  Tom   45    8.79
1  Jane  67   23.24
2  Vin   89   31.98
3  Eve  12    78.56
4  Will  23   90.20
The mean of column 'Age' is :
47.2
The mean of column 'value' is :
46.553999999999995

説明

  • 必要なライブラリがインポートされ、使いやすいようにエイリアス名が付けられています。

  • キーと値で構成されるシリーズの辞書が作成されます。値は実際にはシリーズのデータ​​構造です。

  • この辞書は、後で「パンダ」ライブラリにある「データフレーム」関数にパラメータとして渡されます

  • データフレームはコンソールに印刷されます。

  • 数値を含む特定の列の平均を計算することを検討しています。

  • 「平均」関数は、ドット演算子を使用して列の名前を指定することにより、データフレームで呼び出されます。

  • 数値列の平均がコンソールに出力されます。


  1. Pythonでホームディレクトリを取得するにはどうすればよいですか?

    Pythonでホームディレクトリを取得するには、osモジュールからos.path.expanduser(〜)を使用できます。これは、〜/ Documents /my_folder/のような長いパスの一部である場合にも機能します。パスに〜がない場合、関数はパスを変更せずに返します。 -のように使用できます import os print(os.path.expanduser('~')) HOME変数の環境変数をクエリすることもできます- import os print(os.environ['HOME'])

  2. Pythonで文字列の長さを取得するにはどうすればよいですか?

    Pythonには、複合オブジェクトの長さを指定するlen()というメソッドがあります。文字列の長さを取得するには、文字列をlen()呼び出しに渡すだけです。たとえば、 print(len('abcdefghijklmnopqrstuvwxyz')) 出力 26