Python
 Computer >> コンピューター >  >> プログラミング >> Python

PythonPandas-合計に基づいてDataFrameからいくつかの行をフィルタリングする


合計に基づいてDataFrameからいくつかの行をフィルタリングするために、StudentMarksを使用した例を検討しました。合計が200を超える特定の主題の合計を計算する必要があります。つまり、その特定の主題の3人の学生すべての合計が200を超えます。このようにして、合計が200未満の行を適合させることができます。

>

最初に、3つの列を持つDataFrame、つまり3人の学生のレコードを作成しましょう-

dataFrame = pd.DataFrame({'Jacob_Marks': [95, 90, 70, 85, 88],'Ted_Marks': [60, 50, 65, 85, 70],'Jamie_Marks': [77, 76, 60, 45, 50]})

行に基づくフィルタリング。 3人の生徒全員の合計が200を超える行をフェッチする-

dataFrame = dataFrame[dataFrame.sum(axis=1) > 200]

以下は完全なコードです-

import pandas as pd

# create a dataframe with 3 columns
dataFrame = pd.DataFrame({'Jacob_Marks': [95, 90, 70, 85, 88],'Ted_Marks': [60, 50, 65, 85, 70],'Jamie_Marks': [77, 76, 60, 45, 50]})

print"Dataframe...\n",dataFrame

# filtering on the basis of rows
# fetching rows with total greater than 200 for all the 3 students
dataFrame = dataFrame[dataFrame.sum(axis=1) > 200]

# dataframe
print"Updated Dataframe...\n",dataFrame

出力

これにより、次の出力が生成されます-

Dataframe...
   Jacob_Marks  Jamie_Marks   Ted_Marks
0           95           77         60
1           90           76         50
2           70           60         65
3           85           45         85
4           88           50         70
Updated Dataframe...
   Jacob_Marks   Jamie_Marks   Ted_Marks
0           95            77         60
1           90            76         50
3           85            45         85
4           88            50         70

  1. PythonPandas-データフレームから行のサブセットを選択します

    行のサブセットを選択するには、条件を使用してデータをフェッチします。 以下は、MicrosoftExcelで開いたCSVファイルの内容であるとしましょう- 最初に、CSVファイルからPandasDataFrameにデータをロードします- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") 「Units」が100を超えるCarレコード、つまり行のサブセットが必要だとします。これには、-を使用します dataFrame[dataFrame["Units"] >

  2. Python-PandasDataFrameからnull行を削除する方法

    Pandas DataFrameのnull行を削除するには、dropna()メソッドを使用します。以下が、いくつかのNaN、つまりnull値を含むCSVファイルであるとしましょう- read_csv()を使用してCSVファイルを読み取ってみましょう。 CSVはデスクトップにあります- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") dropna()-を使用してnull値を削除します dataFrame = dataFrame.dropna() 例 以下は完全なコードです-