Python
 Computer >> コンピューター >  >> プログラミング >> Python

Python-PandasDataFrameの行のランキング


提供されたデータフレームの各行のランキングを含む列を追加します。これは、データフレームを並べ替えて、特定の要素のランクを決定するのに役立ちます。たとえば、-

データフレーム

名前の再生時間(時間単位) レート
0 コールオブデューティ 45 平均より良い
1 総過剰摂取 46 良い
2 GTA3 52 ベスト
3 いじめ 22 平均

出力

名前の再生時間(時間単位) レートランキング
0 コールオブデューティ 45 平均より良い 3.0
1 総過剰摂取 46 良い 2.0
2 GTA3 52 ベスト 1.0
3 いじめ 22 平均 4.0

さて、上記の例でわかるように、ランキングは整数ですが、横に小数があります。つまり、実数でもランキングを設定できます。これは、複数の要素が同じランクである場合に発生します。そのような場合よりもデータフレームは、私たちのランキングが要素間で分割されています。したがって、ランクとして実数があります。

データフレームにランクを割り当てるにはどうすればよいですか

データフレームの要素にランクを割り当てるために、 .rank()であるパンダライブラリの組み込み関数を使用します。 働き。要素のランク付けに基づく基準を渡します。この関数は、ランク付けが保存されている各行に新しい列を返します。

.rank()関数を使用するためのコードは

import pandas as pd
games = {'Name' : ['Call Of Duty', 'Total Overdose', 'GTA 3', 'Bully'],
       'Play Time(in hours)' : ['45', '46', '52', '22'],
        'Rate' : ['Better than Average', 'Good', 'Best', 'Average']}
df = pd.DataFrame(games)
df['ranking'] = df['Play Time(in hours)'].rank(ascending = 0)
print(df)# Hello World program in Python
   
print ("Hello World!");

出力

    Name Play Time(in hours)       Rate ranking
0  Call Of Duty   45     Better than Average 3.0
1  TotalOverdose  46     Good                2.0
2  GTA 3          52     Best                1.0
3   Bully        22      Average             4.0

上記のコードの説明

このコードでは、パンダのライブラリの組み込み関数を使用して、特定のデータフレームに存在する各要素をランク付けしています。最適な基準を使用して、「再生時間(時間単位)」列で要素をランク付けできます。

次に、データフレームに「ranking」という名前の列を追加し、 .rank()を使用します。 その中で関数を実行し、要素のランク付けを行うために必要な列名(この場合は、再生時間(時間)列)を渡します。新しい列が作成されると、データフレームが印刷されます。

>

結論

このチュートリアルでは、データフレームの行をランク付けしてから、pandasライブラリとその組み込み関数を使用してデータを印刷します。 pandasデータフレームの行のランク付けは簡単なプロセスですが、上記の方法に正しく従う必要があります。


  1. PythonPandas-データフレームから行のサブセットを選択します

    行のサブセットを選択するには、条件を使用してデータをフェッチします。 以下は、MicrosoftExcelで開いたCSVファイルの内容であるとしましょう- 最初に、CSVファイルからPandasDataFrameにデータをロードします- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") 「Units」が100を超えるCarレコード、つまり行のサブセットが必要だとします。これには、-を使用します dataFrame[dataFrame["Units"] >

  2. Python-PandasDataFrameからnull行を削除する方法

    Pandas DataFrameのnull行を削除するには、dropna()メソッドを使用します。以下が、いくつかのNaN、つまりnull値を含むCSVファイルであるとしましょう- read_csv()を使用してCSVファイルを読み取ってみましょう。 CSVはデスクトップにあります- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") dropna()-を使用してnull値を削除します dataFrame = dataFrame.dropna() 例 以下は完全なコードです-