Python-PandasDataFrameの行のランキング
提供されたデータフレームの各行のランキングを含む列を追加します。これは、データフレームを並べ替えて、特定の要素のランクを決定するのに役立ちます。たとえば、-
データフレーム
名前の再生時間(時間単位) | レート | |||
---|---|---|---|---|
0 | コールオブデューティ | 45 | 平均より良い | |
1 | 総過剰摂取 | 46 | 良い | |
2 | GTA3 | 52 | ベスト | |
3 | いじめ | 22 | 平均 |
出力
名前の再生時間(時間単位) | レートランキング | |||
---|---|---|---|---|
0 | コールオブデューティ | 45 | 平均より良い | 3.0 |
1 | 総過剰摂取 | 46 | 良い | 2.0 |
2 | GTA3 | 52 | ベスト | 1.0 |
3 | いじめ | 22 | 平均 | 4.0 |
さて、上記の例でわかるように、ランキングは整数ですが、横に小数があります。つまり、実数でもランキングを設定できます。これは、複数の要素が同じランクである場合に発生します。そのような場合よりもデータフレームは、私たちのランキングが要素間で分割されています。したがって、ランクとして実数があります。
データフレームにランクを割り当てるにはどうすればよいですか
データフレームの要素にランクを割り当てるために、 .rank()であるパンダライブラリの組み込み関数を使用します。 働き。要素のランク付けに基づく基準を渡します。この関数は、ランク付けが保存されている各行に新しい列を返します。
例
.rank()関数を使用するためのコードは
import pandas as pd games = {'Name' : ['Call Of Duty', 'Total Overdose', 'GTA 3', 'Bully'], 'Play Time(in hours)' : ['45', '46', '52', '22'], 'Rate' : ['Better than Average', 'Good', 'Best', 'Average']} df = pd.DataFrame(games) df['ranking'] = df['Play Time(in hours)'].rank(ascending = 0) print(df)# Hello World program in Python print ("Hello World!");
出力
Name Play Time(in hours) Rate ranking 0 Call Of Duty 45 Better than Average 3.0 1 TotalOverdose 46 Good 2.0 2 GTA 3 52 Best 1.0 3 Bully 22 Average 4.0
上記のコードの説明
このコードでは、パンダのライブラリの組み込み関数を使用して、特定のデータフレームに存在する各要素をランク付けしています。最適な基準を使用して、「再生時間(時間単位)」列で要素をランク付けできます。
次に、データフレームに「ranking」という名前の列を追加し、 .rank()を使用します。 その中で関数を実行し、要素のランク付けを行うために必要な列名(この場合は、再生時間(時間)列)を渡します。新しい列が作成されると、データフレームが印刷されます。
>結論
このチュートリアルでは、データフレームの行をランク付けしてから、pandasライブラリとその組み込み関数を使用してデータを印刷します。 pandasデータフレームの行のランク付けは簡単なプロセスですが、上記の方法に正しく従う必要があります。
-
PythonPandas-データフレームから行のサブセットを選択します
行のサブセットを選択するには、条件を使用してデータをフェッチします。 以下は、MicrosoftExcelで開いたCSVファイルの内容であるとしましょう- 最初に、CSVファイルからPandasDataFrameにデータをロードします- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") 「Units」が100を超えるCarレコード、つまり行のサブセットが必要だとします。これには、-を使用します dataFrame[dataFrame["Units"] >
-
Python-PandasDataFrameからnull行を削除する方法
Pandas DataFrameのnull行を削除するには、dropna()メソッドを使用します。以下が、いくつかのNaN、つまりnull値を含むCSVファイルであるとしましょう- read_csv()を使用してCSVファイルを読み取ってみましょう。 CSVはデスクトップにあります- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") dropna()-を使用してnull値を削除します dataFrame = dataFrame.dropna() 例 以下は完全なコードです-