Python
 Computer >> コンピューター >  >> プログラミング >> Python

Python-マルチインデックスPandasデータフレームから特定の行を削除します


マルチインデックスデータフレームから特定の行を削除するには、 drop()を使用します 方法。まず、多重指数配列を作成しましょう-

arr = [np.array(['car', 'car', 'car','bike', 'bike', 'bike', 'truck', 'truck', 'truck']),
   np.array(['valueA', 'valueB', 'valueC','valueA', 'valueB', 'valueC','valueA', 'valueB', 'valueC'])]

次に、マルチインデックスデータフレームを作成し、インデックスも設定します-

dataFrame = pd.DataFrame(
   np.random.randn(9, 3), index=arr, columns=['Col 1', 'Col 2', 'Col 3'])

dataFrame.index.names = ['level 0', 'level 1']

ここで、特定の行を削除します-

dataFrame.drop(('car','valueA'), axis=0, inplace=True)

以下はコードです-

import numpy as np
import pandas as pd

# multiindex array
arr = [np.array(['car', 'car', 'car','bike','bike', 'bike', 'truck', 'truck', 'truck']),
   np.array(['valueA', 'valueB', 'valueC','valueA', 'valueB', 'valueC','valueA', 'valueB', 'valueC'])]

# forming multiindex dataframe
dataFrame = pd.DataFrame(
   np.random.randn(9, 3), index=arr,columns=['Col 1', 'Col 2', 'Col 3'])

dataFrame.index.names = ['level 0', 'level 1']
print(dataFrame)

print("\nDropping specific row...\n");
dataFrame.drop(('car','valueA'), axis=0, inplace=True)
print(dataFrame)

出力

これにより、次の出力が生成されます-

                    Col 1       Col 2      Col 3
level 0 level 1
car     valueA     0.845965   -0.850953   -0.335662
        valueB     0.534764   -0.107635    1.008855
        valueC    -0.507910   -0.664625    1.671653
bike    valueA    -0.475751   -0.244113    0.672352
        valueB    -0.273670    1.118635    0.428750
        valueC    -1.064504   -0.344729    0.481037
truck   valueA    -0.508659    1.352390    1.382799
        valueB     1.144299   -0.092568   -1.071624
        valueC    -0.710767    0.967018   -0.047430

Dropping specific row...

                     Col 1      Col 2     Col 3
level 0 level 1
car     valueB      0.534764  -0.107635   1.008855
        valueC     -0.507910  -0.664625   1.671653
bike    valueA     -0.475751  -0.244113   0.672352
        valueB     -0.273670   1.118635   0.428750
        valueC     -1.064504  -0.344729   0.481037
truck   valueA     -0.508659   1.352390   1.382799
        valueB      1.144299  -0.092568  -1.071624
        valueC     -0.710767   0.967018  -0.047430

  1. PythonPandas-データフレームから行のサブセットを選択します

    行のサブセットを選択するには、条件を使用してデータをフェッチします。 以下は、MicrosoftExcelで開いたCSVファイルの内容であるとしましょう- 最初に、CSVファイルからPandasDataFrameにデータをロードします- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") 「Units」が100を超えるCarレコード、つまり行のサブセットが必要だとします。これには、-を使用します dataFrame[dataFrame["Units"] >

  2. Python-PandasDataFrameからnull行を削除する方法

    Pandas DataFrameのnull行を削除するには、dropna()メソッドを使用します。以下が、いくつかのNaN、つまりnull値を含むCSVファイルであるとしましょう- read_csv()を使用してCSVファイルを読み取ってみましょう。 CSVはデスクトップにあります- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") dropna()-を使用してnull値を削除します dataFrame = dataFrame.dropna() 例 以下は完全なコードです-