Python
 Computer >> コンピューター >  >> プログラミング >> Python

Python-numpyでPandasDataFrameをフィルタリングする


numpy where()メソッドを使用して、PandasDataFrameをフィルタリングできます。 where()メソッドの条件に言及します。まず、必要なライブラリをそれぞれのエイリアスでインポートしましょう

import pandas as pd
import numpy as np

次に、製品レコードを使用してPandasDataFrameを作成します

dataFrame = pd.DataFrame({"Product": ["SmartTV", "ChromeCast", "Speaker", "Earphone"],"Opening_Stock": [300, 700, 1200, 1500],"Closing_Stock": [200, 500, 1000, 900]})

numpy where()を使用して、2つの条件でDataFrameをフィルタリングします

resValues1 = np.where((dataFrame['Opening_Stock']>=700) & (dataFrame['Closing_Stock']< 1000))

print"\nFiltered DataFrame Value = \n",dataFrame.loc[resValues1]

numpy where()をもう一度使用して、3つの条件でDataFrameをフィルタリングしてみましょう

resValues2 = np.where((dataFrame['Opening_Stock']>=500) & (dataFrame['Closing_Stock']< 1000) & (dataFrame['Product'].str.startswith('C')))

以下は完全なコードです

import pandas as pd
import numpy as np

dataFrame = pd.DataFrame({"Product": ["SmartTV", "ChromeCast", "Speaker", "Earphone"],"Opening_Stock": [300, 700, 1200, 1500],"Closing_Stock": [200, 500, 1000, 900]})

print"DataFrame...\n",dataFrame

# using numpy where() to filter DataFrame with 2 Conditions
resValues1 = np.where((dataFrame['Opening_Stock']>=700) & (dataFrame['Closing_Stock']< 1000))

print"\nFiltered DataFrame Value = \n",dataFrame.loc[resValues1]

# using numpy where() to filter DataFrame with 3 conditions
resValues2 = np.where((dataFrame['Opening_Stock']>=500) & (dataFrame['Closing_Stock']< 1000) & (dataFrame['Product'].str.startswith('C')))

print"\nFiltered DataFrame Value = \n",dataFrame.loc[resValues2]

出力

これにより、次の出力が生成されます

DataFrame...
   Closing_Stock   Opening_Stock   Product
0          200            300     SmartTV
1          500            700     ChromeCast
2         1000           1200     Speaker
3          900           1500     Earphone

Filtered DataFrame Value =
   Closing_Stock   Opening_Stock   Product
1           500             700    ChromeCast
3           900            1500    Earphone

Filtered DataFrame Value =
   Closing_Stock   Opening_Stock   Product
1           500             700    ChromeCast

  1. Python-Matplotlibを使用してPandasデータフレームのヒストグラムをプロットしますか?

    ヒストグラムは、データの分布を表したものです。ヒストグラムをプロットするには、hist()メソッドを使用します。最初に、両方のライブラリをインポートします- import pandas as pd import matplotlib.pyplot as plt 2列のデータフレームを作成する- dataFrame = pd.DataFrame({    "Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', '

  2. PythonPandas-DataFrame内のすべてのNaN要素を0に置き換えます

    NaN値を置き換えるには、fillna()メソッドを使用します。以下が、いくつかのNaN値を使用してMicrosoftExcelで開いたCSVファイルであるとしましょう- まず、必要なライブラリをインポートします- import pandas as pd CSVファイルからPandasDataFrameにデータをロードする- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") fillna()メソッドを使用してNaN値を0に置き換えます- dataFrame.fillna(0)