PythonPandas-データフレームから行のサブセットを選択します
行のサブセットを選択するには、条件を使用してデータをフェッチします。
以下は、MicrosoftExcelで開いたCSVファイルの内容であるとしましょう-
最初に、CSVファイルからPandasDataFrameにデータをロードします-
dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv")
「Units」が100を超えるCarレコード、つまり行のサブセットが必要だとします。これには、-
を使用しますdataFrame[dataFrame["Units"] > 100]
ここで、「Reg_Price」が100未満のCarレコード、つまり行のサブセットが必要だとします。これには、-
を使用しますdataFrame[dataFrame["Reg_Price"] < 3000]
例
以下はコードです-
import pandas as pd # Load data from a CSV file into a Pandas DataFrame dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") print("\nReading the CSV file...\n",dataFrame) # displaying two columns res2 = dataFrame[['Reg_Price','Units']]; print("\nDisplaying two columns : \n",res2) # selecting a subset of rows print("\nSelect cars with Units more than 100: \n",dataFrame[dataFrame["Units"] > 100]) # selecting a subset of rows print("\nSelect cars with Reg_Price less than 3000: \n",dataFrame[dataFrame["Reg_Price"] < 3000])
出力
これにより、次の出力が生成されます-
Reading the CSV file... Car Reg_Price Units 0 BMW 2500 100 1 Lexus 3500 80 2 Audi 2500 120 3 Jaguar 2000 70 4 Mustang 2500 110 Displaying only one column Car : Reg_Price Units 0 2500 100 1 3500 80 2 2500 120 3 2000 70 4 2500 110 Name: Car, dtype: object Select cars with Units more than 100: Car Reg_Price Units 2 Audi 2500 120 4 Mustang 2500 110 Select cars with Reg_Price less than 3000: Car Reg_Price Units 0 BMW 2500 100 2 Audi 2500 120 3 Jaguar 2000 70 4 Mustang 2500 110
-
Python-PandasDataFrameのサブセットを選択する方法
以下は、MicrosoftExcelで開いたCSVファイルの内容であるとしましょう- 最初に、CSVファイルからPandasDataFrameにデータをロードします- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") サブセットを選択するには、角かっこを使用します。括弧内の列に言及し、データセット全体から単一の列をフェッチします- dataFrame['Car'] 例 以下はコードです- import pandas as pd # Load data fr
-
Python-PandasDataFrameからnull行を削除する方法
Pandas DataFrameのnull行を削除するには、dropna()メソッドを使用します。以下が、いくつかのNaN、つまりnull値を含むCSVファイルであるとしましょう- read_csv()を使用してCSVファイルを読み取ってみましょう。 CSVはデスクトップにあります- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") dropna()-を使用してnull値を削除します dataFrame = dataFrame.dropna() 例 以下は完全なコードです-