Python
 Computer >> コンピューター >  >> プログラミング >> Python

PythonPandas-結合された行と列のサブセットを選択します


行と列のサブセットを選択するには、 locを使用します 。インデックス演算子、つまり角かっこを使用して、場所に条件を設定します。

以下は、MicrosoftExcelで開いたCSVファイルの内容であるとしましょう-

PythonPandas-結合された行と列のサブセットを選択します

最初に、CSVファイルからPandasDataFrameにデータをロードします-

dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv")

行と列を組み合わせたサブセットを選択します。右の列には、表示する列が表示されます。つまり、ここに車の列が表示されます-

dataFrame.loc[dataFrame["Units"] > 100, "Car"]

以下はコードです-

import pandas as pd

# Load data from a CSV file into a Pandas DataFrame:
dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv")
print("\nReading the CSV file...\n",dataFrame)

# selecting a subset of rows
print("\nSelect cars with Units more than 100: \n",dataFrame[dataFrame["Units"] > 100])

# displaying only two columns
res = dataFrame[['Reg_Price','Units']];
print("\nDisplaying only two columns : \n",res)

# Select a subset of rows and columns combined
# Right column displays the column you want to display i.e. Cars column here
res2 = dataFrame.loc[dataFrame["Units"] > 100, "Car"]

# display subset
print("\nSubset...\n",res2)

出力

これにより、次の出力が生成されます-

Reading the CSV file...
       Car   Reg_Price   Units
0      BMW        2500     100
1    Lexus        3500      80
2     Audi        2500     120
3   Jaguar        2000      70
4  Mustang        2500     110

Select cars with Units more than 100:
       Car   Reg_Price   Units
2     Audi        2500     120
4  Mustang        2500     110

Displaying only two columns :
    Reg_Price   Units
0        2500     100
1        3500      80
2        2500     120
3        2000      70
4        2500     110

Subset...
2 Audi
4 Mustang
Name: Car, dtype: object

  1. PythonPandas-データフレームから行のサブセットを選択します

    行のサブセットを選択するには、条件を使用してデータをフェッチします。 以下は、MicrosoftExcelで開いたCSVファイルの内容であるとしましょう- 最初に、CSVファイルからPandasDataFrameにデータをロードします- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") 「Units」が100を超えるCarレコード、つまり行のサブセットが必要だとします。これには、-を使用します dataFrame[dataFrame["Units"] >

  2. Pythonでのデータ分析と視覚化?

    Pythonは、主にnumpy、pandas、matplotlib、seabornなどのデータ分析と視覚化のための多数のライブラリを提供します。このセクションでは、numpyの上に構築されたオープンソースライブラリであるデータ分析と視覚化のためのpandasライブラリについて説明します。 これにより、迅速な分析とデータのクリーニングと準備を行うことができます。Pandasには、以下で説明する多数の組み込みの視覚化機能も用意されています。 インストール パンダをインストールするには、ターミナルで以下のコマンドを実行します- pipinstall pandas Orweにはanacondaが