PythonPandas-結合された行と列のサブセットを選択します
行と列のサブセットを選択するには、 locを使用します 。インデックス演算子、つまり角かっこを使用して、場所に条件を設定します。
以下は、MicrosoftExcelで開いたCSVファイルの内容であるとしましょう-
最初に、CSVファイルからPandasDataFrameにデータをロードします-
dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv")
行と列を組み合わせたサブセットを選択します。右の列には、表示する列が表示されます。つまり、ここに車の列が表示されます-
dataFrame.loc[dataFrame["Units"] > 100, "Car"]
例
以下はコードです-
import pandas as pd # Load data from a CSV file into a Pandas DataFrame: dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") print("\nReading the CSV file...\n",dataFrame) # selecting a subset of rows print("\nSelect cars with Units more than 100: \n",dataFrame[dataFrame["Units"] > 100]) # displaying only two columns res = dataFrame[['Reg_Price','Units']]; print("\nDisplaying only two columns : \n",res) # Select a subset of rows and columns combined # Right column displays the column you want to display i.e. Cars column here res2 = dataFrame.loc[dataFrame["Units"] > 100, "Car"] # display subset print("\nSubset...\n",res2)
出力
これにより、次の出力が生成されます-
Reading the CSV file... Car Reg_Price Units 0 BMW 2500 100 1 Lexus 3500 80 2 Audi 2500 120 3 Jaguar 2000 70 4 Mustang 2500 110 Select cars with Units more than 100: Car Reg_Price Units 2 Audi 2500 120 4 Mustang 2500 110 Displaying only two columns : Reg_Price Units 0 2500 100 1 3500 80 2 2500 120 3 2000 70 4 2500 110 Subset... 2 Audi 4 Mustang Name: Car, dtype: object
-
PythonPandas-データフレームから行のサブセットを選択します
行のサブセットを選択するには、条件を使用してデータをフェッチします。 以下は、MicrosoftExcelで開いたCSVファイルの内容であるとしましょう- 最初に、CSVファイルからPandasDataFrameにデータをロードします- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") 「Units」が100を超えるCarレコード、つまり行のサブセットが必要だとします。これには、-を使用します dataFrame[dataFrame["Units"] >
-
Pythonでのデータ分析と視覚化?
Pythonは、主にnumpy、pandas、matplotlib、seabornなどのデータ分析と視覚化のための多数のライブラリを提供します。このセクションでは、numpyの上に構築されたオープンソースライブラリであるデータ分析と視覚化のためのpandasライブラリについて説明します。 これにより、迅速な分析とデータのクリーニングと準備を行うことができます。Pandasには、以下で説明する多数の組み込みの視覚化機能も用意されています。 インストール パンダをインストールするには、ターミナルで以下のコマンドを実行します- pipinstall pandas Orweにはanacondaが