Python
 Computer >> コンピューター >  >> プログラミング >> Python

Python-特定のデータ型の列を選択します


特定のデータ型の列を選択するには、 select_dtypes()を使用します メソッドとインクルード パラメータ。最初に、2列のDataFrameを作成します-

dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Marc', 'Scarlett', 'Kat', 'John'],"Roll Number": [ 5, 10, 3, 8, 2, 9, 6]
   }
)

次に、それぞれの特定のデータ型を持つ2つの列を選択します-

column1 = dataFrame.select_dtypes(include=['object']).columns
column2 = dataFrame.select_dtypes(include=['int64']).columns

以下はコードです-

import pandas as pd

# Create DataFrame
dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Marc', 'Scarlett', 'Kat', 'John'],"Roll Number": [ 5, 10, 3, 8, 2, 9, 6]
   }
)

print"DataFrame ...\n",dataFrame

print"\nInfo of the entire dataframe:\n"

# get the description
print(dataFrame.info())

# select columns with specific datatype
column1 = dataFrame.select_dtypes(include=['object']).columns
column2 = dataFrame.select_dtypes(include=['int64']).columns

print"Column 1 with object type = ",column1
print"Column 2 with int64 type = ",column2

出力

これにより、次の出力が生成されます-

DataFrame ...
   Roll Number   Student
0            5      Jack
1           10     Robin
2            3       Ted
3            8      Marc
4            2  Scarlett
5            9       Kat
6            6      John

Info of the entire dataframe:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7 entries, 0 to 6
Data columns (total 2 columns):
Roll Number    7  non-null int64
Student        7  non-null object
dtypes: int64(1), object(1)
memory usage: 184.0+ bytes
None
Column 1 with object type = Index([u'Student'], dtype='object')
Column 2 with int64 type = Index([u'Roll Number'], dtype='object')

  1. Python-Pandasデータフレームから複数の列を選択します

    以下は、MicrosoftExcelで開いたCSVファイルの内容であるとしましょう- 最初に、CSVファイルからPandasDataFrameにデータをロードします- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") 複数の列レコードを選択するには、角かっこを使用します。括弧内の列に言及し、データセット全体から複数の列をフェッチします- dataFrame[['Reg_Price','Units']] 例 以下はコードです- import pa

  2. Pythonでリストするcsvファイル固有の列を抽出します

    Pythonでリストする特定の列のcsvファイルを抽出するには、Pandas read_csv()を使用できます。 メソッド。 ステップ 抽出する必要のある列のリストを作成します。 read_csv()を使用する csvファイルをデータフレームに抽出する方法。 実行されたデータを印刷します。 plot()を使用してデータフレームをプロットします メソッド。 図を表示するには、 show()を使用します メソッド。 例 import pandas as pd from matplotlib import pyplot as plt plt.rcParams