Python
 Computer >> コンピューター >  >> プログラミング >> Python

Python-PandasDataFrameをバイナリデータに変換します


get_dummies()メソッドを使用して、カテゴリデータフレームをバイナリデータに変換します。以下は、2列のPandasDataFrameです-

dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']
   }
)

get_dummies()を使用して、バイナリ形式に変換する列を設定します。ここでは、「合格」および「不合格」フォームの結果を表示する必要があります。したがって、「結果」列を設定します-

pd.get_dummies(dataFrame["Result"]

以下はコードです-

import pandas as pd

# Create DataFrame
dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']
   }
)

print"DataFrame ...\n",dataFrame

# converting to binary data
dfBinary = pd.get_dummies(dataFrame["Result"])
print"\nDisplaying DataFrame in Binary form...\n",dfBinary

出力

これにより、次の出力が生成されます-

DataFrame ...
   Result   Student
0    Pass      Jack
1    Fail     Robin
2    Fail       Ted
3    Pass  Scarlett
4    Pass       Kat

Displaying DataFrame in Binary form...
   Fail   Pass
0     0     1
1     1     0
2     1     0
3     0     1
4     0     1

  1. PythonPandas-期間を希望の頻度に変換する

    期間を目的の頻度に変換するには、 period.asfreq()を使用します 方法。 「H」指定子を使用して、希望する時間ごとの頻度に設定するとします。 まず、必要なライブラリをインポートします- import pandas as pd pandas.Periodは期間を表します。 2つのPeriodオブジェクトを作成する period1 = pd.Period("2020-09-23 03:15:40") period2 = pd.Period(freq="D", year = 2021, month = 4, day = 16, hour = 2

  2. Python Pandas-DataFrameに複数のデータ列をプロットしますか?

    複数の列をプロットするには、棒グラフをプロットします。 plot()を使用します メソッドと種類を設定します バーへのパラメータ 棒グラフ用。まず、必要なライブラリをインポートしましょう- import pandas as pd import matplotlib.pyplot as mp 以下は、チームレコードのデータです- data = [["Australia", 2500, 2021],["Bangladesh", 1000, 2021],["England", 2000, 2021],["India"