Python
 Computer >> コンピューター >  >> プログラミング >> Python

Python –PandasDataFrameのデータを再形成します


特定の列を分類することで、データの形状を簡単に変更できます。ここでは、「結果」列を分類します。つまり、合格値と不合格値を数値形式で分類します。

必要なライブラリをインポートする-

import pandas as pd

2列のデータフレームを作成する-

dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']

   }
)

map()関数を使用してデータの形状を変更し、「Pass」を1に、「Fail」を0に設定します-

dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })

以下はコードです-

import pandas as pd

# Create DataFrame
dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']
   }
)

print"DataFrame ...\n",dataFrame

# reshaping into numbers
dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })

print"\nReshaped DataFrame ...\n",dataFrame

出力

これにより、次の出力が生成されます

DataFrame ...
   Result   Student
0    Pass      Jack
1    Fail     Robin
2    Fail       Ted
3    Pass  Scarlett
4    Pass       Kat

Reshaped DataFrame ...
   Result   Student
0       1      Jack
1       0     Robin
2       0       Ted
3       1  Scarlett
4       1       Kat

  1. Pythonの文字列データを使用してPandasでDataFrameを構築する

    ここでは、文字列型データを使用してパンダデータフレームを構築する方法を説明します。 Pandasはcsvファイルをサポートしていますが、文字列を使用しても同じことができます。文字列型のデータの場合、1つのラッパーを使用する必要があります。これは、データがcsvリーダーとして取得されるときにシミュレートするのに役立ちます。 ここでは、データを受け取り、セミコロンで区切った文字列を使用しています。 例 理解を深めるために、次の実装を見てみましょう- import pandas as pd from io import StringIO str_data = StringIO("&quo

  2. PythonのPandasの既存のDataFrameに新しい列を追加する

    このチュートリアルでは、パンダの既存のDataFrameに新しい列を追加する方法を学習します。新しい列を追加するには、さまざまな方法があります。それらすべてをしましょう。 リストの使用 リストを使用して新しい列を追加できます。手順に従って、新しい列を追加します。 アルゴリズム 1. Create DataFrame using a dictionary. 2. Create a list containing new column data. Make sure that the length of the list matches the length of the data which