Python –PandasDataFrameのデータを再形成します
特定の列を分類することで、データの形状を簡単に変更できます。ここでは、「結果」列を分類します。つまり、合格値と不合格値を数値形式で分類します。
必要なライブラリをインポートする-
import pandas as pd
2列のデータフレームを作成する-
dataFrame = pd.DataFrame( { "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass'] } )
map()関数を使用してデータの形状を変更し、「Pass」を1に、「Fail」を0に設定します-
dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })
例
以下はコードです-
import pandas as pd # Create DataFrame dataFrame = pd.DataFrame( { "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass'] } ) print"DataFrame ...\n",dataFrame # reshaping into numbers dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, }) print"\nReshaped DataFrame ...\n",dataFrame
出力
これにより、次の出力が生成されます
DataFrame ... Result Student 0 Pass Jack 1 Fail Robin 2 Fail Ted 3 Pass Scarlett 4 Pass Kat Reshaped DataFrame ... Result Student 0 1 Jack 1 0 Robin 2 0 Ted 3 1 Scarlett 4 1 Kat
-
Pythonの文字列データを使用してPandasでDataFrameを構築する
ここでは、文字列型データを使用してパンダデータフレームを構築する方法を説明します。 Pandasはcsvファイルをサポートしていますが、文字列を使用しても同じことができます。文字列型のデータの場合、1つのラッパーを使用する必要があります。これは、データがcsvリーダーとして取得されるときにシミュレートするのに役立ちます。 ここでは、データを受け取り、セミコロンで区切った文字列を使用しています。 例 理解を深めるために、次の実装を見てみましょう- import pandas as pd from io import StringIO str_data = StringIO("&quo
-
PythonのPandasの既存のDataFrameに新しい列を追加する
このチュートリアルでは、パンダの既存のDataFrameに新しい列を追加する方法を学習します。新しい列を追加するには、さまざまな方法があります。それらすべてをしましょう。 リストの使用 リストを使用して新しい列を追加できます。手順に従って、新しい列を追加します。 アルゴリズム 1. Create DataFrame using a dictionary. 2. Create a list containing new column data. Make sure that the length of the list matches the length of the data which