Python-PandasDataFrameで最初のグループ値を計算します
最初のグループ値を計算するには、groupby.first()メソッドを使用します。最初に、エイリアスを使用して必要なライブラリをインポートします-
import pandas as pd;
3列のデータフレームを作成する-
dataFrame = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'BMW', 'Tesla', 'Lexus', 'Tesla'],"Place": ['Delhi','Bangalore','Pune','Punjab','Chandigarh','Mumbai'],"Units": [100, 150, 50, 80, 110, 90] } )
ここで、DataFrameを列でグループ化します-
groupDF = dataFrame.groupby("Car")
最初にグループ値を計算し、インデックスをリセットします-
res = groupDF.first() res = res.reset_index()
例
以下は完全なコードです-
import pandas as pd; dataFrame = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'BMW', 'Tesla', 'Lexus', 'Tesla'],"Place": ['Delhi','Bangalore','Pune','Punjab','Chandigarh','Mumbai'],"Units": [100, 150, 50, 80, 110, 90] } ) print("DataFrame ...\n",dataFrame) # grouping DataFrame by column Car groupDF = dataFrame.groupby("Car") res = groupDF.first() res = res.reset_index() print("\nFirst of group values = \n",res)
出力
これにより、次の出力が生成されます。繰り返される値の最初の出現が表示されます。つまり、グループ値の最初の値-
DataFrame ... Car Place Units 0 BMW Delhi 100 1 Lexus Bangalore 150 2 BMW Pune 50 3 Tesla Punjab 80 4 Lexus Chandigarh 110 5 Tesla Mumbai 90 First of group values = Car Place Units 0 BMW Delhi 100 1 Lexus Bangalore 150 2 Tesla Punjab 80
-
PythonPandas-補間法を使用してNaN値を入力します
Interpolate()メソッドを使用して、NaN値を入力します。以下が、いくつかのNaN値を使用してMicrosoftExcelで開いたCSVファイルであるとしましょう- CSVファイルからPandasDataFrameにデータをロードする- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") NaN値をinterpolate()-で埋めます dataFrame.interpolate() 例 以下はコードです- import pandas as pd # Load dat
-
Python Pandas –null以外の値を逆方向に伝播する
「方法」を使用します ” fillnaのパラメータ () 方法。後方塗りつぶしには、値「bfill」を使用します 以下に示すように- fillna(method='bfill') 以下が、いくつかのNaN値を使用してMicrosoftExcelで開いたCSVファイルであるとしましょう- まず、必要なライブラリをインポートします- import pandas as pd CSVファイルからPandasDataFrameにデータをロードする- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesD