Python Pandas –データ型とDataFrame列の情報を取得します
データ型とDataFrame列の情報を取得するには、info()メソッドを使用します。必要なライブラリをエイリアスでインポートします-
import pandas as pd;
3列のデータフレームを作成する-
dataFrame = pd.DataFrame( { "Car": ['BMW', 'Audi', 'BMW', 'Lexus', 'Tesla', 'Lexus', 'Mustang'],"Place": ['Delhi','Bangalore','Hyderabad','Chandigarh','Pune', 'Mumbai', 'Jaipur'],"Units": [100, 150, 50, 110, 90, 120, 80] } )
DataFrameに関するデータ型およびその他の情報を取得します-
dataFrame.info()
例
以下はコードです-
import pandas as pd; # create a DataFrame dataFrame = pd.DataFrame( { "Car": ['BMW', 'Audi', 'BMW', 'Lexus', 'Tesla', 'Lexus', 'Mustang'],"Place": ['Delhi','Bangalore','Hyderabad','Chandigarh','Pune', 'Mumbai', 'Jaipur'],"Units": [100, 150, 50, 110, 90, 120, 80] } ) print"DataFrame ...\n",dataFrame # get unique values from a column print"\nUnique values from a column ...\n",dataFrame['Car'].unique() print"\nCount unique values from a column ...\n",dataFrame['Car'].nunique() # get datatype info print"\n Get the datatype info ...\n",dataFrame.info()
出力
これにより、次の出力が生成されます-
DataFrame ... Car Place Units 0 BMW Delhi 100 1 Audi Bangalore 150 2 BMW Hyderabad 50 3 Lexus Chandigarh 110 4 Tesla Pune 90 5 Lexus Mumbai 120 6 Mustang Jaipur 80 Unique values from a column ... ['BMW' 'Audi' 'Lexus' 'Tesla' 'Mustang'] Count unique values from a column ... 5 Get the datatype info ... RangeIndex: 7 entries, 0 to 6 Data columns (total 3 columns): Car 7 non-null object Place 7 non-null object Units 7 non-null int64 dtypes: int64(1), object(2) memory usage: 240.0+ bytes None
-
Pandas Pythonでデータフレームの数値を含む列の平均を取得するにはどうすればよいですか?
特定の列の平均値、または数値を含むすべての列の平均値を取得する必要がある場合があります。ここで、mean()関数を使用できます。 「平均」という用語は、すべての値の合計を求め、それをデータセット内の値の総数で割ることを意味します。 同じのデモンストレーションを見てみましょう- 例 import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']), 'Age':pd.Series([
-
Pandas Pythonでデータフレームの特定の列の合計を取得するにはどうすればよいですか?
特定の列の合計を取得する必要がある場合があります。ここで「合計」関数を使用できます。 合計を計算する必要がある列は、値として合計関数に渡すことができます。列のインデックスを渡して合計を求めることもできます。 同じのデモンストレーションを見てみましょう- 例 import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),'Age':pd.Series([45, 67, 89, 1