PythonのPandasライブラリの系列データ構造とは何ですか?
Seriesは、Pandasライブラリに存在する1次元のラベル付きデータ構造です。軸ラベルはまとめてインデックスと呼ばれます。
系列構造には、整数、浮動小数点、文字列、Pythonオブジェクトなど、あらゆるタイプのデータを格納できます。配列、辞書、または定数値を使用して作成できます。
Pythonで空のシリーズを作成する方法を見てみましょう-
例
import pandas as pd my_series = pd.Series() print("This is an empty series data structure") print(my_series)
出力
This is an empty series data structure Series([], dtype: float64)
説明
-
上記のコードでは、「pandas」ライブラリがインポートされ、「pd」というエイリアス名が付けられています。
-
次に、「シリーズ」関数を呼び出してシリーズデータ構造を作成します。
-
その後、コンソールに印刷されます。
インデックス値に明示的に名前を付けずに、配列を使用して一連のデータ構造を作成する方法を見てみましょう。
例
import pandas as pd import numpy as np my_data = np.array(['ab','bc','cd','de', 'ef', 'fg','gh', 'hi']) my_series = pd.Series(my_data) print("This is series data structure created using Numpy array") print(my_series)
出力
This is series data structure created using Numpy array 0 ab 1 bc 2 cd 3 de 4 ef 5 fg 6 gh 7 hi dtype: objectを使用して作成された系列データ構造です。
説明
-
必要なライブラリがインポートされ、使いやすいようにエイリアス名が付けられています。
-
次のステップは、numpy配列構造を作成し、それに値をデータとして渡すことです。
-
次に、空の系列データ構造が作成され、以前に作成されたデータがパラメーターとしてそれに渡されます。
-
出力はコンソールに表示されます。
注 −インデックスに値が指定されていない場合、0からのデフォルト値がインデックスに割り当てられます。
-
Pythonデータの分析と視覚化
Pandasは、データサイエンスと分析で最も人気のあるPythonライブラリの1つです。 Pandasライブラリは、データの操作、分析、およびクリーニングに使用されます。これは、純粋にCで記述された低レベルのNumPyを高レベルで抽象化したものです。このセクションでは、アナリストまたはデータサイエンティストとして知っておく必要のある最も重要な(最も頻繁に使用される)ことをいくつか取り上げます。 ライブラリのインストール pipを使用して必要なライブラリをインストールできます。コマンド端末で以下のコマンドを実行するだけです: pip intall pandas DataFrameとシリーズ
-
Pythonでのデータ分析と視覚化?
Pythonは、主にnumpy、pandas、matplotlib、seabornなどのデータ分析と視覚化のための多数のライブラリを提供します。このセクションでは、numpyの上に構築されたオープンソースライブラリであるデータ分析と視覚化のためのpandasライブラリについて説明します。 これにより、迅速な分析とデータのクリーニングと準備を行うことができます。Pandasには、以下で説明する多数の組み込みの視覚化機能も用意されています。 インストール パンダをインストールするには、ターミナルで以下のコマンドを実行します- pipinstall pandas Orweにはanacondaが