Python
 Computer >> コンピューター >  >> プログラミング >> Python

PythonのPandasライブラリの系列データ構造とは何ですか?


Seriesは、Pandasライブラリに存在する1次元のラベル付きデータ構造です。軸ラベルはまとめてインデックスと呼ばれます。

系列構造には、整数、浮動小数点、文字列、Pythonオブジェクトなど、あらゆるタイプのデータを格納できます。配列、辞書、または定数値を使用して作成できます。

Pythonで空のシリーズを作成する方法を見てみましょう-

import pandas as pd
my_series = pd.Series()
print("This is an empty series data structure")
print(my_series)

出力

This is an empty series data structure
Series([], dtype: float64)

説明

  • 上記のコードでは、「pandas」ライブラリがインポートされ、「pd」というエイリアス名が付けられています。

  • 次に、「シリーズ」関数を呼び出してシリーズデータ構造を作成します。

  • その後、コンソールに印刷されます。

インデックス値に明示的に名前を付けずに、配列を使用して一連のデータ構造を作成する方法を見てみましょう。

import pandas as pd
import numpy as np
my_data = np.array(['ab','bc','cd','de', 'ef', 'fg','gh', 'hi'])
my_series = pd.Series(my_data)
print("This is series data structure created using Numpy array")
print(my_series)

出力

This is series data structure created using Numpy array
0  ab
1  bc
2  cd
3  de
4  ef
5  fg
6  gh
7  hi
dtype: object
を使用して作成された系列データ構造です。

説明

  • 必要なライブラリがインポートされ、使いやすいようにエイリアス名が付けられています。

  • 次のステップは、numpy配列構造を作成し、それに値をデータとして渡すことです。

  • 次に、空の系列データ構造が作成され、以前に作成されたデータがパラメーターとしてそれに渡されます。

  • 出力はコンソールに表示されます。

−インデックスに値が指定されていない場合、0からのデフォルト値がインデックスに割り当てられます。


  1. Pythonデータの分析と視覚化

    Pandasは、データサイエンスと分析で最も人気のあるPythonライブラリの1つです。 Pandasライブラリは、データの操作、分析、およびクリーニングに使用されます。これは、純粋にCで記述された低レベルのNumPyを高レベルで抽象化したものです。このセクションでは、アナリストまたはデータサイエンティストとして知っておく必要のある最も重要な(最も頻繁に使用される)ことをいくつか取り上げます。 ライブラリのインストール pipを使用して必要なライブラリをインストールできます。コマンド端末で以下のコマンドを実行するだけです: pip intall pandas DataFrameとシリーズ

  2. Pythonでのデータ分析と視覚化?

    Pythonは、主にnumpy、pandas、matplotlib、seabornなどのデータ分析と視覚化のための多数のライブラリを提供します。このセクションでは、numpyの上に構築されたオープンソースライブラリであるデータ分析と視覚化のためのpandasライブラリについて説明します。 これにより、迅速な分析とデータのクリーニングと準備を行うことができます。Pandasには、以下で説明する多数の組み込みの視覚化機能も用意されています。 インストール パンダをインストールするには、ターミナルで以下のコマンドを実行します- pipinstall pandas Orweにはanacondaが