Python
 Computer >> コンピューター >  >> プログラミング >> Python

PythonでPandas.iloc[]を使用して行を抽出する


Pandasは、Pythonでのデータ処理と分析に広く使用されている有名なPythonライブラリです。この記事では、データフレームから行と列の両方をフィルタリングすることにより、Pythonから選択データを読み取るために使用される.ilocメソッドを使用する方法を説明します。

ilocメソッドは、元のデータセットの一部である場合とそうでない場合がある整数ベースのインデックスを使用してデータを処理します。最初の行にはインデックス0、2番目、インデックス1というように割り当てられます。同様に、最初の列はインデックス0で、2番目の列はインデックス1などです。

データセット

以下は、使用するデータセットです。

Id       SepalLengthCm ...    PetalLengthCm    PetalWidthCm
Iris-setosa-1          5.1 ...                   1.4       0.2
Iris-setosa-2          4.9 ...                   1.4       0.2
Iris-setosa-3          4.7 ...                   1.3       0.2

行の選択

インデックスに整数を指定することで、単一行と複数行の両方を選択できます。次の例では、行0と行1で個々の行を選択しています。

import pandas as pd

# Create data frame from csv file
data = pd.read_csv("D:\\Iris_readings.csv")

row0 = data.iloc[0]
row1 = data.iloc[1]
print(row0)
print(row1)

出力

上記のコードを実行すると、次の結果が得られます-

Id       Iris-setosa-1
SepalLengthCm    5.1
SepalWidthCm     3.5
PetalLengthCm    1.4
PetalWidthCm     0.2
Name: 0, dtype: object

Id       Iris-setosa-2
SepalLengthCm    4.9
SepalWidthCm       3
PetalLengthCm    1.4
PetalWidthCm     0.2
Name: 1, dtype: object

複数の行を選択する

以下の例では、必要な行のスライスに言及することにより、一度に多くの行を一緒に選択します。

import pandas as pd

# making data frame from csv file
data = pd.read_csv("D:\\Iris_readings.csv")

rows = data.iloc[4:8]
print(rows)

出力

上記のコードを実行すると、次の結果が得られます-

   Id       SepalLengthCm       SepalWidthCm       PetalLengthCm       PetalWidthCm
4          Iris-setosa-5         5.0          3.6             1.4       0.2
5          Iris-versicolor-51    7.0          3.2             4.7       1.4
6          Iris-versicolor-52    6.4          3.2             4.5       1.5
7          Iris-versicolor-53    6.9          3.1             4.9       1.5

行と列の選択

以下の例では、必要に応じて行と列の両方を選択できます。

import pandas as pd

# making data frame from csv file
data = pd.read_csv("D:\\Iris_readings.csv")

rows_columns = data.iloc[4:8,0:2]
print(rows_columns)
>

出力

上記のコードを実行すると、次の結果が得られます-

      Id           SepalLengthCm
4    Iris-setosa-5         5.0
5    Iris-versicolor-51    7.0
6    Iris-versicolor-52    6.4
7    Iris-versicolor-53    6.9

  1. Pythonでのデータ分析と視覚化?

    Pythonは、主にnumpy、pandas、matplotlib、seabornなどのデータ分析と視覚化のための多数のライブラリを提供します。このセクションでは、numpyの上に構築されたオープンソースライブラリであるデータ分析と視覚化のためのpandasライブラリについて説明します。 これにより、迅速な分析とデータのクリーニングと準備を行うことができます。Pandasには、以下で説明する多数の組み込みの視覚化機能も用意されています。 インストール パンダをインストールするには、ターミナルで以下のコマンドを実行します- pipinstall pandas Orweにはanacondaが

  2. Pythonを使用したBase64データエンコーディング

    base64モジュールの関数は、バイナリデータをプレーンテキストプロトコルを使用した送信に適したASCIIのサブセットに変換します。 エンコーディングおよびデコーディング機能は、Base16、Base32、およびBase64アルゴリズムを定義するRFC 3548の仕様と、デファクトスタンダードのAscii85およびBase85エンコーディングの仕様を実装します。 RFC 3548エンコーディングは、バイナリデータのエンコーディングに適しており、電子メールで安全に送信したり、URLの一部として使用したり、HTTPPOSTリクエストの一部として含めたりすることができます。 このモジュールによっ