Python
 Computer >> コンピューター >  >> プログラミング >> Python

Pythonのカテゴリ散布図SeabornLibraryでstripplotを使用しているときに、ポイントが重複しないようにするにはどうすればよいですか?


データの視覚化は、実際に数値を調べたり複雑な計算を実行したりすることなく、データで何が起こっているのかを理解するのに役立つため、重要なステップです。 Seabornは、データの視覚化に役立つライブラリです。カスタマイズされたテーマと高レベルのインターフェースが付属しています。

処理する必要のある変数が本質的にカテゴリである場合、一般的な散布図、ヒストグラムなどは使用できません。これは、カテゴリ散布図を使用する必要がある場合です。

「stripplot」、「swarmplot」などのプロットは、カテゴリ変数を操作するために使用されます。 「stripplot」関数は、変数の少なくとも1つがカテゴリ型である場合に使用されます。データは、軸の1つに沿って並べ替えられた方法で表されます。ただし、欠点は、特定のポイントが重複することです。これは、変数間の重複を避けるために「ジッター」パラメーターを使用する必要がある場合です。

データセットにランダムなノイズを追加し、カテゴリ軸に沿った値の位置を調整します。

ストリッププロット関数の構文

seaborn.stripplot(x, y,data, jitter = …)

「ジッター」パラメーターを使用して、データセット内のカテゴリ変数をプロットする方法を見てみましょう-

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
my_df = sb.load_dataset('iris')
sb.stripplot(x = "species", y = "petal_length", data = my_df, jitter = True)
plt.show()

出力

Pythonのカテゴリ散布図SeabornLibraryでstripplotを使用しているときに、ポイントが重複しないようにするにはどうすればよいですか?

説明

  • 必要なパッケージがインポートされます。
  • 入力データは、scikitlearnライブラリから読み込まれる「iris_data」です。
  • このデータはデータフレームに保存されます。
  • 「load_dataset」関数は、虹彩データをロードするために使用されます。
  • このデータは、「stripplot」機能を使用して視覚化されます。
  • データ名声の値の重複を避けるために、「jitter」という名前の追加パラメータが渡されます。
  • ここでは、データフレームがパラメータとして提供されています。
  • また、x値とy値が指定されます。
  • このデータはコンソールに表示されます。

  1. Seabornライブラリを使用してPythonでヒストグラムを表示するにはどうすればよいですか?

    データの視覚化は、実際に数値を調べたり複雑な計算を実行したりすることなく、データで何が起こっているのかを理解するのに役立つため、重要なステップです。定量的な洞察を聴衆に効果的に伝えるのに役立ちます。 Seabornは、データの視覚化に役立つライブラリです。カスタマイズされたテーマと高レベルのインターフェースが付属しています。 Pythonでヒストグラムを表示する例を見てみましょう- 例 import pandas as pd import seaborn as sb from matplotlib import pyplot as plt df = sb.load_dataset('

  2. Seabornライブラリを使用してPythonで散布図を表示するにはどうすればよいですか?

    データの視覚化は、実際に数値を調べたり複雑な計算を実行したりすることなく、データで何が起こっているのかを理解するのに役立つため、重要なステップです。 Seabornは、データの視覚化に役立つライブラリです。 散布図は、グラフ上に分散/分散されたデータポイントとしてデータの分布を示します。ドットを使用して、データセットの値を表します。データセットは本質的に数値です。横軸と縦軸のすべてのドットの位置は、単一のデータポイントの値を示します。 これらは、2つの変数間の関係を理解するのに役立ちます。 PythonでSeabornライブラリを使用してこれを実現する方法を理解しましょう- 例 impor