Matplotlibを使用してPySparkSQLの結果をプロットする方法は？

Matplotlibを使用してPySparkSQLをプロットするには 結果、次の手順を実行できます-

図のサイズを設定し、サブプロット間およびサブプロットの周囲のパディングを調整します。
Spark機能のメインエントリポイントであるインスタンスを取得します。
Hiveに保存されているデータと統合するSparkSQLのバリアントのインスタンスを取得します。
レコードのリストをタプルとして作成します。
ローカルのPythonコレクションを配布してRDDを形成します。
リストレコードをDBスキーマとしてマッピングします。
スキーマインスタンスを取得して、"my_table"にエントリを作成します。
レコードをテーブルに挿入します。
SQLクエリを読み取り、レコードを取得します。
フェッチされたレコードをデータフレームに変換します。
名前でインデックスを設定します属性を付けてプロットします。
図を表示するには、 show（）を使用しますメソッド。

例

from pyspark.sql import Row
from pyspark.sql import HiveContext
import pyspark
import matplotlib.pyplot as plt

plt.rcParams["figure.figsize"] = [7.50, 3.50]
plt.rcParams["figure.autolayout"] = True

sc = pyspark.SparkContext()
sqlContext = HiveContext(sc)

test_list = [(1, 'John'), (2, 'James'), (3, 'Jack'), (4, 'Joe')]
rdd = sc.parallelize(test_list)
people = rdd.map(lambda x: Row(id=int(x[0]), name=x[1]))
schemaPeople = sqlContext.createDataFrame(people)
sqlContext.registerDataFrameAsTable(schemaPeople, "my_table")

df = sqlContext.sql("Select * from my_table")
df = df.toPandas()
df.set_index('name').plot()

plt.show()

出力

Matplotlibを使用してPySparkSQLの結果をプロットする方法は？

Matplotlibで発散する積み上げ棒グラフを作成するにはどうすればよいですか？

Python Matplotlibでスクリプトを実行しているときに図を操作するにはどうすればよいですか？

Matplotlibで軸を切り替える方法は？
matplotlibで軸を切り替えるには、subplots（）メソッドを使用してFigureを作成し、2つのサブプロットを追加します。曲線をプロットし、xおよびyデータを抽出して、これらのデータを2番目のプロットされた曲線に設定します。ステップ numpyを使用してxおよびyデータポイントを作成します。図を作成し、2つのサブプロットのセットを追加します。両方の軸にプロットのタイトルを設定します。 plot（）を使用してxおよびyデータポイントをプロットしますメソッド。 get_xdataを使用してxおよびyデータポイントを抽出しますおよびget_yd
Matplotlibで折れ線グラフをアニメーション化する方法は？
matplotlibで折れ線グラフをアニメーション化するには、次の手順を実行できます- subplots（）を使用して、図とサブプロットのセットを作成しますメソッド。 x軸とy軸のスケールを制限します。 numpyを使用してxおよびtデータポイントを作成します。座標ベクトルX2およびT2から座標行列を返します。 plot（）を使用して、xおよびFデータポイントで線をプロットしますメソッド。アニメーションプロットを作成するには、yデータを更新します。関数*func *、current fig、animate、を繰り返し呼び出してアニメーショ