Pythonにすでに存在する列を使用して、データフレームに新しい列を作成するにはどうすればよいですか?
データフレームは2次元のデータ構造であり、データは行と列の形式で表形式で保存されます。 SQLデータテーブルまたはExcelシート表現として視覚化できます。
次のコンストラクターを使用して作成できます-
pd.Dataframe(data, index, columns, dtype, copy)
以前、シリーズデータ構造として新しい列を作成する方法を見ました。これは元のデータフレームにインデックス付けされたため、データフレームに追加されました。
データフレームの既存の列を使用して列を作成する方法を使用してみましょう。これは、既存の列に対して計算を実行し、その結果を新しい列に格納する必要がある場合に役立ちます-
例
import pandas as pd my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']), 'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd']), 'ef' :pd.Series([56, 78, 32],index=['a','b','c'])} my_df = pd.DataFrame(my_data) print("The dataframe is :") print(my_df) my_df['gh'] = my_df['ab'] + my_df['ef'] print("After adding column 0 and 2 to the dataframe, :") print(my_df)
出力
The dataframe is : ab cd ef a 1.0 1 56.0 b 8.0 2 78.0 c 7.0 0 32.0 d NaN 9 NaN After adding column 0 and 2 to the dataframe, : ab cd ef gh a 1.0 1 56.0 57.0 b 8.0 2 78.0 86.0 c 7.0 0 32.0 39.0 d NaN 9 NaN NaN
説明
-
必要なライブラリがインポートされ、使いやすいようにエイリアス名が付けられています。
-
キーと値で構成されるディクショナリ値が作成されます。値は実際には一連のデータ構造です。
-
そのようなディクショナリ値が複数作成されます。
-
この辞書は、後で「パンダ」ライブラリにある「データフレーム」関数にパラメータとして渡されます
。 -
データフレームは、辞書をパラメータとして渡すことで作成されます。
-
新しい列がデータフレームにインデックス付けされ、0番目と2番目の列が追加されてこの新しい列が作成されます。
-
データフレームはコンソールに印刷されます。
注 −「NaN」という単語は「数値ではない」を意味します。これは、特定の[row、col]値に有効なエントリがないことを意味します。
-
Tensorflowを使用してPythonを使用してモデルをトレーニングするにはどうすればよいですか?
モデルは、Tensorflowの「train」メソッドを使用してトレーニングできます。この方法では、エポック(モデルに合うようにデータをトレーニングする必要がある回数)とトレーニングデータが指定されます。 続きを読む: TensorFlowとは何ですか?KerasはTensorFlowとどのように連携してニューラルネットワークを作成しますか? Google Colaboratoryを使用して、以下のコードを実行しています。 Google ColabまたはColaboratoryは、ブラウザー上でPythonコードを実行するのに役立ち、構成が不要で、GPU(グラフィックプロセッシングユニット
-
Tensorflowを使用してPythonを使用してデータを視覚化するにはどうすればよいですか?
花のデータセットがあるとしましょう。花のデータセットは、基本的に花のデータセットにリンクするgoogleAPIを使用してダウンロードできます。 「get_file」メソッドを使用して、APIをパラメーターとして渡すことができます。これが完了すると、データが環境にダウンロードされます。 「matplotlib」ライブラリを使用して視覚化できます。 「imshow」メソッドは、コンソールに画像を表示するために使用されます。 続きを読む: TensorFlowとは何ですか?KerasはTensorFlowとどのように連携してニューラルネットワークを作成しますか? Keras Sequenti