-
2つのデータフレームの分割表を見つけるためのPythonコードを記述します
2つのデータフレームがあり、クロス集計の結果は、であると想定します。 Age 12 13 14 Mark 80 90 85 Id 1 1 0 0 2 0 1 0 3 1 0 0 4 0 1 0 5 0 0 1 解決策 これを解決するには、以下の手順に従います- 2つのデータフレームを定義する インデックス内のdf.cros
-
データフレーム内の特定の軸の名前を変更するPythonコードを記述します
データフレームがあり、軸の名前を変更した結果は、であると想定します。 Rename index: index Id Age Mark 0 1.0 12.0 80.0 1 2.0 12.0 90.0 2 3.0 14.0 NaN &n
-
特定のデータフレームで欠落しているすべての値を埋めるためのPythonコードを記述します
解決策 これを解決するには、以下の手順に従います- データフレームを定義する method =linear、limit_direction =forward内にdf.interpolate関数を適用し、NaN limit=2を埋めます df.interpolate(method ='linear', limit_direction ='forward', limit = 2 例 import pandas as pd df = pd.DataFrame({"Id":[1, 2, 3, None, 5], &nb
-
Pythonでプログラムを作成して、特定のデータフレームで調整済みおよび未調整のEWMを計算します
データフレームがあり、調整済みおよび未調整のEWMの結果が-であると仮定します。 調整済みewm:Id Age0 1.000000 12.0000001 1.750000 12.7500002 2.615385 12.2307693 2.615385 13.4250004 4.670213 14.479339非調整済みewm:Id Age0 1.000000 12.0000001 1.666667 12.6666672 2.555556 12.2222223 2.555556 13.4074074 4.650794 14.469136 解決策 これを解決するには、以下の手順に従います-
-
タプル値のリストを含むorderDictとしてデータフレーム行を出力するプログラムをPythonで記述します
データフレームがあり、タプルのリストを含むorderDictの結果が-であると仮定します。 OrderedDict([('Index', 0), ('Name', 'Raj'), ('Age', 13), ('City', 'Chennai'), ('Mark', 80)]) OrderedDict([('Index', 1), ('Name', 'Ravi'), ('Age', 12), ('City'
-
Pythonでプログラムを作成して、特定のデータフレーム内のレコードをCおよびFの順序でフラット化する
データフレームがあり、CとFの順序でレコードをフラット化した結果が次のようになっていると仮定します。 flat c_order: [10 12 25 13 3 12 11 14 24 15 6 14] flat F_order: [10 25 3 11 24 6 12 13 12 14 15 14] 解決策 これを解決するには、以下の手順に従います- データフレームを定義する 内部にdf.values.ravel()関数を適用して、引数をorder =’C’として設定し、C_orderとして保存します。 C_order =
-
開始日と終了日の範囲からの合計営業日数を計算するPython関数を記述します
日付のdate_rangeがあり、合計営業日数の結果が次のようになっていると仮定します。 Dates are: DatetimeIndex(['2020-01-01', '2020-01-02', '2020-01-03', '2020-01-06', '2020-01-07', '2020-01-08', '2020-01-09', '2020-01-10'
-
Pythonでプログラムを作成して、特定のデータフレームで欠落している値の数が最小の列を見つけます
データフレームがあり、欠落値列の最小数がであると仮定します。 DataFrame is: Id Salary Age 0 1.0 20000.0 22.0 1 2.0 NaN 23.0 2 3.0 50000.0 NaN 3 NaN 40000.0 25.0 4 5.0 80000.0 Na
-
特定のデータフレームの各列で2番目に低い値を見つけるPythonコードを記述します
データフレームがあり、各列の2番目に低い値の結果が次のようになっていると仮定します。 Id 2 Salary 30000 Age 23 これを解決するには、以下の手順に従います- 解決策 データフレームを定義する create lambda関数内にdf.apply()関数を設定し、xのような変数を設定して、すべての列にアクセスし、式を次のようにチェックします x.sort_values()。unique()[1] with axis =0は、2番目に低い値を次のように返します。 result = df.ap
-
Pythonでプログラムを作成して、1から100までの30要素のランダム配列を生成し、データフレームの各行の最大値と最小値を計算します
各行の最小値で最大のデータフレームを生成した結果はです。 0 43.000000 1 1.911111 2 2.405405 3 20.000000 4 7.727273 5 6.333333 これを解決するには、以下の手順に従います- ソリューション1 1から100までの30のランダム要素のサイズでデータフレームを定義し、配列を(6,5)で再形成して、2次元配列を変更します df = pd.DataFrame(np.rando
-
Pythonでプログラムを作成し、特定の時系列データから最初と最後の3日間を印刷します
時系列と、指定されたシリーズの最初と最後の3日間の結果が次のようになっていると仮定します。 first three days: 2020-01-01 Chennai 2020-01-03 Delhi Freq: 2D, dtype: object last three days: 2020-01-07 Pune 2020-01-09 Kolkata Freq: 2D, dtype: object これを解決するには、以下の手順に従います- 解決策 シリーズを定義し、データとして保存し
-
区切り文字に基づいて文字列を分割し、シリーズに変換するPython関数を記述します
’区切り文字で文字列を分割し、次のようにシリーズに変換した結果 0 apple 1 orange 2 mango 3 kiwi これを解決するために、以下のアプローチに従います- ソリューション1 2つの引数stringとdelimiterを受け入れる関数split_str()を定義します 区切り文字の値の中にs.split()関数を作成し、split_dataとして保存します split_data = s.split(d) pd.Series()内にsplit_da
-
Tensorflowを使用して、Pythonを使用してトレーニング結果を視覚化するにはどうすればよいですか?
トレーニング結果は、「matplotlib」ライブラリを使用してPythonを使用したTensorflowで視覚化できます。 「plot」メソッドは、コンソールにデータをプロットするために使用されます。 続きを読む: TensorFlowとは何ですか?KerasはTensorFlowとどのように連携してニューラルネットワークを作成しますか? Keras Sequential APIを使用します。これは、すべてのレイヤーに1つの入力テンソルと1つの出力テンソルがあるプレーンスタックのレイヤーを操作するために使用されるシーケンシャルモデルの構築に役立ちます。 少なくとも1つの層を含むニューラ
-
TensorflowとPythonを使用して過剰適合を減らすために、拡張をどのように使用できますか?
拡張を使用して、トレーニングデータを追加することにより、過剰適合を減らすことができます。これは、「RandomFlip」レイヤーを使用するシーケンシャルモデルを作成することによって行われます。 続きを読む: TensorFlowとは何ですか?KerasはTensorFlowとどのように連携してニューラルネットワークを作成しますか? Keras Sequential APIを使用します。これは、すべてのレイヤーに1つの入力テンソルと1つの出力テンソルがあるプレーンスタックのレイヤーを操作するために使用されるシーケンシャルモデルの構築に役立ちます。 少なくとも1つの層を含むニューラルネットワ
-
Pythonでプログラムを作成して、特定のシリーズの各要素からサブストリングをスライスします
一連の要素があり、一連の各要素からサブストリングをスライスした結果が次のようになっていると仮定します。 0 Ap 1 Oa 2 Mn 3 Kw これを解決するために、以下のアプローチに従います- ソリューション1 シリーズを定義する start =0、stop-4、step =2内にstr.slice関数を適用して、シリーズからサブストリングをスライスします。 data.str.slice(start=0,stop=4,step=2) 例 理解を深めるために、次のコードを
-
Pythonでプログラムを作成して、特定のデータフレームでローリングウィンドウサイズ3の平均計算を実行します
データフレームがあり、ローリングウィンドウサイズ3の計算結果が次のようになっていると仮定します。 Average of rolling window is: Id Age Mark 0 NaN NaN NaN 1 1.5 12.0 85.0 2 2.5 13.0 80.0 3 3.5 13.5 82.5 4 4.5 31.5 90.0 5 5.5 60.0 87.5 これを解決するために、以下のアプローチに従います- 解決策 データフレームを定義する df.rolling(window =2).mean()を適用して、ローリングウ
-
Pythonでプログラムを作成して、特定の系列の個別の値を並べ替えた数値インデックス配列を出力します
あなたがシリーズを持っていて、ソートされた個別の値を持つ数値インデックスが-であると仮定します。 Sorted distict values - numeric array index [2 3 0 3 2 1 4] ['apple' 'kiwi' 'mango' 'orange' 'pomegranate'] これを解決するには、以下の手順に従います- 解決策 一意でない要素のリスト内にpd.factorize()関数を適用し、index、index_valueとして保存します。 index,uniq
-
PythonPandasの日時列から日付と時刻を分離するプログラムを作成します
データフレームに日時列があり、日付と時刻を次のように区切る結果があるとします。 datetime date time 0 2020-01-01 07:00:00 2020-01-06 07:00:00 1 2020-01-02 07:00:00 2020-01-06 07:00:00 2 2020-01-03 07:00:00 2020-01-06 07:00:00 3 2020-01-04 07:00:00 2020-01-06 07:00:00 4 2020-01-05
-
Pythonでプログラムを作成して、特定のデータフレームのアジアのタイムゾーンをローカライズします
アジアのタイムゾーンをローカライズするための時系列と結果があると仮定します。 Index is: DatetimeIndex(['2020-01-05 00:30:00+05:30', '2020-01-12 00:30:00+05:30', '2020-01-19 00:30:00+05:30', '2020-01-26 00:30:00+05:30',  
-
特定のデータフレームで回文名をフィルタリングするPythonコードを記述します
回文名を印刷した結果は- Palindrome names are: Id Name 0 1 bob 2 3 hannah これを解決するために、以下のアプローチに従います- ソリューション1 データフレームを定義する set for loop内にリスト内包表記を作成して、i変数を使用してdf [‘Name’]列のすべての値にアクセスし、条件を設定してi ==i [::-1]を比較し、リストにi値を追加します l = [ i for i in df['Name']