-
ファイルからExcelデータを読み取り、最初と最後の列のすべての行を読み取るPythonプログラムを作成します
お住まいの地域にpandas.xlsxという名前のExcelファイルが保存されているとします。 解決策 これを解決するには、以下の手順に従います- pd.read_excelメソッドを定義して、pandas.xlsxファイルからデータを読み取り、それをdfとして保存します df = pd.read_excel('pandas.xlsx') df.iloc [:、0]を適用して、最初の列のすべての行を印刷します df.iloc[:,0] df.iloc [:、-1]を適用して、最後の列のすべての行を印刷します df.iloc[:,-1] 例 理解
-
データフレームをhtmlファイルにエクスポートするPythonプログラムを作成します
すでにpandas.csvファイルを保存し、ファイルをHtml形式にエクスポートしたと仮定します 解決策 これを解決するには、以下の手順に従います- 次のようにread_csvメソッドを使用してcsvファイルを読み取ります- df = pd.read_csv('pandas.csv') ファイルオブジェクトを使用して、書き込みモードで新しいファイルpandas.htmlを作成します。 f = open('pandas.html','w') 結果変数を宣言して、データフレームをhtmlファイル形式に変換します。 re
-
Pythonでプログラムを作成して、特定の時系列データをリサンプリングし、月末の最大頻度を見つけます
時系列と最大月末頻度の結果があると仮定します DataFrame is: Id time_series 0 1 2020-01-05 1 2 2020-01-12 2 3 2020-01-19 3 4 2020-01-26 4 5 2020-02-02 5 6 2020-02-09 6 7 2020-02-16 7 8 2020-02-23 8 9 2020-03-01 9 10 2020-03-08 Maximum month end frequency: Id time_serie
-
ファイルからJSONデータを読み取り、それをデータフレーム、CSVファイルに変換するPythonコードを記述します
次のサンプルjsonデータがpandas_sample.jsonとしてファイルに保存されていると仮定します。 { "employee": { "name": "emp1", "salary": 50000, "age": 31 } } csvに変換した後の結果 ,employee age,31 name,emp1 s
-
Pythonでプログラムを作成して、特定のデータフレームをPickleファイル形式にエクスポートし、Pickleファイルからコンテンツを読み取ります。
ピクルスファイルにエクスポートするためのデータフレームと結果があり、ファイルから内容を次のように読み取ると仮定します。 Export to pickle file: Read contents from pickle file: Fruits City 0 Apple Shimla 1 Orange Sydney 2 Mango Lucknow 3 Kiwi Wellington 解決策 これを解決するには、以下の手順に従います- データフレームを定義しま
-
Pythonでプログラムを作成して、系列とラグの数の間の自己相関を計算します
系列があり、ラグ2との自己相関の結果が次のようになっていると仮定します。 Series is: 0 2.0 1 10.0 2 3.0 3 4.0 4 9.0 5 10.0 6 2.0 7 NaN 8 3.0 dtype: float64 series correlation: -0.4711538461538461 series corr
-
インデックス値に基づいてデータフレーム時系列データを切り捨てるプログラムを作成します
時系列データを含むデータフレームがあり、切り捨てられたデータの結果は、であると想定します。 before truncate: Id time_series 0 1 2020-01-05 1 2 2020-01-12 2 3 2020-01-19 3 4 2020-01-26 4 5 2020-02-02 5 6 2020-02-09 6 7 2020-02-16 7 8 2020-02-23 8 9 2020-03-01 9 10 2020-03-08 after truncate: Id time_series 1 2 2020-01-12 解決策 これを解決するに
-
さまざまな方法で特定のデータフレームを再形成するPythonプログラムを作成する
Melt()、stack()、unstack()、pivot()関数を使用してデータフレームの形状を変更できます。 ソリューション1 データフレームを定義します。 ワイドデータフレーム列を行として変換するには、melt()関数を適用します。以下に定義されています df.melt() 例 理解を深めるために、以下のコードを見てみましょう- import pandas as pd df = pd.DataFrame({'Id':[1,2,3],'Age':[13,14,13],'Mark':[80,90,85]}) print(&q
-
Pythonでプログラムを作成して、グループ化されたデータの共分散を計算し、特定のデータフレーム内の2つの列間のグループ化されたデータの共分散を計算します
グループ化されたデータと対応する列から共分散を計算するためのデータフレームと結果があると仮定します。 Grouped data covariance is: mark1 mark2 subjects maths mark1 25.0 12.500000 mark2 &nb
-
Pythonでプログラムを作成して、特定のデータフレームの最初の重複行を削除します
データフレームがあり、最初の重複行を削除した結果は、であると想定します。 Id Age 0 1 12 3 4 13 4 5 14 5 6 12 6 2 13 7 7 16 8 3 14 9 9 15 10 10 14 解決策 これを解決するには、以下の手順に従います- データフレームを定義する IdおよびAge列内にdrop_dupli
-
Pythonでプログラムを作成して、データフレームインデックスを正と負の方向に2ピリオドシフトします
データフレームがあり、正と負の方向に2ピリオドだけシフトインデックスがあると仮定します。 shift the index by three periods in positive direction Id Age 2020-01-01 00:00:00 NaN NaN 2020-01-01 12:00:00 NaN NaN 2020-01-02 00:00:00 1.0 10.0 2020-01-02 12:00:00 2.0 12.0 202
-
Pythonでプログラムを作成して、データフレームの辞書からパネルを作成し、最初の列の最大値を出力します
パネルの最初の列の最大値の結果はです。 maximum value of first column is ; Column1 1.377292 解決策 これを解決するために、以下のアプローチに従います- ディクショナリキーが「Column1」であり、値がpd.DataFrame(np.random.randn(5、3))であるため、データ値を設定します data = {'Column1' : pd.DataFrame(np.random.randn(5, 3))} Panelにデータを割り当て、pとして保存します p = pd.P
-
Pythonでプログラムを作成して、データフレーム内の特定の列の最小ランクを見つけます
解決策 特定の列のデータフレームと最小ランクがあると仮定します。 Id Name Age Rank 0 1 Adam 12 1.0 1 2 David 13 3.0 2 3 Michael 14 5.0 3 4 Peter 12 1.0 4 5 William 13 3.0 これを解決するには、以下の手順に従います- データフレームを定義し
-
パネルの最初の行の平均を見つけるPythonプログラムを作成します
Panelがあり、最初の行の平均がであると仮定します。 Average of first row is: Column1 0.274124 dtype: float64 解決策 これを解決するには、以下の手順に従います- ディクショナリキーが「Column1」であり、値がpd.DataFrame(np.random.randn(5、3))であるため、データ値を設定します data = {'Column1' : pd.DataFrame(np.random.randn(5, 3))} Panelにデータを割り当て、pとして保存します
-
Pythonプログラムを作成して、データフレーム内の行と列の平均絶対偏差を見つけます
解決策 データフレームがあり、行と列の平均絶対偏差がであると仮定します。 mad of columns: Column1 0.938776 Column2 0.600000 dtype: float64 mad of rows: 0 0.500 1 0.900 2 0.650 3 0.900 4 0.750 5 0.575 6 1.325 dtype: flo
-
データフレーム内の分布の形を定量化するPythonプログラムを作成する
データフレームがあり、分布の形を定量化した結果は、であると仮定します。 kurtosis is: Column1 -1.526243 Column2 1.948382 dtype: float64 asymmetry distribution - skewness is: Column1 -0.280389 Column2 1.309355 dtype: float64 解決策 これを解決するには、以下の手順に従います- データフレームを定義する df.kurt(axis
-
データフレームの最小および最大しきい値をトリミングするPythonプログラムを作成します
最小および最大しきい値のトリムのデータフレームと結果があると仮定します。 minimum threshold: Column1 Column2 0 30 30 1 34 30 2 56 30 3 78 50 4 30 90 maximum threshold: Column1 Colum
-
データフレームでテーブル単位のパイプ関数を実行するPythonプログラムを作成します
データフレームがあり、テーブル単位の関数の結果が次のようになっていると仮定します。 Table wise function: Id Mark 0 6.0 85.0 1 7.0 95.0 2 8.0 75.0 3 9.0 90.0 4 10.0 95.0 解決策 これを解決するには、以下の手順に従います- データフレームを定義する 2つの引数を持つユーザー定義関数avgを作成し、結果を(a + b / 2)として返します。以下に定義されています def avg(a,b): &nb
-
上位2と下位2の値のId列とAge列の間の変化率を計算するPythonコードを記述します
データフレームがあり、Id列とAge列の上位2と下位2の値の間の変化率の結果があると仮定します Id and Age-top 2 values Id Age 0 NaN NaN 1 1.0 0.0 Id and Age-bottom 2 values Id Age 3 0.000000 -0.071429 4 0.666667 0.000000 解決策 これを解決するには、以下の手順に従います- データフレームを定義する スライス[0:2] 内にdf[[‘Id’、’Age’
-
適用マップを使用してデータフレーム内のすべての列の要素の長さを出力するPythonでプログラムを作成します
データフレームのすべての列の要素の長さの結果は、です。 Dataframe is: Fruits City 0 Apple Shimla 1 Orange Sydney 2 Mango Lucknow 3 Kiwi Wellington Length of the elements in all columns Fruits City 0 5 6 1