Python

 Computer >> コンピューター >  >> プログラミング >> Python
  1. ファイルからExcelデータを読み取り、最初と最後の列のすべての行を読み取るPythonプログラムを作成します

    お住まいの地域にpandas.xlsxという名前のExcelファイルが保存されているとします。 解決策 これを解決するには、以下の手順に従います- pd.read_excelメソッドを定義して、pandas.xlsxファイルからデータを読み取り、それをdfとして保存します df = pd.read_excel('pandas.xlsx') df.iloc [:、0]を適用して、最初の列のすべての行を印刷します df.iloc[:,0] df.iloc [:、-1]を適用して、最後の列のすべての行を印刷します df.iloc[:,-1] 例 理解

  2. データフレームをhtmlファイルにエクスポートするPythonプログラムを作成します

    すでにpandas.csvファイルを保存し、ファイルをHtml形式にエクスポートしたと仮定します 解決策 これを解決するには、以下の手順に従います- 次のようにread_csvメソッドを使用してcsvファイルを読み取ります- df = pd.read_csv('pandas.csv') ファイルオブジェクトを使用して、書き込みモードで新しいファイルpandas.htmlを作成します。 f = open('pandas.html','w') 結果変数を宣言して、データフレームをhtmlファイル形式に変換します。 re

  3. Pythonでプログラムを作成して、特定の時系列データをリサンプリングし、月末の最大頻度を見つけます

    時系列と最大月末頻度の結果があると仮定します DataFrame is:  Id time_series 0 1 2020-01-05 1 2 2020-01-12 2 3 2020-01-19 3 4 2020-01-26 4 5 2020-02-02 5 6 2020-02-09 6 7 2020-02-16 7 8 2020-02-23 8 9 2020-03-01 9 10 2020-03-08 Maximum month end frequency:               Id time_serie

  4. ファイルからJSONデータを読み取り、それをデータフレーム、CSVファイルに変換するPythonコードを記述します

    次のサンプルjsonデータがpandas_sample.jsonとしてファイルに保存されていると仮定します。 {    "employee": {       "name": "emp1",       "salary": 50000,       "age": 31    } } csvに変換した後の結果 ,employee age,31 name,emp1 s

  5. Pythonでプログラムを作成して、特定のデータフレームをPickleファイル形式にエクスポートし、Pickleファイルからコンテンツを読み取ります。

    ピクルスファイルにエクスポートするためのデータフレームと結果があり、ファイルから内容を次のように読み取ると仮定します。 Export to pickle file: Read contents from pickle file:   Fruits    City 0 Apple    Shimla 1 Orange   Sydney 2 Mango    Lucknow 3 Kiwi    Wellington 解決策 これを解決するには、以下の手順に従います- データフレームを定義しま

  6. Pythonでプログラムを作成して、系列とラグの数の間の自己相関を計算します

    系列があり、ラグ2との自己相関の結果が次のようになっていると仮定します。 Series is: 0    2.0 1    10.0 2    3.0 3    4.0 4    9.0 5    10.0 6    2.0 7    NaN 8    3.0 dtype: float64 series correlation:    -0.4711538461538461 series corr

  7. インデックス値に基づいてデータフレーム時系列データを切り捨てるプログラムを作成します

    時系列データを含むデータフレームがあり、切り捨てられたデータの結果は、であると想定します。 before truncate:  Id time_series 0 1 2020-01-05 1 2 2020-01-12 2 3 2020-01-19 3 4 2020-01-26 4 5 2020-02-02 5 6 2020-02-09 6 7 2020-02-16 7 8 2020-02-23 8 9 2020-03-01 9 10 2020-03-08 after truncate:  Id time_series 1 2 2020-01-12 解決策 これを解決するに

  8. さまざまな方法で特定のデータフレームを再形成するPythonプログラムを作成する

    Melt()、stack()、unstack()、pivot()関数を使用してデータフレームの形状を変更できます。 ソリューション1 データフレームを定義します。 ワイドデータフレーム列を行として変換するには、melt()関数を適用します。以下に定義されています df.melt() 例 理解を深めるために、以下のコードを見てみましょう- import pandas as pd df = pd.DataFrame({'Id':[1,2,3],'Age':[13,14,13],'Mark':[80,90,85]}) print(&q

  9. Pythonでプログラムを作成して、グループ化されたデータの共分散を計算し、特定のデータフレーム内の2つの列間のグループ化されたデータの共分散を計算します

    グループ化されたデータと対応する列から共分散を計算するためのデータフレームと結果があると仮定します。 Grouped data covariance is:                   mark1       mark2 subjects maths    mark1    25.0    12.500000          mark2   &nb

  10. Pythonでプログラムを作成して、特定のデータフレームの最初の重複行を削除します

    データフレームがあり、最初の重複行を削除した結果は、であると想定します。     Id Age 0    1 12 3    4 13 4    5 14 5    6 12 6    2 13 7    7 16 8    3 14 9    9 15 10  10 14 解決策 これを解決するには、以下の手順に従います- データフレームを定義する IdおよびAge列内にdrop_dupli

  11. Pythonでプログラムを作成して、データフレームインデックスを正と負の方向に2ピリオドシフトします

    データフレームがあり、正と負の方向に2ピリオドだけシフトインデックスがあると仮定します。 shift the index by three periods in positive direction                      Id Age 2020-01-01 00:00:00 NaN NaN 2020-01-01 12:00:00 NaN NaN 2020-01-02 00:00:00 1.0 10.0 2020-01-02 12:00:00 2.0 12.0 202

  12. Pythonでプログラムを作成して、データフレームの辞書からパネルを作成し、最初の列の最大値を出力します

    パネルの最初の列の最大値の結果はです。 maximum value of first column is ; Column1    1.377292 解決策 これを解決するために、以下のアプローチに従います- ディクショナリキーが「Column1」であり、値がpd.DataFrame(np.random.randn(5、3))であるため、データ値を設定します data = {'Column1' : pd.DataFrame(np.random.randn(5, 3))} Panelにデータを割り当て、pとして保存します p = pd.P

  13. Pythonでプログラムを作成して、データフレーム内の特定の列の最小ランクを見つけます

    解決策 特定の列のデータフレームと最小ランクがあると仮定します。  Id Name    Age    Rank 0 1 Adam    12    1.0 1 2 David   13    3.0 2 3 Michael 14    5.0 3 4 Peter   12    1.0 4 5 William 13    3.0 これを解決するには、以下の手順に従います- データフレームを定義し

  14. パネルの最初の行の平均を見つけるPythonプログラムを作成します

    Panelがあり、最初の行の平均がであると仮定します。 Average of first row is: Column1    0.274124 dtype: float64 解決策 これを解決するには、以下の手順に従います- ディクショナリキーが「Column1」であり、値がpd.DataFrame(np.random.randn(5、3))であるため、データ値を設定します data = {'Column1' : pd.DataFrame(np.random.randn(5, 3))} Panelにデータを割り当て、pとして保存します

  15. Pythonプログラムを作成して、データフレーム内の行と列の平均絶対偏差を見つけます

    解決策 データフレームがあり、行と列の平均絶対偏差がであると仮定します。 mad of columns: Column1    0.938776 Column2    0.600000 dtype: float64 mad of rows: 0    0.500 1    0.900 2    0.650 3    0.900 4    0.750 5    0.575 6    1.325 dtype: flo

  16. データフレーム内の分布の形を定量化するPythonプログラムを作成する

    データフレームがあり、分布の形を定量化した結果は、であると仮定します。 kurtosis is: Column1    -1.526243 Column2     1.948382 dtype: float64 asymmetry distribution - skewness is: Column1    -0.280389 Column2     1.309355 dtype: float64 解決策 これを解決するには、以下の手順に従います- データフレームを定義する df.kurt(axis

  17. データフレームの最小および最大しきい値をトリミングするPythonプログラムを作成します

    最小および最大しきい値のトリムのデータフレームと結果があると仮定します。 minimum threshold:    Column1 Column2 0    30    30 1    34    30 2    56    30 3    78    50 4    30    90 maximum threshold:    Column1 Colum

  18. データフレームでテーブル単位のパイプ関数を実行するPythonプログラムを作成します

    データフレームがあり、テーブル単位の関数の結果が次のようになっていると仮定します。 Table wise function:    Id  Mark 0  6.0 85.0 1  7.0 95.0 2  8.0 75.0 3  9.0 90.0 4 10.0 95.0 解決策 これを解決するには、以下の手順に従います- データフレームを定義する 2つの引数を持つユーザー定義関数avgを作成し、結果を(a + b / 2)として返します。以下に定義されています def avg(a,b):   &nb

  19. 上位2と下位2の値のId列とAge列の間の変化率を計算するPythonコードを記述します

    データフレームがあり、Id列とAge列の上位2と下位2の値の間の変化率の結果があると仮定します Id and Age-top 2 values    Id Age 0 NaN NaN 1 1.0 0.0 Id and Age-bottom 2 values       Id      Age 3 0.000000 -0.071429 4 0.666667 0.000000 解決策 これを解決するには、以下の手順に従います- データフレームを定義する スライス[0:2] 内にdf[[‘Id’、’Age’

  20. 適用マップを使用してデータフレーム内のすべての列の要素の長さを出力するPythonでプログラムを作成します

    データフレームのすべての列の要素の長さの結果は、です。 Dataframe is:    Fruits    City 0 Apple    Shimla 1 Orange   Sydney 2 Mango    Lucknow 3 Kiwi    Wellington Length of the elements in all columns    Fruits City 0    5    6 1    

Total 8994 -コンピューター  FirstPage PreviousPage NextPage LastPage CurrentPage:231/450  20-コンピューター/Page Goto:1 225 226 227 228 229 230 231 232 233 234 235 236 237