Python
 Computer >> コンピューター >  >> プログラミング >> Python

すべての記述統計を含むRデータフレームの統計要約を見つける方法は?


Rデータフレームの統計的要約を見つけると、最小値、第1四分位数、中央値、平均、第3四分位数、および最大値のみが取得されますが、説明では、分散、標準偏差、歪度、尖度などの他の多くの有用な測定値があります。 、など。したがって、この目的のためにfBasicsパッケージのbasicStats関数を使用できます。

fBasicsパッケージの読み込み-

ライブラリ(fBasics)

ベースRのmtcarsデータを検討します-

 data(mtcars)head(mtcars、20)

出力

 mpg cyl disp hp drat wt qsec vs am gear carbMazda RX4 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4Mazda RX4 Wag 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4Datsun 710 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1Hornet 4 Drive 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1Hornet Sportabout 18.7 8 360.0 175 3.15 3.440 17.02 0 0 3 2Valiant 18.1 6 225.0 105 2.76 3.460 20.22 1 0 3 1Duster 360 14.3 8 360.0 245 3.21 3.570 15.84 0 0 3 4Merc 240D 24.4 4 146.7 62 3.69 3.190 20.00 1 0 4 2Merc 230 22.8 4 140.8 95 3.92 3.150 22.90 1 0 4 2Merc 280 19.2 6 167.6 123 3.92 3.440 18.30 1 0 4 4Merc 280C 17.8 6 167.6 123 3.92 3.440 18.90 1 0 4 4Merc 450SE 16.4 8 275.8 180 3.07 4.070 17.40 0 0 3 3Merc 450SL 17.3 8 275.8 180 3.07 3.730 17.60 0 0 3 3Merc 450SLC 15.2 8 275.8 180 3.07 3.780 18.00 0 033キャデラックフリートウッド10.48472.0 205 2.93 5.250 17.98 0 034リンカーンコンチネンタル10.48460.0 215 3.00 5.424 17.82 0 034クライスラーインペリアル14.78440.0 230 3.23 5.345 17.42 0 0 34フィアット12832.44 78.7 66 4.08 2.200 19.47 1 141ホンダシビック30.4475.7 52 4.93 1.615 18.52 1 142トヨタカローラ33.9471.1 65 4.22 1.835 19.90 1 1 4 1 

mtcarsデータセットの統計要約を見つける-

> basicStats(mtcars)
 mpg cyl disp hp dratnobs 32.000000 32.000000 32.000000 32.000000 32.000000NAs 0.000000 0.000000 0.000000 0.000000 0.000000Minimum 10.400000 4.000000 71.100000 52.000000 2.760000Maximum 33.900000 8.000000 472.000000 335.000000 4.930000 1.Quartile 15.425000 4.000000 120.825000 96.500000 3.08 230.721875 146.687500 3.596563Median 19.200000 6.000000 196.300000 123.000000 3.695000Sum 642.900000 198.000000 7383.100000 4694.000000 115.090000SE平均1.065424 0.315709 21.909473 12.120317 0.094519 LCLMean 17.917679 5.543607 186.037211 121.967950 3.403790 UCLMean 22.263571 6.831393 275.406539 171.407050 3.789335Variance 36.324103 3.189516 15360.799829 4700.866935 0.285881Stdev 6.026948 1.785922 68.562868 123.938694 0.534679Skewness 0.610655 -0.174612 0.381657 0.726024 0.265904尖度-0.3727661-1.762120-1.207212 -0.135551 -0.714701 


 wt qsec vs am gea r carbnobs 32.000000 32.000000 32.000000 32.000000 32.000000 32.000000NAs 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000Minimum 1.513000 14.500000 0.000000 0.000000 3.000000 1.000000Maximum 5.424000 22.900000 1.000000 1.000000 5.000000 8.000000 1.Quartile 2.581250 16.892500 0.000000 0.000000 18.900000 1.000000 1.000000 4.000000 4.000000Mean 3.217250 17.848750 0.437500 0.406250 3.687500 2.812500 Median 3.325000 17.710000 0.000000 0.000000 4.000000 2.000000Sum 102.952000 571.160000 14.000000 13.000000 118.000000 90.000000SE Mean 0.172968 0.315890 0.089098 0.088210 0.130427 0.285530LCL Mean 2.864478分散0.9573793.1931660.254032 0.248992 0.544355 2.608871Stdev 0.978457 1.786943 0.504016 0.4989910.7378041.615200歪度0.4231460.3690450.240258 0.364016 0.5288541.050874尖度-0.0227110.335114-2.001938 -1.924741 -1.069751 1.257043 

ベースRの樹木データと気圧データを使用したさらに2つの例を見てみましょう。

木のデータの例-

 data(trees)head(trees、20)

出力

ガースハイトボリューム18.370 10.32 8.6 65 10.33 8.8 63 10.24 10.5 72 16.45 10.7 81 18.86 10.8 83 19.77 11.0 66 15.68 11.0 75 18.29 11.1 80 22.610 11.2 75 19.911 11.3 79 24.212 11.4 76 21.013 11.4 76 21.414 11.7 69 21.315 12.0 75 19.116 12.9 74 22.217 12.9 85 33.818 13.3 86 27.419 13.7 71 25.720 13.8 64 24.9 


> basicStats(trees)Girth Height Volumenobs 31.000000 31.000000 31.000000 NAs 0.000000 0.000000 0.000000Minimum 8.300000 63.000000 10.200000 Maximum 20.600000 87.000000 77.000000 1. Quartile 11.050000 72.000000 19.400000 3.Quartile 15.250000 80.000000 37.300000 Mean 13.248387 76.000000 30.170968 SE平均0.5636261.1444112.952324LCL平均12.09730973.66280024.141517UCL平均14.39946678.33720036.200418分散9.84791440.600000270.202796 Stdev 3.1381396.37181316.437846歪度0.501056-0.3568771.013274尖度-0.710941-0.7233680.2460 

圧力データの例-

 data(pressure)head(pressure、20)

出力

温度圧力100.00022 20 0.00123 40 0.00604 60 0.03005 80 0.09006 100 0.27007 120 0.75008 140 1.85009 160 4.200010 180 8.800011 200 17.300012 220 32.100013 240 57.000014 260 96.000015 280 157.000016 300 247.000017 320 376.000018 340 558.000019 360 806.0000 


 basicStats(pressure)temperature pressurenobs 19.000000 19.000000NAs 0.000000 0.000000Minimum 0.000000 0.000200Maximum360.000000806.0000001。四分位90.0000000.1800003。四分位数270.000000126.500000平均値180.000000124.336705中央値180.0000008.800000合計3420.00000002362.397400SE平均値25.81898951.531945LCL平均値125.75442616.072107UCL平均値234.245574232.601304分散12666.66666750455.285428Stdev 112.546287 224.622540S 
  1. matplotlibの折れ線グラフのデータインデックスで線の色を変える方法は?

    matplotlibの折れ線グラフのデータインデックスによって線の色を変えるには、次の手順を実行します- ステップ 図のサイズを設定し、サブプロット間およびサブプロットの周囲のパディングを調整します。 numpyを使用してxおよびyデータポイントを作成します。 制限を小さくする、 dydx 。 ポイントを取得する およびセグメント numpyを使用したデータポイント。 図とサブプロットのセットを作成します。 呼び出されたときに、データをある範囲に線形に正規化するクラスを作成します。 numpy配列から画像配列を設定します*A * 。 コレクシ

  2. Pythonで拡張子が.txtのディレクトリ内のすべてのファイルを見つける方法は?

    os.listdirメソッドを使用して、ディレクトリ内のすべてのディレクトリとファイルを取得できます。次に、リストをフィルタリングしてファイルのみを取得し、それらの拡張子も確認します。 例 >>> import os >>> file_list = [f for f in os.listdir('.') if os.path.isfile(os.path.join('.', f)) and f.endswith('.txt')] >>> print file_list ['LICENS