Python
 Computer >> コンピューター >  >> プログラミング >> Python

一連のアルファベットと数字を分離してデータフレームに変換するPythonプログラムを作成します


アルファベットと数字を区切るシリーズと結果があり、それをデータフレームに次のように格納するとします。

series is:
0    abx123
1    bcd25
2    cxy30
dtype: object
Dataframe is
   0   1
0 abx 123
1 bcd 25
2 cxy 30

これを解決するために、以下のアプローチに従います

解決策

  • シリーズを定義します。

  • 内部のAppleシリーズ抽出メソッドは、正規表現パターンを使用してアルファベットと数字を分離し、それをデータフレームに格納します-

series.str.extract(r'(\w+[a-z])(\d+)')

理解を深めるために、以下の実装を見てみましょう-

import pandas as pd
series = pd.Series(['abx123', 'bcd25', 'cxy30'])
print("series is:\n",series)
df = series.str.extract(r'(\w+[a-z])(\d+)')
print("Dataframe is\n:" ,df)

出力

series is:
0    abx123
1    bcd25
2    cxy30
dtype: object
Dataframe is
:  0   1
0 abx 123
1 bcd 25
2 cxy 30

  1. 特定のシリーズの有効な日付をフィルタリングするプログラムをPythonで作成します

    入力 −シリーズがあると仮定します 0 2010-03-12 1 2011-3-1 2 2020-10-10 3 11-2-2 出力 −そして、シリーズの有効な日付の結果は、 0 2010-03-12 2 2020-10-10 ソリューション1 シリーズを定義します。 ラムダフィルターメソッドを適用して、一連のパターンを検証します。 data = pd.Series(l) result = pd.Series(filter(lambda x:re.match(r"\d{4}\W\d{2}\W\d{2}",x),data)) 最後に、isin()関数を

  2. Pythonでプログラムを作成して、一連の5つのランダムな偶数インデックスの小文字のアルファベットを生成します

    ソリューション1 リストに小文字のアルファベットを定義します。 forループを作成し、偶数のインデックス要素を見つけて、別のリストに追加します。以下に定義されています    ls = []    for i in l:       if(l.index(i)%2==0):          ls.append(i) 最後に、ランダムなサンプル5の値をリストに適用し、系列を生成します。 例 import pandas as pd import stri