正規表現でパンダの行をフィルタリングするにはどうすればよいですか?
正規表現(regex)は、検索パターンを定義する一連の文字です。パンダの行を正規表現でフィルタリングするには、 str.match()を使用できます。 メソッド。
ステップ
- 2次元、サイズ変更可能、潜在的に異種の表形式データ、 dfを作成します 。
- 入力DataFrame、 dfを印刷します 。
- 変数を初期化する正規表現 式のために。文字列値を正規表現として指定します。たとえば、文字列'J。*' 文字「J」で始まるすべてのエントリをフィルタリングします。
- df.column_name.str.match(regex)を使用します 指定された正規表現で指定された列名のすべてのエントリをフィルタリングします。
例
import pandas as pd df = pd.DataFrame( dict( name=['John', 'Jacob', 'Tom', 'Tim', 'Ally'], marks=[89, 23, 100, 56, 90], subjects=["Math", "Physics", "Chemistry", "Biology", "English"] ) ) print "Input DataFrame is:\n", df regex = 'J.*' print "After applying ", regex, " DataFrame is:\n", df[df.name.str.match(regex)] regex = 'A.*' print "After applying ", regex, " DataFrame is:\n", df[df.name.str.match(regex)]
出力
Input DataFrame is: name marks subjects 0 John 89 Math 1 Jacob 23 Physics 2 Tom 100 Chemistry 3 Tim 56 Biology 4 Ally 90 English After applying J.* DataFrame is: name marks subjects 0 John 89 Math 1 Jacob 23 Physics After applying A.* DataFrame is: name marks subjects 4 Ally 90 English
-
日付パンダデータフレームごとに集計してプロットする方法は?
日付パンダデータフレームごとに集計してプロットするには、次の手順を実行できます- ステップ 図のサイズを設定し、サブプロット間およびサブプロットの周囲のパディングを調整します。 データフレームdfを作成します 、2次元、サイズ変更可能、潜在的に異種の表形式データ。 日付パンダデータフレームごとに集計された値を取得します。 dfをプロットします (ステップ3) kind =barを使用 。 図を表示するには、 show()を使用します メソッド。 例 import numpy as np import pandas as pd from matplotlib
-
Python-PandasDataFrameからnull行を削除する方法
Pandas DataFrameのnull行を削除するには、dropna()メソッドを使用します。以下が、いくつかのNaN、つまりnull値を含むCSVファイルであるとしましょう- read_csv()を使用してCSVファイルを読み取ってみましょう。 CSVはデスクトップにあります- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") dropna()-を使用してnull値を削除します dataFrame = dataFrame.dropna() 例 以下は完全なコードです-