Python
 Computer >> コンピューター >  >> プログラミング >> Python

正規表現(Regex)を使用して、Pandasシリーズの有効な電子メールをフィルタリングするにはどうすればよいですか?


正規表現は、検索パターンを定義する一連の文字です。このプログラムでは、これらの正規表現を使用して、有効な電子メールと無効な電子メールをフィルタリングします。

さまざまなメールでPandasシリーズを定義し、どのメールが有効かを確認します。また、正規表現の目的で使用されるreと呼ばれるPythonライブラリを使用します。

アルゴリズム

Step 1: Define a Pandas series of different email ids.
Step 2: Define a regex for checking validity of emails.
Step 3: Use the re.search() function in the re library for checking the validity of the email.

サンプルコード

import pandas as pd
import re

series = pd.Series(['[email protected]', 'hellowolrd.com'])
regex = '^[a-z0-9]+[\._]?[a-z0-9]+[@]\w+[.]\w{2,3}$'
for email in series:
   if re.search(regex, email):
      print("{}: Valid Email".format(email))
   else:
      print("{} : Invalid Email".format(email))

出力

[email protected]: Valid Email
hellowolrd.com : Invalid Email

説明

正規表現変数には次の記号があります:

  • ^ :文字列の先頭のアンカー
  • [] :開き角かっこと閉じ角かっこは、単一の文字に一致する文字クラスを定義します
  • \ :エスケープ文字
  • :ドットは改行記号以外のすべての文字と一致します
  • {} :開始と終了の中括弧は範囲の定義に使用されます
  • $ :ドル記号は文字列の終わりのアンカーです

  1. プロフェッショナルなメール用にGmailでカスタムメールアドレスを使用する方法

    電子メールは、依然として専門的なコミュニケーションのための最良の方法です。私たちはビジネスや職業のために毎日メールを使用しており、それは専門家の連絡先にとって最も好ましいコミュニケーションの形態です。 あなたのメールアドレスが専門的な感覚を持っていれば、あなたのメールがより大きな影響を与える可能性があると感じたことはありますか? プロのメールアドレスには、@gmail.comではなく@yourwebsite.comを付ける必要があります。したがって、yourname @ gmail.comの代わりに、メールは[email protected]から送信されたように見えます。たと

  2. タイムブロッキングを使用して、気が散る電子メールやメッセージを制限する方法

    職場では効果的なコミュニケーションが重要ですが、集中しようとすると気が散ることがあります。すべてのメールやメッセージにすぐに返信する必要があると考えるのは簡単ですが、それが完全な会話になり、本当に時間がない場合もあります。 この記事では、コミュニケーションを時間ブロックして、目の前のタスクに集中できるようにする方法について説明します。 1.受信トレイをブロックする時間 メールを受信するたびに受信トレイをクリックし続けると、多くのことを成し遂げることができなくなります。メールを読んだり返信したりするために、目の前のタスクから時間を取っているだけでなく、再び集中するのにも時間がかかります。