Python
 Computer >> コンピューター >  >> プログラミング >> Python

Pythonで特定の文字列からすべての重複を削除します


Pythonで文字列からすべての重複を削除するには、最初に文字列をスペースで分割して、各単語が配列に含まれるようにする必要があります。次に、重複を削除する方法は複数あります。

最初にすべての単語を小文字に変換し、次にそれらを並べ替え、最後に一意の単語のみを選択することで、重複を削除できます。たとえば、

sent = "Hi my name is John Doe John Doe is my name"

# Seperate out each word
words = sent.split(" ")

# Convert all words to lowercase
words = map(lambda x:x.lower(), words)

# Sort the words in order
words.sort()
unique = []
total_words = len(words)
i = 0

while i < (total_words - 1):
while i < total_words and words[i] == words[i + 1]:
i += 1
unique.append(words[i])
i += 1

print(unique)
出力

これにより、出力が得られます-

['doe', 'hi', 'john', 'is', 'my']

  1. 指定された文字列のすべての順列を出力するPythonプログラム

    この記事では、以下に示す問題ステートメントの解決策について学習します。 問題の説明 −文字列の可能なすべての順列を表示するために必要な文字列が与えられます。 次に、以下の実装のソリューションを見てみましょう- 例 # conversion def toString(List):    return ''.join(List) # permutations def permute(a, l, r):    if l == r:       print (toString(a))    e

  2. Pythonで文字列からすべての特殊文字、句読点、スペースを削除するにはどうすればよいですか?

    文字列からすべての特殊文字、句読点、スペースを削除するには、文字列を繰り返し処理し、英数字以外のすべての文字を除外します。例: >>> string = "Hello $#! People   Whitespace 7331" >>> ''.join(e for e in string if e.isalnum()) 'HelloPeopleWhitespace7331' 正規表現を使用して、英数字以外の文字を削除することもできます。 re.sub(regex、string_to_replace