Python
 Computer >> コンピューター >  >> プログラミング >> Python

Pythonのデータセットから最も頻繁に使用されるk個の単語を検索します


データセット内で最も頻繁に使用される10個の単語を検索する必要がある場合、Pythonはコレクションモジュールを使用してその単語を検索するのに役立ちます。 collectionsモジュールには、単語のリストを提供した後の単語の数を示すカウンタークラスがあります。また、most_commonメソッドを使用して、プログラム入力に必要な単語の数を調べます。

以下の例では、段落を取り、最初にsplit()を適用する単語のリストを作成します。次に、counter()を適用して、すべての単語の数を見つけます。最後に、most_common関数は、必要な頻度が最も高いそのような単語の数の適切な結果を提供します。

from collections import Counter
word_set = " This is a series of strings to count " \
   "many words . They sometime hurt and words sometime inspire "\
   "Also sometime fewer words convey more meaning than a bag of words "\
   "Be careful what you speak or what you write or even what you think of. "\
# Create list of all the words in the string
word_list = word_set.split()

# Get the count of each word.
word_count = Counter(word_list)

# Use most_common() method from Counter subclass
print(word_count.most_common(3))

出力

上記のコードを実行すると、次の結果が得られます-

[('words', 4), ('sometime', 3), ('what', 3)]

  1. 2つの文字列から珍しい単語を見つけるPythonプログラム

    この記事では、以下に示す問題ステートメントの解決策について学習します。 問題の説明 − 2つの文字列が与えられているので、与えられた文字列から珍しい単語を取得する必要があります。 次に、以下の実装のソリューションを見てみましょう- 例 # uncommon words def find(A, B):    # count    count = {}    # insert in A    for word in A.split():       count[word] = coun

  2. セットからアイテムを削除するPythonプログラム

    数学の観点から、私たちは集合について知っているので、私たちは集合という用語に非常に精通しています。 Pythonの集合は、数学の集合と同等のデータ構造です。さまざまな要素で構成されている可能性があります。セット内の要素の順序は未定義です。セットの要素を追加および削除したり、セットの要素を反復したり、セットに対して標準の操作(和集合、共通部分、差)を実行したりできます。 ここでは、セットから要素を削除するだけでセットが与えられます。ここではpop()メソッドを使用します。pop()はPythonに組み込まれているメソッドであり、要素を1つずつセットからポップアウトまたは削除するために使用されま