Python
 Computer >> コンピューター >  >> プログラミング >> Python

与えられたPythonリストからのバイグラム形成


バイグラムは、特定の文の2つの連続する単語ごとに1組の単語を作成することによって形成されます。 Pythonでは、この手法はテキスト分析で頻繁に使用されます。以下に、これを実現する方法に関する2つのアプローチを示します。

列挙と分割の使用

これらの2つの方法を使用して、最初に文を複数の単語に分割し、次に列挙関数を使用して、連続する単語から単語のペアを作成します。

list = ['Stop. look left right. go']
print ("The given list is : \n" + str(list))
# Using enumerate() and split() for Bigram formation
output = [(k, m.split()[n + 1]) for m in list for n, k in enumerate(m.split()) if n < len(m.split()) - 1]
print ("Bigram formation from given list is: \n" + str(output))

出力

上記のコードを実行すると、次の結果が得られます-

The given list is :
['Stop. look left right. go']
Bigram formation from given list is:
[('Stop.', 'look'), ('look', 'left'), ('left', 'right.'), ('right.', 'go')]

zip()とsplit()の使用

zipおよびsplit関数を使用してバイアスグラムを作成することもできます。 zip()関数は、split()を使用して文から作成された単語を順番に並べます。

list = ['Stop. look left right. go']
print ("The given list is : \n" + str(list))
# Using zip() and split() for Bigram formation
output = [m for n in list for m in zip(n.split(" ")[:-1], n.split(" ")[1:])]
print ("Bigram formation from given list is: \n" + str(output))

出力

上記のコードを実行すると、次の結果が得られます-

The given list is :
['Stop. look left right. go']
Bigram formation from given list is:
[('Stop.', 'look'), ('look', 'left'), ('left', 'right.'), ('right.', 'go')]

  1. Pythonのリストの指定されたリストから肯定的な要素を取得します

    リストはネストできます。つまり、リストの要素自体がリストです。この記事では、リストのリストから正の数のみを見つける方法を説明します。結果として、新しいリストには正の数を含むネストされたリストが含まれます。 with for in ここでは、数学演算子を適用して、forループを使用してリスト内の要素の値をチェックします。値が正の場合、それをリストとしてキャプチャし、Outerforループストアをリストの最終リストとしてキャプチャします。 例 listA = [[-9, -1, 3], [11, -8, -4,434,0]] # Given list print("Given L

  2. Pythonで分割されたカスタムリスト

    データ分析は、データを移動するためにラングリングする必要がある複雑なシナリオを投げかけます。このコンテキストでは、大きなリストを取得し、要件に従ってそれを多くのサブリストに分割する方法を見てみましょう。この記事では、これを実現するためのアプローチについて説明します。 zipおよびforループ付き このアプローチでは、リストダイシングを使用して、分割が発生する必要があるポイントから要素を取得します。次に、zipとforループを使用して、forループを使用してサブリストを作成します。 例 Alist = ['Mon', 'Tue', 'Wed',