インターネット
 Computer >> コンピューター >  >> ネットワーキング >> インターネット

GoogleNgramをより効果的に使用する方法

GoogleNgramをより効果的に使用する方法

言語と言語学の研究では、特に時間の経過とともに、単語がどのように使用されているかに関するデータが必要になることがよくあります。調査は必要ですが、必要なデータを提供するためのツールを用意することは大歓迎です。 Google Ngram Viewerは、Googleブックスライブラリ全体の単語の傾向をすばやく見つけるための優れた方法です。

この投稿では、GoogleNgramをより効果的に使用する方法を紹介します。まず、ツールを紹介しましょう。

GoogleNgramの紹介

Googleは、公開された言語の多言語データベースを維持しています。書籍をまとめてスキャンすることで、検索の巨人はテキストを処理し、単語の頻度に基づいて統計を提供することができます。

Google Ngram Viewer検索ツールを使用すると、このデータを検索できます。単語の相対的な人気を比較することで、言語と文化が時間の経過とともにどのように変化したかをマッピングできます。

ただし、Google Ngramツールは、これから説明するように、単に単語の頻度を報告するだけではありません。

基本的な検索の実行方法

高度な「戦術」に入る前に、基本的な検索を実行する方法を実行してみましょう。 Google Ngramページから、検索ボックスにキーワードを入力します。

GoogleNgramをより効果的に使用する方法

単語のすべての大文字を含める場合は、大文字と小文字を区別しないボタンにチェックマークを付けます。この検索には「Tech」と「tech」が含まれます。

検索ボックスの下で、日付範囲や「スムージング」などのパラメータを設定することもできます。後者の値は、データから非定型のスパイクとディップを削除します。平滑化の値を低くするとより正確になり、値を高くするとより深い傾向のみが明らかになります。

「コーパス」の選び方

コーパスは、NgramViewerが調べるテキストコレクションです。デフォルトの「英語」はカジュアルなブラウジングには使用できますが、高度なアカデミックな場合があります。

GoogleNgramをより効果的に使用する方法

「イングリッシュフィクション」は、一般的な言葉をより忠実に反映します。標準の「英語」コーパスは、多くの専門用語を含むノンフィクションの重いものにすることができます。

コーパスの選択の背後にあるより深い意味はこの記事の範囲を超えていますが、Googleはあなたにとって正しい選択についての簡単な洞察を提供します。

高度な検索の実行

追加の検索語を使用することで、複雑な比較を作成できます。これを行うには、各用語をコンマで区切ります。

GoogleNgramをより効果的に使用する方法

Ngram Viewerは、検索用語の相対頻度を1つのグラフに表示します。ここで、グラフの線にカーソルを合わせると、正確なデータポイントを確認できます。

GoogleNgramをより効果的に使用する方法

検索語でワイルドカードとしてアスタリスクを使用することもできます。たとえば、「Bachelor of *」は、多くの学士号の結果を返します。

GoogleNgramをより効果的に使用する方法

用語のすべての語尾変化を見つけるには、「_INF」修飾子を追加します。

GoogleNgramをより効果的に使用する方法

単語に多くの品詞が含まれている場合は、テキスト演算子を使用してより具体的にすることができます。 Googleのデータベースの有効な品詞には、次のすべてが含まれます。

  • _ADJ _ :形容詞(速い、大きい、賢い)
  • _ADV _ :副詞(すばやく、後で、常に)
  • _PRON _ :代名詞(彼ら、それ、私たち)
  • _DET _ :限定詞または冠詞(a、an、the)
  • _ADP _ :前置詞(前置詞と後置詞)
  • _NUM _ :数字(1番目、2番目、5番目)
  • _CONJ _ :接続詞(and、nor、but)
  • _PRT _ :パーティクル。これはキャッチオールであり、他の単語機能ではめったに使用されないカテゴリです

これらのそれぞれをフレーズに組み合わせることができます。たとえば、「_ADJ_boy」は形容詞と「boy」の単語ペアを返します。

1つの検索語の特定の品詞を指定するには、それを最後に追加します。たとえば、末尾にアンダースコアがない「water_VERB」。特定の単語の品詞をすべて含めるには、アンダースコアの後にワイルドカード演算子を使用します。

機能変数、構成、および依存関係

GoogleNgramをより効果的に使用する方法

関数変数を使用すると、単語の関数または配置で検索できます。

  • _ROOT _ 文の解析ツリーのルートのプレースホルダーです。これは通常、主な主題または動詞によって変更された単語です。
  • _START _ 文の始まりを示します。 (「_START_オバマ大統領」は開始の文のみを返します 「オバマ大統領」というフレーズで。)
  • _END _ 文の終わりを示します。 (「_ADP__END_」は終了する文を返します 前置詞で。)

検索用語と算術演算子を組み合わせることで、用語頻度の値を使用して簡単な数学分析を実行できます。

  • + 1つの検索語に複数の式を追加します
  • 左側の式から右側の式を減算して、2つの検索語の相対的な使用を比較する簡単な方法を提供します。
  • / 左側の式を右側の式で除算します
  • * 式を乗算して、頻度が大きく異なるngramを比較します。アスタリスクがワイルドカード文字として解析されないように、ngram全体を括弧で囲むようにしてください。
  • (コロン)は、右側のコーパス内で左側のngramを検索します。

最後に、「=>」を使用して依存関係を設定し、言語関係を検索できます。

GoogleNgramをより効果的に使用する方法

たとえば、「car => fast」は、「fast」が「car」という単語に文法的に依存または変更された結果を返します。これは、高度な検索操作と自由に組み合わせることができます。

結論

単語の傾向の検索には、多くの学術的用途があります。必要な情報をすばやく見つける方法は、GoogleのNgramツールです。良いニュースは、基本的な検索を実行できるだけではないということです。強力な修飾子を適用して、必要な情報に焦点を当てることができます。

Google Ngramの機能は、検索エンジンの高度なうなり声がなければ実現できません。 Google Ngramツールで何ができるかに感銘を受けましたか?以下のコメントセクションでお知らせください!


  1. Google セーフ サーチの概要と使用方法

    Google は最も人気のある検索エンジンであり、さまざまなことに対する答えを検索しようとするときにほとんどの人が使用しています。結果の多くは大きく分かれており、一部露骨な内容も示されています。これは、特に他の人に囲まれている場合に、一部のユーザーを不快にさせる可能性があります。この問題を抑えるために、Google はセーフ サーチ フィルターと呼ばれるソリューションを考案しました。これは、表示したくないコンテンツを除外して検索結果を改善するためのオプションです。 Google セーフ サーチはあまり知られていない機能ですが、特に不適切なコンテンツや望ましくない検索結果を避けたいユーザーにと

  2. Google Duo の使い方

    Google デュオ は、オーディオおよびビデオ通話で友人や家族とつながることができる素晴らしいアプリです。 Google Duo には素晴らしい機能が複数あります、 群衆の間でそれを成功させました。それは、現在、家で立ち往生していると感じている人々への救世主として浮上しています.ビデオ通話アプリはいくつかありますが、これは Google の製品として最適です。ただし、アプリケーションに限定されず、Web プラットフォームとしても機能します。そのため、Zoom Meeting アプリに飽きたら、Google Duo を使用して少人数の友人や同僚に電話をかけることができます。 Google Du