データをクリーニングするための 6 つの簡単なヒント
準備が不十分な情報は不正確な結果につながり、データを信頼したり、他の人にそうするように促したりすることが難しくなる可能性があることは、おそらくご存知でしょう。データ クリーニングとは、エラーを修正し、不完全なデータのインスタンスを削除することを意味します。
常に慎重にデータをクリーニングする必要がありますが、すべてのケースで極端に時間のかかるプロセスである必要はありません。データを効率的にクリーニングするために試すことができる 6 つのトリックを次に示します。
列全体を別のシートで消去
多くの人は、大きなスプレッドシートを管理しやすいチャンクに分割して、データ クリーニング プロセスの負担を軽減し、特定のセクションに集中できるようにしています。一度に 1 つの列で作業する場合は、最初に新しいシートを作成します。次に、1 つの列を新しいシートにコピーし、データを消去します。
クリーニングした後、列を最初のシートにコピーし、元の列を置き換えることができます。
このヒントにより、誤って関数を使用して、現在作業している列だけではなく、スプレッドシート全体に結果を適用することを避けることができます。 Excel で作業している場合は、画面下部のプラス (+) アイコンをクリックしてワークシートを挿入するか、挿入メニュー を選択します。 [ホーム] タブで [シートの挿入] を選択します .
Google スプレッドシートで日付形式を変更する
ヨーロッパでは DD/MM/YY が好まれる日付形式ですが、米国では MM/DD/YY 形式で日付を書くことがより一般的です。複数の日付形式に慣れている人が、最初にシステムについて合意することなく、Google スプレッドシートの共有スプレッドシートで作業すると、どれほど混乱するか想像できます。
幸いなことに、Google スプレッドシートでは日付形式を変更できるため、手動で変更する必要はありません。デフォルトの日付形式は、スプレッドシートのロケールで通常使用される形式です。ただし、代わりにカスタムの日付形式を設定できます。
最初にフォーマットするデータを強調表示してから、[フォーマット] に移動します> 数字> その他のフォーマット .最後に、[その他の日付] を選択します および時間形式 .そこから、表示されている形式から選択するか、独自の形式を作成できます。
他のプログラムから Tableau にインポートされたデータを整理する
Tableau が最適なデータ視覚化プログラムである場合、Google スプレッドシートや Excel などの他の場所からインポートされた情報を処理するときに良いニュースがあります。 Data Interpreter 機能は、インポートされたプログラムからデータをキャプチャし、空のセルなど、クリーニングが必要なものがないか調べます。
接続を使用する Tableau のペイン .csv、.pdf、Google スプレッドシートなど、サポートされている形式のデータを検索します。必要に応じて表をキャンバスにドラッグし、データ ソースを探します。 画面左側のエリア。次に、スプレッドシートで [データ ソース] セクションの [データ インタープリターを使用する] ボックスにチェックを入れます .
[Review the Results] を選択すると、データ ペインで結果を確認できます。 .これを行うと、Data Interpreter がデータをどのように処理したかを解釈するためのキーを含む情報が Excel で開きます。
Excel の古いデータを削除する
特に、見込み顧客リストに依存して顧客を引き付けている場合は、データを可能な限り最新の状態に保つことが重要です。最も簡単な方法の 1 つは、間違ったメールや、ブランドとの関わりがなくなった購読者を排除することです。
それぞれの行を右クリックして [削除] を選択すると、古いデータの行全体を削除できます。または、セルをクリックし、Ctrl + A キーボード コマンドを使用してデータを強調表示します。次に、Delete キーを押してセルをクリアし、更新された内容を入力します。
Trim 式を使用して Excel の余分なスペースを削除する
Excel には、時間のかかるプロセスを回避するのに役立つさまざまな数式があります。それらの1つはTrimと呼ばれます。単語間のスペースを除くすべてのスペースを削除します。 =TRIM(テキスト) を貼り付け 式に Excel 画面の上部にあるボックス。
次に、括弧内の「テキスト」という単語を、トリミングするコンテンツに置き換えてください。 B3 など、テキストを含む列と行の組み合わせを挿入することもできます。
Google のスペルチェック機能によるスペルミスの単語のスクリーニング
Google スプレッドシートや Google ドキュメントでデータを扱うときは、タイプミスを探すことをお勧めします .最も注意深いデータ入力の専門家でさえ、疲労や早すぎる作業などのために正確さを失うことがあります.
[ツール] メニューからタイプミスを探すことができます スペルを選択して オプション。インターフェイスには、スペル ミスの可能性を無視するオプション、または提案された置換単語を使用して修正するオプションが表示されます。 辞書に追加もあります Google が間違って間違いとしてフラグを立てている、よく使う単語に適したオプションです。
特にプロジェクトのコンテキスト内では、スペルチェッカーを盲目的に信頼しないようにしてください。たとえば、ツールは、「キツネ」という単語を含むセルを「キツネ」に変更することを提案する場合がありますが、その単語が人の姓である場合、それは正しいことではない可能性があります.
自分のシステムに固執し、必要に応じて他のユーザーと共有する
これらの 6 つのヒントは、データのクリーニングを開始するのに役立ちます。自分に合った手順を思いついたら、データを詳しく調べて正確性を確認する必要があるたびに、その手順に従うのが賢明です。
複数の人がデータにアクセスでき、将来の使用のためにもデータを準備する必要がある場合は、使用する手法を彼らに提供して、全員が同じプロセスを使用できるようにします。
これらのヒントを使用する予定はありますか?追加するものはありますか? 下のコメントでお知らせいただくか、Twitter または Facebook で議論を進めてください .
編集者のおすすめ:
- Android の更新に関する一般的な問題とその修正方法
- 基本的にどのデバイスでも Google Chrome を更新する方法
- ウォルマートはニューヨークで AI を活用したスーパーストアをテストしています
- Lyft を利用すると、より多くの都市の食料品店にわずか 2.50 ドルで行くことができます
- Verizon が Samsung の Galaxy S10 5G の予約注文を開始し、さらに 20 都市で 5G を展開
-
iPad データのバックアップを作成する方法
iPadはあなたが思っているよりも一般的です。人々は、メッセージの送受信、音楽の鑑賞、ゲームのプレイ、映画の鑑賞、写真やビデオの共有、重要な作業ファイル、個人情報や財務情報、健康データの保存、印刷されたフォト アルバムの作成など、複数の目的でそれらを使用します。 しかし、iPad を紛失、破損、盗難された場合でも、すべてのデータの安全を確保するにはどうすればよいでしょうか?データのバックアップを作成します。 関連項目:すぐに購入する必要がある 9 つの気の利いた iPad アクセサリ iPad をバックアップする最良の方法 1. iPad を iCloud でバックアップ: Apple が
-
データを簡単に復元するための 4 つのヒント
In前回のブログでは、オープン ソース データ抽出ツールについて話しました。 「ETL ツール」の主な目的は、組織全体のさまざまなデータベースまたは運用システムのコンテンツを収集し、このすべてのデータを中央データベースに移動/コピー/転送することです。この「集中型データベース」は、「データ ウェアハウス」と呼ばれることがよくあります。あるいは、ETL ツールを使用して、単純な SQL ステートメントを使用して行うのが困難な複雑なデータ変換を実行することもできます。 いくつかの商用 ETL ツールのリスト: IBM INFOSPHERE DATASTAGE – これは ETL ツー