データサイエンスとデータアナリティクスに関する用語解説

高度な分析

高度な分析では、精緻な分析テクニックを使用して、インサイトの発見、パターンの特定、結果の予測、推奨事項の作成を行うことができます。

分析の成熟度モデル

組織における分析の成熟度が高ければ高いほど、データを活用してビジネス成果を上げる能力が高くなります。

AutoML

自動機械学習（AutoML）では、自動化されたプロセスを通じて ML（機械学習）モデルの構築、検証、反復、探索を行えるため、専門的なスキル不要で誰もが ML を活用できます。

バッチ処理

バッチ処理とは、大量のデータを同時にスケジューリングして処理することを指し、一般的にはコンピューティングリソースの需要が少ない時間帯に行われます。多くの場合、バッチ処理は反復的であり、一定の間隔で実行されるようにスケジュール（自動化）されています。

ビジネスアナリティクス

ビジネスアナリティクスとは、より良いビジネス成果を導く意思決定を行うために統計的・定量的手法を用いてデータを分析するプロセスです。

ビジネスインテリジェンス

ビジネスインテリジェンスは、組織のデータ、ソフトウェア、インフラ、ビジネスプロセス、人間の直感などによってもたらされる累積的な結果であり、実用的なインサイトの提供を可能にします。

クラウド分析

クラウド分析を利用することで、クラウドに保存されたデータを分析処理に利用したり、クラウドの高速コンピューティングパワーを活用して、分析をスピードアップしたりできるようになります。

クラウドデータウェアハウス（CDW）

クラウドデータウェアハウスは、Google Cloud Platform (GCP)、Amazon Web Services (AWS)、Microsoft Azureなどのサードパーティがサービスとして管理・提供するデータベースのことです。クラウドデータのアーキテクチャは、組織が独自で物理データベースインフラを管理するオンプレミスのデータアーキテクチャとは異なります。

データ集計

データ集計とは、統計分析に使用できるハイレベルな要約情報を提供するために、データ（多くの場合、複数のデータソースからのデータ）を集約させるプロセスです。簡単な例として、各販売地域における特定の商品カテゴリーの総売上高を求めるといったことが挙げられます。

データアナリティクス

データアナリティクスとは、データを調査、変換、分析して、重要なインサイトを明らかにし、意思決定の効率性を高めるためのプロセスです。

データアプリケーション

データアプリケーションは、データベース上に構築されたアプリケーションであり、特定のデータの問題の解決に役立ち、視覚的なインターフェースを介して、同時に複数のクエリを実行し、データを探索・操作することができます。データアプリケーションを使えば、コード不要でデータを入手したり理解したりできるため、...

データブレンディング

データブレンディングは、さまざまなソースから取得したデータを 1 つの有用なデータセットにまとめるプロセスであり、より深く、より複雑な分析を可能にします。

データカタログ

データカタログとは、組織のデータ資産を包括的に収集し、組織全体の専門家が必要なデータを簡単に見つけられるように編集されたものです。いわば図書館の図書目録のようなもので、データカタログを使うことで、データの検索スピードを大幅にアップできます。...

データクレンジング

データクレンジングは、データクリーニングやスクラビングとも呼ばれ、生のデータセットからエラーや重複、無関係なデータを特定して修正するプロセスです。

データの強化

データエンリッチメントとは、内部ソースからのファーストパーティデータと、他の内部システムからの異種データや外部ソースからのサードパーティデータを組み合わせるプロセスです。データエンリッチメントによって強化されたデータは、より有用で洞察に富んだものになり、どんな組織にとっても貴重な資産となります。...

データ探索

データ探索は、分析プロセスの最初のステップの1つであり、データセットにどのようなパターンや傾向が見られるかを掘り下げ、特定するために使用されます。データ探索は通常、データの可視化ツールなどのツールを用いて、データの特徴を説明することから始まります。

データガバナンス

データガバナンスとは、組織内でデータ資産をどのように利用し、誰にその権限があるのかというルールを定め、そのプロセスや標準を監督する一連の活動を指します。誰がどのデータをどのような方法で使用できるかを規定することによって、データ資産の安全性が保たれ、合意された要件が遵守されるなどの効果が望めます。

データの取り込み

データの取り込みとは、データをソースから収集し、アクセス、使用、分析が可能なターゲット環境へと移動させるプロセスです。

データの整合性

データの完全性とは、ライフサイクル全体にわたるデータの正確性と一貫性、および必要な権限に対する制約やその他のセキュリティ対策への準拠を指します。つまり、データの信頼性を確保するということです。

データレイクハウス

データレイクハウスとは、データレイクとデータウェアハウスのそれぞれの長所を取り入れたデータ管理アーキテクチャです。

データ系列

データ系列の追跡により、企業がデータの取得元やシステム内のプロセスを追跡し、ビジネスデータのコンプライアンスと正確性を維持することが可能になります。

データメッシュ

データメッシュは、データアーキテクチャの設計における新しいアプローチであり、データの保存と管理に分散型のアプローチをとることで、組織の全データを一元的に所有するデータレイクに流すのではなく、個々のビジネスドメインがデータセットの所有権を保持することとなります。データへのアクセスは、...

データマンジング

データマンジングとは、分析の前に手作業でデータをクレンジングする工程を指しますが、時間がかかるうえに、データから真の価値と可能性を引き出す妨げになりがちです。また、多くの企業で、データ分析に費やされる時間の80％が、IT部門が手作業でデータをクリーンアップするデータマンジングの作業に費やされていることも明らかになっています。

データオブザーバビリティ

データオブザーバビリティとは、システムの健全性を維持し、ダウンタイムを削減するために、データシステム内で何が起こっているかを監視、追跡、および推奨する組織の能力を指し、その目的は、データパイプラインの生産性を高め、実行を継続できるようにすることにあります。

データの事前処理

データオンボーディングは、顧客データを準備してオンライン環境にアップロードするプロセスを指し、これにより、オフラインで収集された顧客レコードをCRMなどのオンラインシステムに取り込むことが可能になります。データオンボーディングの際には、エラーを修正するための大がかりなデータクレンジングが必要となります。

データパイプライン

データパイプラインは、ストレージ、分析、機械学習、その他の用途のために、データを収集、処理、およびソース間で移動させる一連のステップであり、主にアプリケーションからデータウェアハウスやデータレイクなどのストレージデバイスにデータを送信する際に利用されます。データパイプラインは...

データ準備

データ準備はビジネス分析や機械学習に使用する生データのクレンジングと統合を行うステップであり、「前処理」とも呼ばれます。

データプロファイリング

データプロファイリングは、データの特性を把握し、その品質を評価することによって、データに対する新たな発見や理解を得て、データを整理するためのプロセスです。

データサイエンス

データサイエンスとは、応用統計学の一種で、コンピューターサイエンスと数学の要素を組み込み、定量的・定性的なデータからインサイトを抽出します。

データサイエンス vs 機械学習

テクノロジーの世界ですっかりおなじみの存在となった、「データサイエンス」と「機械学習」。どちらも、ビジネスや業界のあらゆる分野での AI の運用を強化するものですが、両者にはどのような違いがあるのでしょうか？

データソース

データソースとは、データの出所やデータが保存されているデジタルまたは物理的な場所を指し、その場所（データテーブルやデータオブジェクトなど）や接続性の特性によって、データの保存方法に影響が生じます。

データの標準化

データの標準化は、データの取得、標準化、統合に関する複雑なセマンティクスをすべて抽象化し、ビジネスにより迅速・正確な分析を提供します。

データ変換

データ変換とは、データをあるフォーマットから別のフォーマットに変換するプロセスであり、データセット間でデータを標準化したり、データを分析や機械学習に役立てたりするために行われます。最も一般的なデータ変換には、生データをクリーンで使用可能な形式に変換すること、...

データ検証

データ検証は、データが正確でクリーンであることを確認するプロセスであり、アプリケーションの開発からファイル転送、データの準備作業にいたるまでの、データプロジェクトのあらゆるライフサイクルで正確性を確保するために不可欠なステップとなります初期段階から反復してデータの検証を行わなければ、…

データの可視化

データの視覚化とは、グラフ、チャート、プロット、インフォグラフィックなどを用いてデータを視覚的に表現することです。

データラングリング

データトラングリングは、より良いビジネス上の意思決定を行うために、データを変換、クレンジング、強化して、より適切で使いやすい形に整えるプロセスです。

意思決定インテリジェンス

意思決定インテリジェンスは、分析、AI、自動化を意思決定に適用するためのプロセスです。活動成果
もっと読む

需要予測

需要予測は、製品やサービスに対する今後の需要を予測し、ビジネスの意思決定に役立てる分析手法であり、詳細なデータ、過去の販売データ、アンケートなどが用いられます。

記述的分析

記述的分析は、大規模な生データを集計・分析することで、過去に何が起きたのかを探り、その結果をグラフ（折れ線/円/棒グラフ）や表などに落とし込んで可視化する分析手法です。

ETL

ETL とは、さまざまなソースやフォーマットからのデータをコピー、結合、変換し、データウェアハウスやデータレイクなどの新たな保存先に書き出すために使用するプロセスです。

ETL開発者

ETL開発者は、データを抽出、変換、およびロードするための高度なアプリケーションを設計、開発、自動化、およびサポートするITスペシャリストです。ETL開発者は、組織のデータストレージのニーズを決定するうえで重要な役割を果たします。

特徴量エンジニアリング

特徴量エンジニアリングを用いることで、データをより良く理解し、有益な情報に変えることが可能になります。

Machine Learning

機械学習 (machine learning) とは、コンピューターが特定の制約を持つデータセットを反復的に処理することで、内在するパターンを見つけ出すプロセスです。

MLOps（機械学習基盤）

機械学習（Machine Learning、ML）モデルは、ビジネスに価値あるインサイトをもたらします。しかしながら、機械学習モデルが効果を発揮するためには、継続的に組織のデータにアクセスして分析を行う必要があります。MLOpsは、その実現に不可欠となるプロセスです。

予測分析

予測分析は、統計学、データサイエンス、機械学習などの手法を用いて、将来何が起こるかを予測するデータ分析の一種です。

処方的分析

処方的分析は、機械学習、グラフ分析、シミュレーション、発見的手法など通じて、「何をすべきか、何ができるか」という問いに答える分析手法です。

Regex（正規表現）

正規表現（regular expression）とは、検索パターンの指定に用いられる文字列です。正規表現を使うことで、特定の条件に一致する検索を簡単に行い、定期的にテキストを操作したり、大量のデータを分析したりするユーザーの時間を大幅に節約することができます。例えば...

売上分析

売上分析とは、データから洞察を生み出し、目標や指標、より大きな戦略を設定するために使用される手法です。

ソースからターゲットへのマッピング

ソースからターゲットへのマッピングは、ソースシステム内のデータの構造と内容を、ターゲットシステムで必要とされる構造と内容に変換する方法を決定する一連のデータ変換命令を指します。

空間分析

空間分析は、地理的モデリングを用いて、地理空間データに含まれる位置、関係、属性、近接性などを分析し、問題解決に役立つ洞察を引き出す分析手法です。

教師あり学習と教師なし学習

教師あり学習と教師なし学習の一番の大きな違いは、教師あり学習では「ラベル付きデータセット」を使用し、教師なし学習では「ラベルなしデータセット」を使用することです。

インテリジェンスシステム

S　s インテリジェンスシステムは、企業が技術スタックから価値を引き出せるよう支援する仕組みを指します。
もっと読む

ユーザー定義関数（UDF）

ユーザー定義関数（UDF）は、ユーザーがコードを書き換えることなく処理を再利用できるようにするカスタムプログラミング関数です。例えば、複雑な計算をSQLを使ってプログラムし、UDFとして保存することができます。この計算を将来、別のデータセットで使用する必要がある場合は...

Alteryxを使うべき理由

パートナープログラム

セキュリティセンター

生成AI

Alteryx AiDIN

プラットフォームの概要

プラットフォームの機能

Alteryx Analytics Cloud

オンプレミス製品

部門

業種

職種

プラットフォームツアー

Alteryx AI Platform for Enterprise Analyticsのツアーに参加

リソース

学習

イベント

今すぐツールを試す

データスコアカード

会社情報

LIFE AT ALTERYX

ニュースルーム

無料トライアル

分析を変革

データサイエンスとデータアナリティクスに関する用語解説

分析を変革

Alteryxについて

関連するリソース

サポート

コミュニティ

最新の話題

人気のトピック

会社情報

データサイエンスとデータアナリティクスに関する用語解説

Inspire2024の開催まで残り数週間となりました！

5月13-16日｜今年のアナリティクスイベント