アナリストの業務時間を削減
IT部門に頼ることなくデータパイプラインを構築
地域:EMEA
業種:公共部門
部門:BI/分析/データサイエンス
会社概要:
Washington State Department of Health(ワシントン州保健局)は、ワシントン州の州政府機関であり、ワシントン州オリンピアに本部を構えています。1989年5月に、Washington State Department of Social and Health Services(ワシントン州社会保健サービス局)から分離する形で州議会により設立されました。
データスタック:Microsoft Azure、Designer Cloud、Databricks、Python
COVID-19の影響により、ワシントン州保健局では分析業務のクラウド化が急務となっていました。従来の処理プロセスでは、病院、学校、診療所などから送られてくる旧式のトランザクションシステムやリファレンステーブルの膨大なデータ量に対応しきれず、仮想マシン環境でも問題は解決できませんでした。公衆衛生分野は、過去50年間に十分な資金が投じられておらず、データシステムもその煽りを受けている状況。ほとんどのデータシステムは、それぞれ特定の目的のためだけに作り込まれていたため、他のシステムとうまく連携できない状態でした。公衆衛生対応には、意思決定や対策の裏付けとなる迅速なデータ分析が求められます。そのため、分析前に、データのクレンジング、変換、標準化、再構築といった手間のかかる工程を経る必要がありました。これらの作業を効率化・一元化するツールが存在せず、インサイトの取得に時間がかかり、アナリストの作業が重複するなど、非効率な状況が続いていました。
Designer Cloudは、Microsoft Azure上に構築された社内の分析基盤CEDAR(Cloud Environment for Data Analytics and Reporting)の一部として運用されています。この環境では、データサイエンティストが生データに簡単にアクセスし、プログラムアナリスト向けに分析に適したテーブルを作成することができます。アナリストはそれらのデータセットにアクセスし、クラウド上でデータの探索、クレンジング、標準化、変換といった作業を迅速に行うことが可能です。Designer Cloudは直感的で使いやすいため、アナリストは、RやSASを使うよりも、普段行っている操作をずっと簡単に実行することができます。データ品質管理の担当者からは、標準化が簡単である点や、クラスタリングアルゴリズムの選択肢が豊富であること、フリーテキストをカテゴリーデータにすばやく変換できる点が特に好評です。
分析に適したクリーンなデータセットを作成し、未活用だった大量のデータからもインサイトを抽出できるように
ワシントン州保健局の複数チームにまたがる複雑な分析用のテーブルを更新するワークフローを構築し、アナリストのデータ準備にかかる時間を25%削減
IT部門に依存せず、各チームが自らデータパイプラインを構築・共有・管理できるようになったことで、セルフサービスの文化が根付き、IT部門への依存から脱却できた
公衆衛生データシステムにおける最大の課題のひとつは、スキルとインフラの両面で現状のニーズに対応するだけでなく、新たなアプローチや柔軟でスケーラブルな環境への移行をサポートしてくれるツールを見つけて投資することです。
Francoise Pickart氏
上級疫学者
ワシントン州保健省
地域:EMEA
業種:公共部門
部門:BI/分析/データサイエンス
会社概要:
Washington State Department of Health(ワシントン州保健局)は、ワシントン州の州政府機関であり、ワシントン州オリンピアに本部を構えています。1989年5月に、Washington State Department of Social and Health Services(ワシントン州社会保健サービス局)から分離する形で州議会により設立されました。
データスタック:Microsoft Azure、Designer Cloud、Databricks、Python