Summer of SQL

SQL le retour

Au cours des premières décennies du millénaire, l'approche centrée sur Java avait le vent en poupe, mais SQL est revenu en force. Aujourd'hui, SQL semble être au centre de toutes les conversations sur l'ingénierie des données et occupe une place de choix dans la Silicon Valley.

La comparaison des deux approches conduit inévitablement à se demander laquelle est meilleure. L'une comme l'autre présente des avantages et des inconvénients.

L'été de SQL - Épisode 1

SQL le retour

Au cours des premières décennies du millénaire, l'approche centrée sur Java avait le vent en poupe, mais SQL est revenu en force. Aujourd'hui, SQL semble être au centre de toutes les conversations sur l'ingénierie des données et occupe une place de choix dans la Silicon Valley.

La comparaison des deux approches conduit inévitablement à se demander laquelle est meilleure. L'une comme l'autre présente des avantages et des inconvénients.

Pipelines SQL et ELT

L'ELT attire de plus en plus de nos jours. Les entrepôts de données modernes sont flexibles et de plus en plus rentables, ce qui nous permet de stocker de grands volumes de données, même les données sales qui incluent énormément de textes et d'images. Dans cet environnement, les transformations se produisent dans l'entrepôt de données, où le langage natif est SQL.

L'été de SQL - Épisode 2

Pipelines SQL et ELT

L'ELT attire de plus en plus de nos jours. Les entrepôts de données modernes sont flexibles et de plus en plus rentables, ce qui nous permet de stocker de grands volumes de données, même les données sales qui incluent énormément de textes et d'images. Dans cet environnement, les transformations se produisent dans l'entrepôt de données, où le langage natif est SQL.

Transformation : le SQL prend du galon

Lorsque nous utilisons SQL pour la transformation (le « T » de ELT), tout est différent. Dans ce cas, nous prenons de nombreuses tables désordonnées et disparates et les manipulons pour les transformer en quelque chose de plus utilisable ou plus courant. Pour reprendre l'exemple précédent, nous pouvons extraire et charger des données de vente de 17 chaînes de magasins qui ont vendu les téléphones, et notre travail en SQL consiste à écrire des requêtes de transformation qui intègrent ces données.

L'été de SQL - Épisode 3

Transformation : le SQL prend du galon

Lorsque nous utilisons SQL pour la transformation (le « T » de ELT), tout est différent. Dans ce cas, nous prenons de nombreuses tables désordonnées et disparates et les manipulons pour les transformer en quelque chose de plus utilisable ou plus courant. Pour reprendre l'exemple précédent, nous pouvons extraire et charger des données de vente de 17 chaînes de magasins qui ont vendu les téléphones, et notre travail en SQL consiste à écrire des requêtes de transformation qui intègrent ces données.

Retour à SQL : ingénierie des données

Dans le cadre de la croissance de notre nouveau programme de Data Science à Berkeley, il est devenu évident que nous devions cibler une classe spécifiquement pour l'ingénierie des données. Les objectifs de l'ingénierie des données sont différents de ceux de l'ingénierie logicielle. Il était donc intéressant de réfléchir à ce programme et à la façon dont nous l'enseignerions différemment des cours de base de données existants.

Dans cette nouvelle approche, nous avons fini par mettre l'accent sur quatre étapes de SQL pour l'ingénierie des données qui sont atypiques d'une classe de bases de données traditionnelles : la qualité des données, le remodelage des données, les tâches de feuille de calcul et les tests de pipeline de données.

L'été de SQL - Épisode 4

Retour à SQL : ingénierie des données

Dans le cadre de la croissance de notre nouveau programme de Data Science à Berkeley, il est devenu évident que nous devions cibler une classe spécifiquement pour l'ingénierie des données. Les objectifs de l'ingénierie des données sont différents de ceux de l'ingénierie logicielle. Il était donc intéressant de réfléchir à ce programme et à la façon dont nous l'enseignerions différemment des cours de base de données existants.

Dans cette nouvelle approche, nous avons fini par mettre l'accent sur quatre étapes de SQL pour l'ingénierie des données qui sont atypiques d'une classe de bases de données traditionnelles : la qualité des données, le remodelage des données, les tâches de feuille de calcul et les tests de pipeline de données.

L'été SQL : série de questions-réponses avec Joe Hellerstein

SQL le retour

L'été de SQL - Épisode 1

SQL le retour

Pipelines SQL et ELT

L'été de SQL - Épisode 2

Pipelines SQL et ELT

Transformation : le SQL prend du galon

L'été de SQL - Épisode 3

Transformation : le SQL prend du galon

Retour à SQL : ingénierie des données

L'été de SQL - Épisode 4

Retour à SQL : ingénierie des données

Inspire 2024 n'est plus qu'à quelques semaines !

Du 13 au 16 mai | L'événement analytique de l'année