El enfoque tradicional al acceso y la preparación de datos puede tomar mucho tiempo. Algunos analistas frustrados se hacen cargo y aprenden a escribir SQL en lugar de depender de los desarrolladores de TI y SQL. Uno de los desafíos más grandes al que se enfrentan los analistas cuando escriben SQL es, sencillamente, lograr que funcione. No hay autocorrección en SQL, por lo que un punto o una coma mal ubicados no se harán notar de forma automática, y podrían causar que falle todo el script.
Alteryx adopta un enfoque diferente con un entorno basado en flujos de trabajo que permite preparar, mezclar y analizar datos de múltiples fuentes, incluso los datos no estructurados. En lugar de gastar tiempo probando y depurando códigos, construyes un flujo de trabajo repetible que le muestra a tus colegas (otros analistas, TI y los que toman las decisiones empresariales) exactamente cómo se extrajeron y transformaron los datos. ¿Cuál fue el resultado? Menos tiempo para escribir códigos, mayor transparencia y más uniformidad.
Enumeramos algunos de los procesos más comunes relacionados con los datos que muchos analistas codifican en SQL. También, mostramos cómo podrías hacer lo mismo con Alteryx. Estos ejemplos están hechos para ayudar a los analistas que escriben en código SQL a entender cómo transferir su conocimiento de SQL a un flujo de trabajo de Alteryx.
To access data in Alteryx, you drag and drop an Input Data Tool onto the canvas, locate the database, and simply select.
In this example, the Input Data Tool lets you connect to an SQL Server Database.
Using the Select Tool allows you change the data type, select/deselect fields, or simply rename the fields to whatever you want. In this case, Customer ID is the field name.
In Alteryx, combining multiple datasets is easy with the Join Tool.
The Join Tool allows you to join two tables with a common field (primary key) and Alteryx automatically returns three sets of records:
Here is a Join on Customer ID.
In addition to the Join Tool, Alteryx also has an In-Database Join Tool. This enables blending and analysis against large sets of data without moving the data out of the database, and provides significant performance improvements over traditional analysis methods.
The In-Database Join Tool lets you do inner, left outer, right outer, and full outer joins.
Learn more about Alteryx In-Database tools here.
The Union Tool allows you to combine multiple sets of records based on the field name or position of each column. You can easily change the order of the column headers in each set of records so they match up.
Here, two sets of records — the left un-joined records and the (inner) joined records — are joined together, producing a left outer join.
Limiting records based on specific criteria is performed using the Filter Tool. Filtering can use anything from simple comparisons to complicated, conditional statements. In this example only those records that do not contain the country United States are filtered.
In Alteryx, the Summarize Tool lets you collect data across multiple records, apply an aggregate function, and group the results by one or more fields.
In this example, the Summarize Tool lets you group by country (e.g., United Kingdom, Germany), and average the total amount per country.
You can limiting records based on specific criteria using the Filter Tool. Filtering can use anything from simple comparisons all the way to complicated, conditional statements. This example shows only those records that have average totals greater than or equal to 1000.
The Sort Tool in Alteryx allows you to order your data just the way you need it. Select the name(s) of the column(s) and choose between ascending or descending. In this example, the Average Total Amount is shown in Descending order.
Este es el flujo de trabajo completo de Alteryx para la instrucción SQL SELECT.
Using the Append Fields Tool, you can append the fields from a source input to every record of a target input. Each record of the target input will be duplicated for every record in the source input. In this example, all Distribution Center records are appended to each Customer record.
Este flujo de trabajo de Alteryx anexa los registros bajo Distribution Center (centro de distribución) a cada registro de Customer (cliente).
You can limit records to those that have field values within a specific range using the Alteryx Filter Tool. In this example the filter is Order Dates between December 1 – 31, 2016, inclusive.
Este flujo de trabajo de Alteryx filtra los datos de las órdenes de clientes específicamente para las órdenes hechas entre el 1 y el 31 de diciembre de 2016.
To limiting records to those with field values belonging to a set of possible alternatives, use the Alteryx Filter Tool. In this example, the filter is set to customers whose country is either the United States or the United Kingdom.
Este flujo de trabajo de Alteryx filtra los clientes cuyo país es Estados Unidos o el Reino Unido.
The Unique Tool in Alteryx helps separate data into two streams, duplicate and unique records, based on the fields you choose. The field chosen in this example is country.
Con la herramienta Único, este flujo de trabajo de Alteryx separa los datos en dos flujos (registros duplicados y únicos), basado en los campos que seleccionas, como país, en este ejemplo.