Saltar al contenido principal
waffle.svg
Domo

Acciones de ETL (Extracción, transformación y carga): DataSets

Version 3

 

Importante: Cuando haga referencia a esta página fuera de la Base de conocimientos, use este vínculo: https://knowledge.domo.com?cid=etlactionsdatasets

Introducción

Se requieren DataSets de entrada y salida para todos los flujos de transformaciones de ETL (Extracción, transformación y carga). Se requiere al menos un DataSet de entrada, aunque puede incluir tantos como sean necesarios. Se necesita un DataSet de salida al final de un flujo de transformaciones, que es el que puede usar posteriormente para alimentar aplicaciones y tarjetas de Domo.  

Para obtener información sobre la creación de un DataFlow de ETL (Extracción, transformación y carga), consulte Creación de un DataFlow de ETL (Extracción, transformación y carga).

Para obtener información sobre Data Center, consulte Diseño de Data Center.

Importante: Los DataSets de entrada de un DataFlow no se pueden restringir con las políticas de permisos personalizados de datos; todas las filas disponibles deben pasar por el DataFlow. Por ello, debe aplicar políticas de permisos personalizados de datos a los DataSets de salida generados por un DataFlow.
 

Al crear un DataFlow mediante un DataSet de entrada con políticas de permisos personalizados de datos en vigor, el DataFlow se rompe, a menos que se cumpla alguno de los siguientes criterios:

  • Tener un perfil de seguridad de "Administrador" o un rol personalizado con el privilegio "Administrar DataFlows" habilitado.

  • Ser el propietario del DataSet.

  • Formar parte de la política "Todas las filas". Esto le da acceso a todas las filas del DataSet.

Para obtener información sobre el uso de los permisos personalizados de datos con DataFlows, consulte Permisos personalizados de datos y DataFusions/DataFlows

DataSet de entrada

Puede usar la acción DataSet de entrada para agregar un DataSet al flujo de transformaciones.

Debe haber al menos un DataSet de entrada en un flujo de transformaciones.

Nota: La configuración de ejecución programada determina si el DataFlow de ETL (Extracción, transformación y carga) realiza las transformaciones, con la actualización del DataSet de salida. Para obtener información sobre la programación de un DataFlow de ETL (Extracción, transformación y carga), consulte Creación de un DataFlow de ETL (Extracción, transformación y carga).

Configuración

Para configurar la acción DataSet de entrada:

  1. Asegúrese de que los datos que desea transformar ya existen en Domo como un DataSet.

  2. Haga clic en la acción DataSet de entrada y, a continuación, seleccione el DataSet que desea transformar.

  3.  Seleccione Opciones adicionales y elija si el DataFlow debe procesar el DataSet de entrada completo o solo las filas nuevas adjuntadas desde la última ejecución del DataFlow.

  • Al seleccionar DataSet completo, se procesarán todos los datos del DataSet de entrada y se ejecutarán mediante las transformaciones.
  • Al seleccionar Solo filas nuevas que se han adjuntado desde la última ejecución del DataFlow, se procesarán solo los nuevos datos adjuntados al DataSet. Es una opción ideal si el DataSet de entrada tiene muchas filas, ya que le permite procesar solo las nuevas filas en lugar del DataSet completo.
     
Importante: Solo puede usar el método de procesamiento de anexión del DataFlow si dicho DataSet de entrada está configurado para actualizarse con un método de anexión. Para obtener más información sobre la programación del DataSet con una actualización del tipo de anexión, consulte Planificación básica de un DataSet.

 

Consejo: Si el DataSet de entrada tiene muchas filas, intente usar el método de procesamiento de anexión. Esto agilizará significativamente la ejecución del DataFlow en caso de que se procesen solo las filas nuevas.

Detalles

En la pestaña Detalles del icono de entrada, puede ver los DataSets:

  • Nombre
  • Propietario
  • Número de filas
  • Última actualización
  • Tipo y nombres de columna

Datos

Seleccione la pestaña Datos para previsualizar una tabla de los datos de entrada.

DataSet de salida

Puede usar la acción DataSet de salida para obtener como resultado los datos transformados como un DataSet. Puede usar este nuevo DataSet para alimentar las tarjetas u otros DataFlows.

Debe haber un DataSet de salida en un flujo de transformaciones.

Nota: En función de la configuración de ejecución programada, cada vez que cambia el DataSet de entrada especificado, el DataFlow de ETL (Extracción, transformación y carga) realiza la transformación, con la actualización del DataSet de salida.Para obtener información sobre la programación de un DataFlow de ETL (Extracción, transformación y carga), consulte Creación de un DataFlow de ETL (Extracción, transformación y carga).

Configuración

Para configurar la acción DataSet de salida:

  1. Asegúrese de que haya una acción conectada al icono DataSet de salida y de que todas las acciones están conectadas y configuradas en el flujo de transformaciones.

  2. Haga clic en el icono DataSet de salida y, a continuación, especifique el nombre del DataSet que desea obtener como resultado; para ello, haga clic en  y escriba un nombre y una descripción.

  3. Seleccione Opciones adicionales y seleccione la sustitución o la anexión como el método de actualización del DataSet de salida. Para obtener más información sobre la diferencia entre anexar y sustituir, consulte Método de actualización.

Nota: Al actualizar el DataSet de salida con el método de anexión, puede crear entradas de datos duplicadas. 

 

Consejo: Haga clic en la acción DataSet de salida y, a continuación, en la pestaña Vista previa para previsualizar los datos del DataSet de salida.

Detalles 

Si el DataFlow aún no se ha ejecutado, los detalles disponibles son el propietario, los nombres de columna y los tipos de columna. Tras una correcta ejecución, podrá ver exactamente los mismos detalles indicados anteriormente para el icono de entrada.