Saltar al contenido principal
waffle.svg
Domo

Creación de un DataFlow de ETL (Extracción, transformación y carga)

Version 3

 

Importante: Cuando haga referencia a esta página fuera de la Base de conocimientos, use este vínculo: http://knowledge.domo.com?cid=createmagic

Introducción

Puede crear DataFlows de ETL (Extracción, transformación y carga) con una interfaz intuitiva basada en arrastrar y soltar que se encuentra disponible en Data Center. Solo tiene que arrastrar los DataSets a un lienzo y, a continuación, agregar las acciones deseadas para indicar cómo se deben unir y transformar dichos DataSets. Existe una amplia lista de acciones. Puede combinar columnas, filtrar filas, reemplazar texto, etc. Para obtener información detallada sobre las acciones, consulte los temas siguientes:

Importante: Los DataSets de entrada de un DataFlow no se pueden restringir con las políticas de permisos personalizados de datos; todas las filas disponibles deben pasar por el DataFlow. Por ello, debe aplicar políticas de permisos personalizados de datos a los DataSets de salida generados por un DataFlow.
 

Al crear un DataFlow mediante un DataSet de entrada con políticas de permisos personalizados de datos en vigor, el DataFlow se rompe, a menos que se cumpla alguno de los siguientes criterios:

  • Tener un rol de seguridad de "Administrador" o un rol personalizado con el privilegio "Administrar DataFlows" habilitado.

  • Ser el propietario del DataSet.

  • Formar parte de la política "Todas las filas". Esto le da acceso a todas las filas del DataSet.

Para obtener información sobre el uso de los permisos personalizados de datos con DataFlows, consulte Permisos personalizados de datos y DataFusions/DataFlows

Vídeos de aprendizaje: Introducción sobre los DataFlows de ETL (Extracción, transformación y carga)

Conozca los aspectos básicos sobre el uso de DataFlows de ETL (Extracción, transformación y carga).

Parte 1 de 3

 

 Parte 2 de 3

 

Parte 3 de 3

 

Nota: Los vídeos de aprendizaje sobre productos solo están dirigidos a clientes de Domo.

Creación de DataFlows de ETL (Extracción, transformación y carga)

Siga los pasos de esta sección para facilitar la creación de DataFlows de ETL (Extracción, transformación y carga).

Para crear un DataFlow de ETL (Extracción, transformación y carga):

  1. En Domo, haga clic en  > Data Center.

  2. Haga clic en ETL (Extracción, transformación y carga) en la barra de herramientas Transformación Magic en la parte superior de la ventana.

    Consejo: También puede abrir el editor de ETL (Extracción, transformación y carga) desde cualquier ubicación de Domo al seleccionar en la barra de herramientas de la aplicación y, a continuación, Datos > ETL (Extracción, transformación y carga).
  3. Siga estos pasos para agregar y configurar un DataSet de entrada:

    1. En el panel Acciones, expanda DataSets y, a continuación, arrastre el DataSet de entrada al lienzo.

    2. Haga clic en la acción DataSet de entrada y, a continuación, seleccione el DataSet que desea transformar.

  4. Siga estos pasos para agregar un DataSet de salida:

    1. En el panel Acciones, en DataSets, arrastre el DataSet de salida al lienzo.
      Puede configurar la acción DataSet de salida después de conectar una acción a dicho DataSet.

  5. Arrasatre otras acciones al lienzo desde el panel Acciones para transformar (limpiar, totalizar, unir, etc.) los DataSets de entrada.
    Para obtener más información, consulte los temas siguientes:

  6. Arrastre las conexiones entre las acciones de transformación para crear una secuencia de operaciones en el flujo de transformaciones.

  7. Configure cada acción; para ello, haga clic en la que proceda y, a continuación, especifique las opciones. 

    Consejos: Puede obtener ayuda con una acción en el lienzo; para ello, haga clic en la acción y, a continuación, en . También puede seleccionar varias acciones a la vez; para ello, haga clic en el lienzo y arrastre el cursor sobre ellas. Cuando haya seleccionado varias acciones, puede arrastrarlas todas como un grupo hasta donde quiera colocarlas. También puede eliminar las acciones seleccionadas; para ello, haga clic en Eliminar en el panel del lado izquierdo de la pantalla.
  8. Siga estos pasos para configurar la acción DataSet de salida:

    1. Conecte una acción a la acción DataSet de salida.

    2. Haga clic en la acción DataSet de salida y, a continuación, asigne a la salida el nombre del nuevo DataSet.

  9. (Opcional) Defina la configuración para cuando se ejecuta el flujo de transformaciones.
    De forma predeterminada, el flujo de transformaciones solo se puede ejecutar manualmente. Puede programar que la ejecución del DataFlow de ETL (Extracción, transformación y carga) se realice siempre que los DataSets de entrada cambien o a una hora establecida.

  10. Especifique el nombre y la descripción del DataFlow de ETL (Extracción, transformación y carga).

  11. Haga clic en Guardar para guardar el DataFlow de ETL (Extracción, transformación y carga), especifique una descripción de la versión, si lo desea, y, a continuación, haga clic en Guardar para confirmar.

Al guardar un DataFlow, se agrega una entrada para esta versión a la pestaña Versiones en la vista Detalles del DataFlow. Si escribió una descripción al guardar, esta se muestra en la entrada del DataFlow. Para obtener más información sobre las versiones, vea Consulta del historial de versiones de un DataFlow.

Nota: Muchos usuarios preguntan por qué los DataSets de salida de un DataFlow no se marcan como "Actualizados" cuando el DataFlow se ejecuta correctamente. Normalmente, esto se debe a que los datos no han cambiado realmente, es decir, que no se ha producido ninguna actualización. Por tanto, los DataSets no se muestran como actualizados.

Prácticas recomendadas para crear DataFlows

Cada DataFlow debe:

  • Incluir nombres descriptivos para cada paso de la transformación.

  • Incluir una descripción de los DataSets de entrada que se van a fusionar o manipular y el DataSet que se va a crear, y también se debe indicar el propietario de los datos.

  • Adoptar el mismo nombre que el DataFlow de salida; de hecho, como las salidas de un DataFlow se convierten en su propio DataSet en Data Center, esto permite identificar con facilidad qué DataSets producen los DataFlows y cuáles son estos últimos.