Entrar al aula
×

Power BI: conexión con archivos CSV en una carpeta

Una de las opciones que nos permite Power Query desde su editor es la de integrar en una sola tabla información contenida en tablas con otros formatos y ubicadas en una misma carpeta.

Conexionar con carpeta: una valiosísima opción

Muchas empresas son las que almacenan en archivos .CSV dentro de una carpeta (o bien en distintos archivos .XLSX por ejemplo en los que las tablas tengan entidad de TABLA), sus datos relativos a las diferentes campañas de ventas, de producción, de incidencias mensuales...  Si en esa carpeta a fecha de hoy tenemos cinco archivos .CSV (los cinco con la misma estructura de datos), cuando coloquemos en esa carpeta el archivo con las ventas de la última temporada (por ejemplo), del último ejercicio, del último periodo, ahora esa carpeta contendrá más archivos, uno más, dos más...
Como la conexión se realiza desde PBID con la carpeta, se está realizando la conexión con TODO lo que contiene esa carpeta (sean 20 archivos, o a fecha de hoy 25 y el mes siguiente 26...).
El usuario gracias a esta opción no se preocupará más que de ubicar en esa carpeta sus archivos (mes a mes, trimestre a trimestre, temporada a temporada...) porque PBID y su editor de consultas se encargará de tomar todos los archivos de esa carpeta (los que contenga), normalizar esos datos transformándolos si fuera preciso con otras herramientas de edición y analizándolos mediante las páginas de informe diseñadas según sean las necesidades.

Incluso en la misma carpeta pueden "convivir" archivos .CSV y .XLSX por ejemplo con este mismo comportamiento.

Anexar información de una tabla a otra tabla es una valiosa herramienta con la que cuenta PBID, pero cuando diferentes bloques de información con una misma estructura y se encuentran ubicados en una misma carpeta, en pocos pasos, Power Query permite acciones maestras para realizar la aglutinación de esos datos de forma sencilla.

Otras interesantes opciones tales como filtrar las tablas prescindiendo de los registros que cumplen unos criterios o bien definir campos personalizados (custom columns) nos va a ayudar en el fin de modelar y transformar nuestras tablas a la forma en la que realmente las necesitamos.

Ejemplo

Una empresa gestiona sus ventas a través de una base de datos en formato Access en donde tiene definidas todas las tablas necesarias, y además relacionadas.

Pero en lo referente a los clientes, actualmente trabaja con una tabla de clientes del país en donde tiene sede por un lado (por ejemplo España), y a partir de ese momento acaba de importar a dicha base de datos una tabla con la misma estructura de campos con la cartera de clientes europeos (pertenecientes a otros países europeos):

Además por otro lado, los representantes en América aportan los datos de sus carteras de clientes, pero los formatos de exportación que utilizan sus programas respectivos hacen que los datos se encuentren organizados, con la misma estructura que en Europa, pero en formato .CSV.

Hemos recibido dichos archivos .CSV y los hemos reunido en una carpeta de disco llamada Clientes america (por experiencia suprimimos las tildes de los nombres de los archivos -así como en los nombres de los campos también en su caso- previendo errores de conversión en los nombres de los archivos y/o campos):

Deseamos desde PBID poder unificar en una sola tabla (consulta de Power Query) toda esta información para poder finalmente relacionar la tabla resultante con el resto de tablas de la base de datos (del Data Set) y gestionar de forma global toda la información.