Integrar Python con Power BI
Este es uno de los temas que pienso deberíamos profundizar mucho ya que si bien power bi es una herramienta muy poderosa para visualizar. También hay unas funcionalidades muy poderosas de python para analizar, explorar y mostrar datos. Por este motivo si las logras integrar a power bi vas a dejar a todos boca abierta en tus proyectos. Pero para lograr esto primero tenemos que pasar por lo más canson que es dejar las herramientas listas para ponernos a ejecutar código.
Tener Python
Para tener python configurado puedes hacerlo de dos formas:
Yo en lo personal tengo las dos, pero utilizo python directamente ya que conectarlo con power bi me genera menos inconvenientes.
Configurar librerías de python
Este paso es clave ya que al ser un lenguaje full nativo tenemos que instalar las librerías que vayamos a utilizar dentro de power bi, hacer esto es tan simple como utilizar el siguiente comando en nuestra consola:
py -m install nombre_de_librería
las librerías iniciales que necesitaremos son pandas y matplotlib por lo que en donde coloque nombre_de_librería vas a colocar pues pandas y matplotlib.
Configurar Power bi
Una vez ya tenemos python en nuestro computador los pasos que vamos a seguir son:
Y aquí es importante poner en directorio raiz la ruta adecuada de donde tengamos python (python en anaconda o python perse). Para que te hagas una idea de en donde están las rutas de python en anaconda y python perse aquí te dejo las mías y las que por casi default siempre aparecen.
Nota: El IDE lo dejamos por default como se muestra en la imagen de arriba.
Extraer los datos
Una vez ya tenemos estas configuraciones vamos a ejecutar nuestro primer script y para hacer esto vamos a hacer lo siguiente:
2. Vamos a ejecutar el siguiente comando
**La ruta va a depender de donde tengas tu archivo ubicado** Y para que no te aparezca (unicode error) debes utilizar una de estas tres alternativas cuando leas el archivo con pandas:
Recomendado por LinkedIn
Una vez coloques tu comando para extraer los datos posiblemente te pueda salir este error:
Aquí nos dice que fue incapaz de encontrar la dependencia de numpy y la mejor solución para este problema es ejecutar este comando en nuestra terminal:
En el cual buscamos reinstalar numpy, lo mejor que podrías hacer es reiniciar el compu e intentar de nuevo, de no funcionarte vamos a usar la opción B (Utilizar la ruta de python como lenguaje perse en vez de anaconda en nuestro directorio raiz) para eso nos devolvemos a opciones de script y cambiamos la ruta del directorio raíz:
Y volvemos a hacer el proceso. En lo personal pienso que usar el lenguaje de python directamente es más fácil y te va a ahorrar este tipo de problemas (esta solución te debería funcionar de lo contrario tendríamos que seguir buscando la raiz del problema). Una vez echo esto ya podríamos cargar los datos o transformarlos.
Gráficar con matplotlib
Una vez hemos importado nuestros datos es momento de empezar con nuestra primera gráfica y para esto vamos a:
Es mandatory escoger la columnas a las cuales queremos aplicarles el código para gráficar y aunque no vamos a profundizar en este artículo acerca de gráficas si te quiero dar a entender que debemos darle masticado los datos a power bi para que este gráfique ¿Cómo así? Supongamos que queremos tener un histograma de la frecuencia entre géneros. Si trabajaramos desde anaconda sería algo tan simple como:
Lastimosamente en power bi aplicando el mismo código nos saldría algo como:
Esto se da a que la columna gender solo contiene datos tipo string o texto y no mira la frecuencia perse en power bi como lo hace dentro de visual studio code por lo que tendríamos que añadir esa columna frecuencia o hacer una medida para hacer este mismo proceso que podemos hacer en nuestro IDE local directamente, pero esto es solo un inconveniente, si miramos más a fondo hay muchas ventajas para generar un buen análisis utilizando varias librerías de python en power bi.
Por último no olvides invocar en power bi tu tabla con la palabra dataset y de allí agregar la columna.
Espero que con este artículo puedas integrar python con tu power bi y empezar a aprovechar todas las utilidades que puedes usar de ambos mundos. En otras ocasiones profundizaremos más a detalle e iremos más a fondo con algunos ejemplos prácticos para que esto que aprendiste hoy te sea muy útil en tu camino como analista de datos.
Att: Luis Felipe Castro Calderón