Analisi dei Dati con Power Query. Pt 3: Gestione degli Errori Post Apertura File
CREARE PIÙ QUERY: UNA PER OGNI TABELLA DEL FILE SORGENTE
Vediamo adesso come è possibile utilizzare PQE per collegarsi alla stessa sorgente ma creando più query. Il nostro intento è quello di creare tante Query e connessioni quante sono le Tabelle che si hanno a disposizione nel file a cui ci “aggancia”.
Prima di procedere. Propedeuticità
Comee certamente saprai, ogni volta che si apre un file realizzato da altri e che contiene delle query, è molto probabile che il PQE rilevi degli errori di connessione.
È noto che una query punta a dei dati memorizzati in un “percorso” di salvataggio.
I file che io ti proporrò puntano ad una cartella che, sul mio PC, si trova in un “Data Path” diverso da quello in cui tu scaricherai i miei file.
Nel tutorial raggiungibile cliccando qui ti spiego come tali errori possono essere gestiti con estrema semplicità.
Step1: Connessione a più Tabelle dello stesso File
1) Scarica il file Es_01-PQ-B.xlsx ed apri una nuova sessione di Excel
2) Usa quanto già visto per connetterti con “Recupera Dati” a Es_01-PQ-B.xlsx
3) Specifica che desideri connetterti a più elementi, come da figura
4) Clicca “Trasforma”
5) Nota che le query sono 5, una per ciascuna Tabella selezionata
6) Osserva che nella Tab_Clienti, nel campo Nominativo, è presente una piccola barra rossa. È un segnale di allarme che segnala la presenza di errori nel campo. Come è possibile identificare quali siano gli errori? Scopriamolo di seguito.
Step2: Eliminazione degli Errori nei Campi
Appare evidente che gli errori possono essere di intralcio nella corretta gestione delle query e dei loro risultati.
Un modo per capire quali siano le righe che generano errori è quello per cui si salvano le query caricando il risultato in specifici fogli.
7) Cliccando “Chiudi e Carica In” ed impostiamo come da figura che segue
8) Clicca OK
9) Avremo 5 nuovi fogli ed altrettante connessioni
10) Nota che la connessione alla Tab_Clienti, riportata nella sezione “Query e Connessioni” riporta il numero specifico degli errori.
11) Clicca adesso sul comando “Aggiorna”
12) Si ottiene una finestra in PQE che ci mostra chiaramente dove si trovino gli errori: nella colonna Nominativo e nella colonna CAP
13) Se chiudiamo adesso il PQE e decidiamo di mantenere le modifiche, avremo sempre la possibilità di accedere nuovamente alla schermata cliccando sulla relativa connessione come da figura che segue. Proviamo a chiudere ed accettare la conservazione delle modifiche.
14) Con un doppio click sulla connessione, come da freccia nella figura di cui sopra, si riapre il PQE
15) Portiamo il mouse sulla barra arancione del campo Nominativo. Si apre un menù che propone come primo comando la Rimozione degli Errori
16) Cosa accade nel momento in cui, appunto, rimuovo gli errori? Sicuramene la paura più grande è quella di perdere i dati. Non ti devi preoccupare, stai lavorando in PQE e qualunque cosa tu faccia non modifica la struttura originale dei dati.
17) Clicca su “Rimuovi Errori” del campo Nominativo
18) Nota che gli errori sono scomparsi e che nell’elenco dei Passaggi Applicati è presente il relativo step.
19) Fai la stessa con gli errori del campo CAP
20) Nessun errore è più presente nella Tabella che raccoglieva, appunto, solo gli errori.
21) Da notare che nella “macchina del tempo” dei Passaggi Applicati puoi sempre andare a ritroso ed annullare gli step effettuati.
22) Chiudi adesso il PQE e mantieni le modifiche
23) Prova ad aggiornare la query indicata dalla freccia nella figura che segue
24) Cosa noti di strano? Hai un’idea del perché gli errori continuino ad essere presenti? Prima di leggere la risposta al punto che segue prova a trovare da solo la risposta.
25) Gli errori continuano ad essere presenti proprio in virtù del fatto che durante i passaggi della rimozione degli errori hai lavorato sulla query che si occupava da fare da specchietto degli errori presenti nella “Tab_Clienti”. Non a caso il nome della query è “Errori in Tab_Clienti”
26) Rimuovi gli ultimi due passaggi in “Errori in Tab_Clienti” per tornare alla schermata che segue
27) Chiudi e mantieni le modifiche. Hai ripristinato lo specchietto degli errori.
28) Per rimuovere gli errori nella query “Tab_Clienti” fai doppio click sul nome della query stessa.
29) Ripeti da solo i passaggi di rimozione degli errori visti prima
30) Dovrai ottenere questo risultato in PQE
31) E questo è quanto originato dalla query nel foglio a cui è connessa
32) Con un doppio click qualsiasi su una query, puoi aprire il PQE, ma esiste anche un altro specifico comando. Da scheda Dati ---> Recupera Dati - Avvia l’Editor di PQ
33) Apri PQE e portati nella query Tab_Clienti
34) Come da figura sopra nota che la profilatura, cioè l’anteprima dei risultati, è relativa alle prime mille righe. Questo è dovuto al desiderio di mantenere rapido il passaggio tra una schermata e l’altra di anteprima.
35) Clicca sul tab indicato dalla freccia e scegli di effettuare la “Profilatura della colonna in base all’intero set dei dati”
36) Effettua la stessa operazione per tutte le query
37) Attiviamo adesso una particolare modalità di visualizzazione che ci offre lo spunto per apprezzare l’impatto sui tempi di aggiornamento delle anteprime delle modifiche appena compiute.
38) Attiva quanto indicato dalla freccia nella figura che segue. Il risultato non ha bisogno di spiegazioni.
39) Attivandolo ottengo quanto segue:
40) Prova a passare tra una query all’altra e nota i tempi di aggiornamento soprattutto per la “Tab_Fatture”
41) Adesso riporta tutto sulle anteprime per i primi mille record e testa le differenze.
42) Disattiva la visualizzazione della “Colonna Qualità”
Consigliati da LinkedIn
43) Salvare il file così strutturato e privo di errori con il nome di Es_02-PQ-C.xlsx
44) Il file ultimo salvato non contiene errori.
45) Possiamo e dobbiamo farci una domanda: quali erano gli errori? Abbiamo provveduto a cancellare ogni record che contenesse degli errori, ma senza indagare quali questi fossero. Avremmo potuto gestire e magari effettuare una correzione, senza cancellare direttamente i record contenenti gli errori?
Step3: Identificazione e Gestione degli Errori
Proviamo adesso a comprendere quali siano gli errori prima identificati dal PQE: potrebbe risultare possibile la loro correzione.
Apriamo un file nuovo di Excel ed agganciamoci al Es_02-PQ-B.xlsx. Questo file è una versione che contiene tutti gli errori e le relative righe.
46) Specifica che desideri connetterti a più elementi, come da figura
47) Clicca “Trasforma”
48) Nota che le query sono 5, una per ciascuna Tabella selezionata
49) Da File, scegli “Chiudi e Carica In” ed impostiamo come da figura che segue
50) Clicca OK
51) Avremo 5 nuovi fogli ed altrettante connessioni
52) Nota che la connessione alla Tab_Clienti, riportata nella sezione “Query e Connessioni” riporta il numero specifico degli errori.
53) Nel pannello Query e Connessioni clicco su voce “92 errori”
54) Genero una specifica query che rileva gli errori
55) Dal contenuto dell’anteprima della query prendo il primo record e noto che il primo errore si ha su “IdCliente” 270
56) Doppio click su query “Tab_Clienti” ed apro la query in PQE
57) Dal pannello “Passaggi Applicati” seleziono la voce “Navigazione”.
Senza cercare di essere troppo esaustivi, per non confondere le idee, selezioniamo “Navigazione” perché desideriamo agire con delle modifiche prima che PQE apporti in autonomia delle modifiche al tipo di dati presenti in ogni colonna. PQE cerca, infatti, di capire da solo quale sia il tipo di dati presente nelle colonne. Alcune incongruenze rilevate in questa fase vengono contrassegnate come errori.
58) Cerco IdCliente 270
59) Noto che nel Cap si ha una lettera “x” finale. È bene specificare che a differenza di Excel tradizionale, il PQE è Case Sensitive.
60) Decido di sostituire le “x” minuscole con degli zero generici
61) Click Dx su intestazione “CAP” e scelgo “Sostituisci Valori”
62) Riceviamo un prevedibile messaggio di monito ed accettiamo di inserire
63) Chiediamo di sostituire le “x” minuscole con uno zero “0”
64) Dopo aver effettuato la modifica torniamo a vedere cosa è successo a IdCliente con 270
65) Abbiamo risolto il problema dei CAP?
66) Spostiamoci nuovamente in “Modifica Tipo” dai “Passaggi Applicati”
67) Gli errori se ne sono andati
68) Notiamo tuttavia che in presenza della riga quindici, il CAP non è nel formato specifico con cinque caratteri,
69) Risolviamo il problema modificando il tipo di dati e portandolo su “Testo”
70) Clicco sui numeri presenti in alto a SX del campo CAP
71) Scelgo “Testo”
72) Scelgo sostituisci corrente
73) Anche la riga quindici è sistemata, così come tutte le riga afflitte dallo stesso problema
74) Rimangono adesso gli errori del campo Nominativo
75) Click su query “Errori in Tab_Clienti”
76) Sono rimasti gli errori solo nel campo “Nominativo”
77) Cliccando su uno qualsiasi dei valori di errore, “Error”, nella colonna “Nominativo” si ha quanto segue
78) Si capisce che questa volta l’errore lo eredito dalla tabella di origine, quella a cui mi sono agganciato.
79) Elimino l’ultimo passaggio applicato “Nominativo”
80) Decido di sostituire i nominativi che presentano quel tipo di errore imputandoli ad un generico cliente anonimo, il cui nominativo è, appunto, “A. Nonimo” 😊
81) Seleziono Query “Tab_Clienti”
82) Per effettuare la sostituzione, clicco con DX su intestazione campo “Nominativo”
83) Scelgo “Sostituisci Errori” e imposto come da figura
84) Ecco che anche questi errori sono spariti
85) In sostanza:
a. gli errori sul CAP erano imputabili ad una specifica di formato non adatta ed alla presenza di lettere insieme a dei numeri
b. gli errori sui nominativi derivano dal file originale di Excel standard
c. ricordiamo che nessuna modifica al file originale è stata effettuata
86) Chiudere PQE accettando le modifiche
87) Salviamo il file con il nome Es_02-PQ-D.xlsx
Nel prossimo articolo ripartiremo proprio ultimo file che hai salvato.
Aiuto aziende e privati a trasformare i 🅳🅰🆃🅸 in 🅸🅽🅵🅾🆁🅼🅰🆉🅸🅾🅽🅸 con corsi di Excel, Power Query, Power Pivot e Power BI. Docente e studioso di "Analisi dei Dati" per lavoro e per passione.
2 anniGrazie Alex!
Lo Startup Mentor disabile > Rompo barriere, creo soluzioni 🚀 Growth & Digital Business Strategist 🐝 AgriFood Expert 🌱 Podcaster 🎙️
2 anniSempre al top con questi articoli, non vedo l'ora che esca il prossimo 😁