Analisi dei Dati con Power Query. Pt 3: Gestione degli Errori Post Apertura File

Analisi dei Dati con Power Query. Pt 3: Gestione degli Errori Post Apertura File

CREARE PIÙ QUERY: UNA PER OGNI TABELLA DEL FILE SORGENTE

Vediamo adesso come è possibile utilizzare PQE per collegarsi alla stessa sorgente ma creando più query. Il nostro intento è quello di creare tante Query e connessioni quante sono le Tabelle che si hanno a disposizione nel file a cui ci “aggancia”.

Prima di procedere. Propedeuticità

Comee certamente saprai, ogni volta che si apre un file realizzato da altri e che contiene delle query, è molto probabile che il PQE rilevi degli errori di connessione.

È noto che una query punta a dei dati memorizzati in un “percorso” di salvataggio.

I file che io ti proporrò puntano ad una cartella che, sul mio PC, si trova in un “Data Path” diverso da quello in cui tu scaricherai i miei file.

Nel tutorial raggiungibile cliccando qui ti spiego come tali errori possono essere gestiti con estrema semplicità.

Step1: Connessione a più Tabelle dello stesso File

1)     Scarica il file Es_01-PQ-B.xlsx ed apri una nuova sessione di Excel

2)     Usa quanto già visto per connetterti con “Recupera Dati” a Es_01-PQ-B.xlsx

3)     Specifica che desideri connetterti a più elementi, come da figura

Non è stato fornito nessun testo alternativo per questa immagine

4)     Clicca “Trasforma”

Non è stato fornito nessun testo alternativo per questa immagine

5)     Nota che le query sono 5, una per ciascuna Tabella selezionata

6)     Osserva che nella Tab_Clienti, nel campo Nominativo, è presente una piccola barra rossa. È un segnale di allarme che segnala la presenza di errori nel campo. Come è possibile identificare quali siano gli errori? Scopriamolo di seguito.

Step2: Eliminazione degli Errori nei Campi

Appare evidente che gli errori possono essere di intralcio nella corretta gestione delle query e dei loro risultati.

Un modo per capire quali siano le righe che generano errori è quello per cui si salvano le query caricando il risultato in specifici fogli.

7)     Cliccando “Chiudi e Carica In” ed impostiamo come da figura che segue

Non è stato fornito nessun testo alternativo per questa immagine

8)     Clicca OK

9)     Avremo 5 nuovi fogli ed altrettante connessioni

Non è stato fornito nessun testo alternativo per questa immagine

10)     Nota che la connessione alla Tab_Clienti, riportata nella sezione “Query e Connessioni” riporta il numero specifico degli errori.

11)      Clicca adesso sul comando “Aggiorna”

Non è stato fornito nessun testo alternativo per questa immagine

12)     Si ottiene una finestra in PQE che ci mostra chiaramente dove si trovino gli errori: nella colonna Nominativo e nella colonna CAP

Non è stato fornito nessun testo alternativo per questa immagine

13)     Se chiudiamo adesso il PQE e decidiamo di mantenere le modifiche, avremo sempre la possibilità di accedere nuovamente alla schermata cliccando sulla relativa connessione come da figura che segue. Proviamo a chiudere ed accettare la conservazione delle modifiche.

Non è stato fornito nessun testo alternativo per questa immagine

14)     Con un doppio click sulla connessione, come da freccia nella figura di cui sopra, si riapre il PQE

Non è stato fornito nessun testo alternativo per questa immagine

15)     Portiamo il mouse sulla barra arancione del campo Nominativo. Si apre un menù che propone come primo comando la Rimozione degli Errori

Non è stato fornito nessun testo alternativo per questa immagine

16)     Cosa accade nel momento in cui, appunto, rimuovo gli errori? Sicuramene la paura più grande è quella di perdere i dati. Non ti devi preoccupare, stai lavorando in PQE e qualunque cosa tu faccia non modifica la struttura originale dei dati.

17)     Clicca su “Rimuovi Errori” del campo Nominativo

Non è stato fornito nessun testo alternativo per questa immagine

18)     Nota che gli errori sono scomparsi e che nell’elenco dei Passaggi Applicati è presente il relativo step.

19)     Fai la stessa con gli errori del campo CAP

Non è stato fornito nessun testo alternativo per questa immagine

20)     Nessun errore è più presente nella Tabella che raccoglieva, appunto, solo gli errori.

21)     Da notare che nella “macchina del tempo” dei Passaggi Applicati puoi sempre andare a ritroso ed annullare gli step effettuati.

22)     Chiudi adesso il PQE e mantieni le modifiche

23)     Prova ad aggiornare la query indicata dalla freccia nella figura che segue

Non è stato fornito nessun testo alternativo per questa immagine

24)     Cosa noti di strano? Hai un’idea del perché gli errori continuino ad essere presenti? Prima di leggere la risposta al punto che segue prova a trovare da solo la risposta.

25)     Gli errori continuano ad essere presenti proprio in virtù del fatto che durante i passaggi della rimozione degli errori hai lavorato sulla query che si occupava da fare da specchietto degli errori presenti nella “Tab_Clienti”. Non a caso il nome della query è “Errori in Tab_Clienti”

26)     Rimuovi gli ultimi due passaggi in “Errori in Tab_Clienti” per tornare alla schermata che segue

Non è stato fornito nessun testo alternativo per questa immagine

27)     Chiudi e mantieni le modifiche. Hai ripristinato lo specchietto degli errori.

28)     Per rimuovere gli errori nella query “Tab_Clienti” fai doppio click sul nome della query stessa.

29)     Ripeti da solo i passaggi di rimozione degli errori visti prima

30)     Dovrai ottenere questo risultato in PQE

Non è stato fornito nessun testo alternativo per questa immagine

31)     E questo è quanto originato dalla query nel foglio a cui è connessa

Non è stato fornito nessun testo alternativo per questa immagine

32)     Con un doppio click qualsiasi su una query, puoi aprire il PQE, ma esiste anche un altro specifico comando. Da scheda Dati ---> Recupera Dati - Avvia l’Editor di PQ

Non è stato fornito nessun testo alternativo per questa immagine

33)     Apri PQE e portati nella query Tab_Clienti

Non è stato fornito nessun testo alternativo per questa immagine

34)     Come da figura sopra nota che la profilatura, cioè l’anteprima dei risultati, è relativa alle prime mille righe. Questo è dovuto al desiderio di mantenere rapido il passaggio tra una schermata e l’altra di anteprima.

35)     Clicca sul tab indicato dalla freccia e scegli di effettuare la “Profilatura della colonna in base all’intero set dei dati”

36)     Effettua la stessa operazione per tutte le query

Non è stato fornito nessun testo alternativo per questa immagine

37)     Attiviamo adesso una particolare modalità di visualizzazione che ci offre lo spunto per apprezzare l’impatto sui tempi di aggiornamento delle anteprime delle modifiche appena compiute.

38)     Attiva quanto indicato dalla freccia nella figura che segue. Il risultato non ha bisogno di spiegazioni.

Non è stato fornito nessun testo alternativo per questa immagine

39)     Attivandolo ottengo quanto segue:

Non è stato fornito nessun testo alternativo per questa immagine

40)     Prova a passare tra una query all’altra e nota i tempi di aggiornamento soprattutto per la “Tab_Fatture”

41)     Adesso riporta tutto sulle anteprime per i primi mille record e testa le differenze.

42)     Disattiva la visualizzazione della “Colonna Qualità”

Non è stato fornito nessun testo alternativo per questa immagine

43)     Salvare il file così strutturato e privo di errori con il nome di Es_02-PQ-C.xlsx

44)     Il file ultimo salvato non contiene errori.

45)     Possiamo e dobbiamo farci una domanda: quali erano gli errori? Abbiamo provveduto a cancellare ogni record che contenesse degli errori, ma senza indagare quali questi fossero. Avremmo potuto gestire e magari effettuare una correzione, senza cancellare direttamente i record contenenti gli errori?

Step3: Identificazione e Gestione degli Errori

Proviamo adesso a comprendere quali siano gli errori prima identificati dal PQE: potrebbe risultare possibile la loro correzione.

Apriamo un file nuovo di Excel ed agganciamoci al Es_02-PQ-B.xlsx. Questo file è una versione che contiene tutti gli errori e le relative righe.

46)     Specifica che desideri connetterti a più elementi, come da figura

Non è stato fornito nessun testo alternativo per questa immagine

47)     Clicca “Trasforma”

Non è stato fornito nessun testo alternativo per questa immagine

48)     Nota che le query sono 5, una per ciascuna Tabella selezionata

49)     Da File, scegli “Chiudi e Carica In” ed impostiamo come da figura che segue

Non è stato fornito nessun testo alternativo per questa immagine

50)     Clicca OK

51)     Avremo 5 nuovi fogli ed altrettante connessioni

Non è stato fornito nessun testo alternativo per questa immagine

52)     Nota che la connessione alla Tab_Clienti, riportata nella sezione “Query e Connessioni” riporta il numero specifico degli errori.

53)     Nel pannello Query e Connessioni clicco su voce “92 errori”

Non è stato fornito nessun testo alternativo per questa immagine

54)     Genero una specifica query che rileva gli errori

Non è stato fornito nessun testo alternativo per questa immagine

55)     Dal contenuto dell’anteprima della query prendo il primo record e noto che il primo errore si ha su “IdCliente” 270

56)     Doppio click su query “Tab_Clienti” ed apro la query in PQE

57)     Dal pannello “Passaggi Applicati” seleziono la voce “Navigazione”.

Senza cercare di essere troppo esaustivi, per non confondere le idee, selezioniamo “Navigazione” perché desideriamo agire con delle modifiche prima che PQE apporti in autonomia delle modifiche al tipo di dati presenti in ogni colonna. PQE cerca, infatti, di capire da solo quale sia il tipo di dati presente nelle colonne. Alcune incongruenze rilevate in questa fase vengono contrassegnate come errori.

58)     Cerco IdCliente 270

59)     Noto che nel Cap si ha una lettera “x” finale. È bene specificare che a differenza di Excel tradizionale, il PQE è Case Sensitive.

Non è stato fornito nessun testo alternativo per questa immagine

60)     Decido di sostituire le “x” minuscole con degli zero generici

61)     Click Dx su intestazione “CAP” e scelgo “Sostituisci Valori”

Non è stato fornito nessun testo alternativo per questa immagine

62)     Riceviamo un prevedibile messaggio di monito ed accettiamo di inserire

Non è stato fornito nessun testo alternativo per questa immagine

63)     Chiediamo di sostituire le “x” minuscole con uno zero “0”

Non è stato fornito nessun testo alternativo per questa immagine

64)     Dopo aver effettuato la modifica torniamo a vedere cosa è successo a IdCliente con 270

Non è stato fornito nessun testo alternativo per questa immagine

65)     Abbiamo risolto il problema dei CAP?

66)     Spostiamoci nuovamente in “Modifica Tipo” dai “Passaggi Applicati”

67)     Gli errori se ne sono andati

Non è stato fornito nessun testo alternativo per questa immagine

68)     Notiamo tuttavia che in presenza della riga quindici, il CAP non è nel formato specifico con cinque caratteri,

69)     Risolviamo il problema modificando il tipo di dati e portandolo su “Testo”

70)     Clicco sui numeri presenti in alto a SX del campo CAP

Non è stato fornito nessun testo alternativo per questa immagine

71)     Scelgo “Testo”

Non è stato fornito nessun testo alternativo per questa immagine

72)     Scelgo sostituisci corrente

73)     Anche la riga quindici è sistemata, così come tutte le riga afflitte dallo stesso problema

74)     Rimangono adesso gli errori del campo Nominativo

Non è stato fornito nessun testo alternativo per questa immagine

75)     Click su query “Errori in Tab_Clienti”

76)     Sono rimasti gli errori solo nel campo “Nominativo”

Non è stato fornito nessun testo alternativo per questa immagine

77)     Cliccando su uno qualsiasi dei valori di errore, “Error”, nella colonna “Nominativo” si ha quanto segue

Non è stato fornito nessun testo alternativo per questa immagine

78)     Si capisce che questa volta l’errore lo eredito dalla tabella di origine, quella a cui mi sono agganciato.

79)     Elimino l’ultimo passaggio applicato “Nominativo”

80)     Decido di sostituire i nominativi che presentano quel tipo di errore imputandoli ad un generico cliente anonimo, il cui nominativo è, appunto, “A. Nonimo” 😊

81)     Seleziono Query “Tab_Clienti”

82)     Per effettuare la sostituzione, clicco con DX su intestazione campo “Nominativo”

83)     Scelgo “Sostituisci Errori” e imposto come da figura

Non è stato fornito nessun testo alternativo per questa immagine

84)     Ecco che anche questi errori sono spariti

85)     In sostanza:

a.      gli errori sul CAP erano imputabili ad una specifica di formato non adatta ed alla presenza di lettere insieme a dei numeri

b.      gli errori sui nominativi derivano dal file originale di Excel standard

c.      ricordiamo che nessuna modifica al file originale è stata effettuata

86)     Chiudere PQE accettando le modifiche

Non è stato fornito nessun testo alternativo per questa immagine

87)     Salviamo il file con il nome Es_02-PQ-D.xlsx

Nel prossimo articolo ripartiremo proprio ultimo file che hai salvato.

Gabriele Di Ruvo

Aiuto aziende e privati a trasformare i 🅳🅰🆃🅸 in 🅸🅽🅵🅾🆁🅼🅰🆉🅸🅾🅽🅸 con corsi di Excel, Power Query, Power Pivot e Power BI. Docente e studioso di "Analisi dei Dati" per lavoro e per passione.

2 anni

Grazie Alex!

Alessandro Cataldo

Lo Startup Mentor disabile > Rompo barriere, creo soluzioni 🚀 Growth & Digital Business Strategist 🐝 AgriFood Expert 🌱 Podcaster 🎙️

2 anni

Sempre al top con questi articoli, non vedo l'ora che esca il prossimo 😁

Per visualizzare o aggiungere un commento, accedi

Altre pagine consultate