PDF to CSV

PDF to CSV

il Dipartimento per lo Sport della Presidenza del Consiglio dei Ministri ha appena pubblicato l'elenco dei Contributi a fondo perduto per le ASD/SSD

Si tratta di un PDF di 208 pagine per 10.126 righe, non compliant per essere machine readable

Lo prendo come spunto per la conversione in un CSV con #Python

Nel CSV, infine, ho inserito pigramente e a mano lo zero mancante al primo codice fiscale

import camelot
import pandas as pd

tables = camelot.read_pdf(pdf, pages='all')
df = pd.concat([tab.df for tab in tables], ignore_index=True)

df.columns = df.iloc[0] # Set the First Row as Column Headers
df.drop(df.head(1).index,inplace=True) # drop first row
df.drop(df.tail(1).index,inplace=True) # drop last row
df['Importo contributo'] = df['Importo contributo'].str.replace('.', '').str.replace(',', '.').str.replace('€', '')
df['Importo contributo'] = df['Importo contributo'].astype(float)
df.to_csv('D:/elenco-beneficiari-impianti-sportivi.csv', index = False,sep='|')        

Per visualizzare o aggiungere un commento, accedi

Altri articoli di Paolo Volterra

  • L'intelligenza artificiale e la Privacy

    L'intelligenza artificiale e la Privacy

    Il solito dilemma: make or buy Quanti sanno che esistono altri #LLM #opensource che permettono di lavorare con i propri…

  • L'intelligenza artificiale in banca

    L'intelligenza artificiale in banca

    Le banche, come molte altre istituzioni, sono abituate ad usare la programmazione SQL (“se…allora”); l’AI cambia…

    2 commenti
  • Il Datascientist è una professione IT?

    Il Datascientist è una professione IT?

    La recente classifica di Experis Italia sulla #RAL media italiana IT, per profilo di media seniority, vede il…

  • Filiere e SDGs

    Filiere e SDGs

    Le filiere produttive possono avere impatti significativi sugli SDG (Obiettivi di Sviluppo Sostenibile) in base alla…

  • Delocalizzare ... al Mezzogiorno !

    Delocalizzare ... al Mezzogiorno !

    Il SAL del Governatore di @Banca-d'Italia sul #Mezzogiorno Qui il PDF del suo discorso ultimo a Catania; c'è pure il…

  • L'importanza di rimanere aggiornati sui cambiamenti del mercato

    L'importanza di rimanere aggiornati sui cambiamenti del mercato

    La 14ma edizione 2024 recepisce gli ultimi trend, affiancando recenti casi di studio di diverse aziende alla vastità…

    1 commento
  • MACHINE LEARNING E PREDICTIVE ANALYTICS NEL RISK MANAGEMENT

    MACHINE LEARNING E PREDICTIVE ANALYTICS NEL RISK MANAGEMENT

    Un recente paper di #AIFIRM indaga sul livello di conoscenza e di esperienza delle banche italiane in materia di #IA Da…

Altre pagine consultate