Il possibile fermo della produzione è un argomento che fa sempre molto scalpore, specie se si parla di blocchi causati dal sistema informativo.

 

Qualche anno fa, il CEO di una delle più importanti case produttrici di storage per PC fece sobbalzare l’audience, quando dichiarò: “Il vostro hard disk si romperà. Non è questione di se, ma di quando”.

Per analogia, possiamo applicare il principio anche al sistema informativo aziendale. Siamo convinti che sia una macchina perfetta che non ci pianterà mai in asso. Ma la realtà è ben diversa: un sistema informativo è una struttura complessa piena di cose che si possono rompere. E quando succede, le conseguenze possono essere anche molto gravi. Quanto gravi dipende da almeno due fattori principali: che tipo di guasto ci ha colpiti, e quanto tempo impieghiamo a tornare operativi.

Fermo produzione: il tempo è denaro

La prima conseguenza, immediata e generalizzata, di un fermo produzione, è che l’azienda comincia a perdere soldi. E più l’azienda è grande, più soldi perde per ogni minuto di fermo. Sì, parliamo in minuti, perché le cifre in ballo sono consistenti e anche brevi blocchi possono ripercuotersi pesantemente sui conti aziendali. Gartner, in una sua ricerca intitolata “The cost of downtime”, parla (per le aziende americane) di una media di 5.400 dollari al minuto, mentre un simile studio di Avaya indica un range che va da 2.000 a 9.000 dollari al minuto. Ma non è solo una questione di soldi.

Proviamo a ipotizzare qualche scenario tipico di diversa gravità.

I fermi produzione e i guasti al server

Il primo scenario, che oggi consideriamo “meno grave”, era l’incubo dei CIO fino a poco tempo fa: il guasto del server principale. Nelle architetture in voga fino a pochi anni fa, quando le aziende erano informatizzate con terminali collegati al server centrale, questo evento bloccava l’attività di tutti gli uffici. Oggi, dato che anche il server “on premise” è diventato una commodity, spesso affiancato – se non sostituito – da servizi cloud, un guasto a questo componente è decisamente meno critico e può addirittura non causare un fermo produzione. Se si dispone di servizi in cloud, infatti, è solo questione di ridirigere il carico verso il service esterno e l’attività può riprendere. In un evento di questo tipo, il danno sarà probabilmente costituito solo dal costo della riparazione/sostituzione del server, dal costo supplementare per il maggior carico di lavoro sul cloud, ed eventualmente dal costo del personale che per qualche minuto è stato impossibilitato a fare il suo lavoro. Se  il sistema è solo on premise, quasi sicuramente il server sarà inserito in un’architettura High Availability, che tramite ridondanza, load balancing o altre strategie assicura la continuità delle operazioni nel caso di caduta di una delle macchine; però nei rari (ma possibili) casi in cui tutti i server vengano bloccati, probabilmente il tempo di riattivazione sarà di qualche ora, e quindi i costi leggermente più alti, ma ancora gestibili.

I rischi della rete

Uno scenario più grave di fermo produzione è il blocco della rete di trasmissione dati. Quando la rete è ferma, moltissimi dipendenti sono di fatto inattivi, pur essendo presenti in ufficio. È quindi sorprendente come moltissime aziende, per le quali l’infrastruttura di rete dovrebbe essere fondamentale, non si preoccupino di ridondare le connessioni, esponendosi così a interruzioni critiche. Ma forse non dovremmo stupirci troppo, visto che spesso capita di vedere sottostimate anche le esigenze di banda sul circuito principale. In una tipica configurazione mista, basata su server on premise e on cloud il crollo della rete isola di fatto l’intelligenza dallo storage, ed entrambi dai PC dei dipendenti e da quelli di controllo delle linee di produzione.

Un doppio fermo di produzione

Questo tipo di problematica è ancora più grave se la rete mantiene in collegamento fra sistema informativo centrale e unità produttiva. In questi casi, infatti, comporta anche il blocco delle linee di produzione. Quindi il danno economico non è più solo quello dato dai dipendenti pagati per non lavorare, ma anche per la perdita di produzione. Per far ripartire le linee di produzione ci vuole tempo, e può succedere di ritardare le consegne, magari dovendo poi pagare le relative penali. Per fortuna, molte fabbriche vengono oggi equipaggiate con sistemi di “edge computing” che permettono di evitare un fermo produzione in assenza di collegamenti con il sistema centrale, portando “in locale” sufficiente intelligenza per gestire il funzionamento day by day.

La rete e i clienti

Se poi l’azienda usa Internet per interagire direttamente con la sua clientela, il problema si complica ulteriormente.  Per chi fa e-commerce, per esempio, un blocco della rete ferma le vendite, procurando un mancato guadagno. in più il cliente che tenta di comprare e non riesce a collegarsi, si rivolge al concorrente. Anche un semplice sovraccarico fa perdere clientela, figuriamoci un blocco.

Fermo produzione, dati e backup

I dati sono l’asset principale di un’azienda. Infatti, nessuno è così pazzo da gestire un sistema informativo senza poter contare su un backup dato che, ripartire da zero dopo una perdita di dati importante presenta costi elevatissimi, tempi lunghi e spesso semplicemente è impossibile.

Ma attenzione: anche avere un backup non dà certezze di recupero. Perché a seconda della tipologia di media impiegata, e delle strategie adottate, anche i backup potrebbero avere dei problemi. Non per niente fra gli addetti ai lavori gira la battuta che quello che conta davvero non è fare il backup, ma poter fare il restore. Il recupero è possibile, nella misura in cui si è stati previdenti.

In ultima analisi, preparandosi al peggio per tempo è possibile sopravvivere anche a questo tipo di disastri. È richiesta un po’ di lungimiranza, una buona pianificazione del da farsi, e qualche investimento supplementare.