[ninux-not-wireless] Test RAM ECC su AMD Ryzen
Stefano De Carlo
stefanauss at gmail.com
Tue May 30 11:26:56 CEST 2017
Il 30/05/2017 11:10, Germano Massullo ha scritto:
>> [...] i server in caso di hard error ti mandano una mail (se hai
> configurato il servizio di monitoring). A quel punto migri i servizi di
> modo che non ci sia interruzione del servizio. A quel punto spegni il
> server.
Come tutto è una valutazione che va fatta caso per caso, ma ha serie controindicazioni.
Un sistema con hard errors lasciato attivo consente una potenziale corruzione dei dati *silenziosa*. Non puoi rilevarla. Basti pensare ad esempio ad un raid5, linux-md calcola la parità, va a scriverla, e i bit flippati scrivono male la parità. Non verrà mai rilevata, e in caso di ricostruzione necessaria verrà assunto che è la parità corretta, rovinando i dati ricostruiti.
Essendoci la possibilità di corruzione silenziosa, opterei praticamente sempre per uno shutdown.
Stefanauss.
More information about the Not-wireless
mailing list