[ninux-not-wireless] Test RAM ECC su AMD Ryzen

Stefano De Carlo stefanauss at gmail.com
Tue May 30 11:26:56 CEST 2017


Il 30/05/2017 11:10, Germano Massullo ha scritto:
>> [...] i server in caso di hard error ti mandano una mail (se hai
> configurato il servizio di monitoring). A quel punto migri i servizi di
> modo che non ci sia interruzione del servizio. A quel punto spegni il
> server.

Come tutto è una valutazione che va fatta caso per caso, ma ha serie controindicazioni.

Un sistema con hard errors lasciato attivo consente una potenziale corruzione dei dati *silenziosa*. Non puoi rilevarla. Basti pensare ad esempio ad un raid5, linux-md calcola la parità, va a scriverla, e i bit flippati scrivono male la parità. Non verrà mai rilevata, e in caso di ricostruzione necessaria verrà assunto che è la parità corretta, rovinando i dati ricostruiti.

Essendoci la possibilità di corruzione silenziosa, opterei praticamente sempre per uno shutdown.

Stefanauss.



More information about the Not-wireless mailing list