Miért nem használják a PC-k a hibajavító RAM-ot? “Mert az Intel” – mondja Linus

Nagyítás / Az elmúlt pár évben kedvesebb, szelídebb Linus Torvalds-t élveztük .. de ez nem azt jelenti, hogy abbahagyta a véleményét.

Ezen a hétfőn Linus Torvalds, a Linux kernel-készítője csalódottan folytatta a hibajavító ellenőrző összeg (RAM) hiányának hiányát a fogyasztói számítógépeken és laptopok.

… a “fogyasztóknak nincs szükségük ECC-re” a megtévesztett és szamár-visszafogott politika, az ECC-memória piaca megszűnik.

Az ECC-vel szembeni érvek mindig teljesek voltak és szemetet szórtak. Most még a memóriagyártók is kezdik az ECC-t belsőleg csinálni, mert végül birtokolják azt a tényt, hogy mindenképpen muszáj.

Ha nem ismeri az ECC RAM-ot, az valószínűleg azért történik, mert nem szerverszintű CPU-kat és alaplapokat használó dedikált szervereket épít vagy specifikál – ami sajnos kb. az egyetlen hely, ahol valóban megtalálod az ECC-t. Dióhéjban az ECC RAM kis mennyiségű extra memóriát tartalmaz a hibák észleléséhez és kijavításához.

Memóriahibák és valószínűség

A legtöbb modern megvalósításban ez minden 64- a RAM-ban tárolt bit szó, nyolc ellenőrző bit van. Egyetlen hibát – a 0-t 1-re fordítva vagy 1-et 0-ra fordítva – automatikusan észlelheti és kijavíthatja. Két, ugyanazon szóban elfordított bit felismerhető, de nem javítható. Három vagy több ugyanabban a szóban elfordított bit valószínűleg észlelhető lesz, de az észlelés nem garantált.

A bit flipek számos okból történhetnek, kezdve kozmikus sugárzásból vagy egyszerű hardverhibából. A Google szervereiről végzett nagyszabású tanulmány megállapította, hogy a Google flottájában található összes szerver (és az összes DIMM 8% -a) körülbelül 32% -ában évente legalább egy memóriahiba tapasztalható. De ezek túlnyomó többsége egybites hiba – és mivel a Google szerver CPU-kat és ECC RAM-ot használ, ez azt jelenti, hogy a szóban forgó gépek jobbra szállítanak.

További részletek

A fogyasztói gépekben ezek az egybites hibák – amelyek a Google adatai szerint több mint 40-szer nagyobb valószínűséggel fordulnak elő, mint a többbites hibák – észrevétlenül maradnak, és bevezethetnek instabilitás a rendszerekben és az adatok sérülése.

A bitek nem mindig véletlenül fordulnak át

Nem minden RAM-hiba hardverhiba vagy nem szándékos EMF-probléma eredménye. Az elmúlt években a kutatók egyre praktikusabb, fizikán alapuló mellékcsatorna-támadásokat fejlesztettek ki, vezérelt, gyors bit-lapozgatásokat alkalmazva egy RAM által elérhető alkalmazásokhoz hozzáférhető RAM-területeken, hogy levezessék vagy módosítsák a RAM szomszédos területein lévő adatok értékét, amelyeket nem kellene tudniuk. .

Bár az ECC RAM nem képes enyhíteni a szomszédos memória értékét levonó RAMBleed típusú támadásokat, általában megállíthatja a Rowhammer-támadásokat – amelyekben a RAM egyik területén gyorsan átfordított bitek megváltoztatják a szomszédos területek bitjeit.

Még akkor is, ha az ECC nem képes aktívan megakadályozni, hogy egy Rowhammer-támadás hatással legyen a rendszerre – például ha több bitet fordít egyetlen szóval -, akkor legalább riaszthatja a rendszert a problémáról, és A legtöbb esetben megakadályozza, hogy a Rowhammer támadás mást tegyen, mint hogy leállást okozzon. (A legtöbb ECC rendszer úgy van beállítva, hogy megállíthatatlan hibát észlelve az egész gépet leállítsa.)

Torvalds az Intel-t hibáztatja

És a memóriagyártók c a gazdaság és az alacsonyabb teljesítmény miatt. És hazug gazemberek – hadd mutassak rá még egyszer a kalapácsra, hogy ezek a problémák már több generáció óta fennállnak, de ezek a f * ckerek boldogan adták el a törött hardvert a fogyasztóknak, és azt állították, hogy “támadás” volt, amikor mindig “sarkokat vágunk.”

Hányszor fordult elő olyan sima kalapács, mint a bit-flip, pusztán a balszerencsével valós, támadás nélküli terheléseknél? Soha nem fogjuk megtudni. Mert az Intel szart nyomott

Torvalds merész álláspontot képvisel, miszerint az ECC RAM hiánya a fogyasztói technológiában az Intel hibája a vállalat mesterséges mesterséges politikája miatt. piaci szegmentáció. Az Intelnek érdeke fűződik ahhoz, hogy a mélyebben zsebre tett vállalkozásokat drágább – és jövedelmezőbb – kiszolgáló szintű CPU-k felé terelje, ahelyett, hogy hagyná ezeket az egységeket hatékonyan használni a szükségszerűen alacsonyabb árrésű fogyasztói alkatrészeket.

Az ECC RAM olyan CPU-kból, amelyek nem közvetlenül a szervervilágra irányulnak, az Intel egyik módja annak, hogy ezeket megtartsa erősen szegmentált piacok. Torvalds “érvelése itt az, hogy az Intel nem hajlandó támogatni az ECC RAM-ot a fogyasztók számára megcélzott részeiben – és az adott téren szinte monopóliummal rendelkezik – annak a valódi oka, hogy az ECC szinte nem érhető el a kiszolgálón kívül.

Reklám

A szokásos érv arról, hogy az ECC miért nincs jelen a fogyasztói technikában, a költségek körül forog, de gyanítjuk, hogy Torvaldsnak joga van ehhez. Annak ellenére, hogy az ECC RAM lényegében nehezen megtalálható speciális alkatrész, általában csak körülbelül 20 százalékkal kerül többe DIMM-enként, mint a nem ECC-k a kiskereskedelemben. A valódi probléma az, hogy az ezt támogató alaplapok és CPU-k nélkül nem fog neked valami jó.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük