왜 PC가 오류 수정 RAM을 사용하지 않습니까? Linus는 “Intel 때문입니다.”라고 말합니다.


확대 / 우리는 지난 2 년 동안 더 친절하고 부드러운 Linus Torvalds를 즐기고 있습니다 .. 하지만 그렇다고 그가 의견을 멈춘 것은 아닙니다.

이번 월요일 Linux 커널 제작자 인 Linus Torvalds는 소비자 PC에 ECC (Error Correcting Checksum) RAM이 부족하다는 불만을 토로했습니다. 및 노트북.

… “소비자에게는 ECC가 필요하지 않다”라는 잘못된 정책과 역방향 정책이 사라지고 ECC 메모리 시장은 사라집니다.

ECC에 대한 주장은 항상 완전하고 완전 쓰레기였습니다. 이제 메모리 제조업체조차도 내부적으로 ECC를 수행하기 시작했습니다. 마침내 그들이 절대적으로해야한다는 사실을 소유했기 때문입니다.

ECC RAM에 익숙하지 않다면 서버급 CPU 및 마더 보드를 사용하여 전용 서버를 구축하거나 지정하지 않았기 때문일 수 있습니다. 실제로 ECC를 찾을 수있는 유일한 곳입니다. 간단히 말해서 ECC RAM에는 오류 감지 및 수정에 사용되는 소량의 추가 메모리가 포함되어 있습니다.

메모리 오류 및 확률

대부분의 최신 구현에서 이는 모든 64 개를 의미합니다. RAM에 저장된 비트 워드에는 8 개의 검사 비트가 있습니다. 단일 비트 오류 (0이 1로 반전되거나 1이 0으로 반전 됨)는 자동으로 감지되고 수정 될 수 있습니다. 같은 단어에서 뒤집힌 두 비트는 감지 할 수 있지만 수정할 수는 없습니다. 같은 단어에서 뒤집힌 3 개 이상의 비트가 감지 될 수 있지만 감지가 보장되지는 않습니다.

비트 뒤집기는 우주 광선 충격이나 단순한 하드웨어 오류로 시작하여 여러 가지 이유로 발생할 수 있습니다. Google 서버에 대한 대규모 연구에 따르면 Google의 전체 서버 중 약 32 % (및 모든 DIMM의 8 %)가 매년 최소 한 번의 메모리 오류를 경험합니다.하지만 대부분은 단일 비트 오류입니다. 그리고 Google은 서버 CPU와 ECC RAM을 사용하고 있기 때문에 문제의 기계가 트럭 운송에 적합하다는 것을 의미합니다.

자세히보기

소비자 컴퓨터에서는 이러한 단일 비트 오류 (Google 데이터에 따르면 다중 비트 오류보다 발생 가능성이 40 배 이상 더 높음)조차도 감지되지 않고 시스템 불안정 및 데이터 손상.

비트 플립이 항상 우발적 인 것은 아닙니다.

모든 RAM 오류가 하드웨어 오류 또는 의도하지 않은 EMF 문제의 결과 인 것은 아닙니다. 최근 몇 년 동안 연구자들은 하나의 애플리케이션에 액세스 할 수있는 RAM 영역에서 제어되고 빠른 비트 플립을 사용하여 점점 더 실용적인 물리 기반 부 채널 공격을 개발하여 RAM의 인접한 영역에서 데이터 값을 추론하거나 수정할 수 없습니다. .

ECC RAM은 인접 메모리의 값을 추론하는 RAMBleed 스타일 공격을 완화 할 수 없지만 일반적으로 RAM의 한 영역에서 비트를 빠르게 뒤집 으면 인접 영역의 비트가 변경되는 Rowhammer 공격을 차단할 수 있습니다.

ECC가 Rowhammer 공격이 시스템에 미치는 영향을 적극적으로 방지 할 수없는 경우에도 (예 : 한 단어로 여러 비트를 뒤집을 때) 적어도 시스템에 문제를 경고 할 수 있습니다. 대부분의 경우 Rowhammer 공격이 다운 타임을 유발하는 것 이외의 다른 작업을 수행하지 않도록 방지합니다. (대부분의 ECC 시스템은 수정할 수없는 오류가 감지되면 전체 시스템을 중지하도록 구성됩니다.)

Torvalds는 Intel을 비난합니다.

메모리 제조업체 c 경제성과 낮은 전력 때문입니다. 그리고 그들은 거짓말을하고 있습니다. 이러한 문제가 이미 여러 세대 동안 어떻게 존재했는지에 대해 다시 한 번 지적 해 보겠습니다.하지만이 놈들은 기꺼이 고장난 하드웨어를 소비자에게 팔았고 그것이 항상 그랬을 때 “공격”이라고 주장했습니다. “우리는 모서리를 깎고 있습니다.”

실제 비 공격 부하에서 순수한 불운으로 인해 비트 플립과 같은 행 해머가 몇 번이나 발생 했습니까? 우리는 결코 알 수 없습니다. 소비자에게.

Torvalds는 소비자 기술에서 ECC RAM의 부족이 인텔의 인위적 정책으로 인해 인텔의 잘못이라고 과감한 입장을 취합니다. 시장 세분화. 인텔은 기업이 반드시 마진이 낮은 소비자 부품을 효과적으로 사용하도록하는 것보다 더 비싸고 수익성이 높은 서버급 CPU로 더 많은 돈을 투자하는 비즈니스를 추진하는 데 기득권을 가지고 있습니다.

지원 제거 서버 세계를 직접 겨냥하지 않은 CPU의 ECC RAM에 대한 것은 인텔이이를 유지하는 방법 중 하나입니다. 시장은 강하게 세분화되었습니다. 여기에서 Torvalds의 주장은 인텔이 소비자 대상 부품에서 ECC RAM을 지원하는 것을 거부하는 것 (해당 공간에서 사실상 거의 독점적 임)이 ECC가 서버 공간 밖에서 거의 사용할 수없는 진짜 이유라는 것입니다.

광고

ECC가 소비자 기술에 존재하지 않는 이유에 대한 일반적인 주장은 비용에 관한 것이지만 우리는 Torvalds가 이에 대한 권리를 가지고 있다고 의심합니다. ECC RAM은 본질적으로 찾기 어려운 특수 부품이지만 일반적으로 소매점에서 비 ECC보다 DIMM 당 비용이 약 20 % 더 비쌉니다. 실제 문제는이를 지원하는 마더 보드와 CPU 없이는 그렇게 할 수 없다는 것입니다. 당신은 좋은 것입니다.

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다