이전 게시물

메모리 업계, DDR4이 늦어지며 DDR3은 저전압화

대두 2011. 10. 28. 15:55

메인스트림 DDR3는 1866Mbps까지 지원

 

인텔과 메모리 업계는 PC 시장에서 차세대 메모리 DDR4의 보급을 느리게 진행할 계획입니다. PC에 출시가 시작되는 것은 2014년부터이며, 본격적으로 DDR3을 대체하는 것은 2015년으로 늦어질 전망입니다. 그때까지 DDR4는 서버 메모리에만 머무를 것입니다. 따라서 PC 메모리는 앞으로 3년 동안 DDR3이 메인스트림으로 지속될 것입니다. DDR2에서 DDR3로 바뀔 때에도 예상보다 시간이 걸렸지만, DDR3에서 DDR4로의 변화는 그 이상으로 시간이 걸립니다. 따라서 DDR3의 현역 유지는 꽤 오랬동안 유지될 전망입니다.

 

01.jpg

 

DRAM 로드맵

 

그러면 장기간 동안 PC에서 사용될 DDR3의 속도는 어디까지 올라갈까요? DDR3의 속도 발전도 느리게 진행될 것입니다. 예를 들어 인텔의 경우에는 PC에서 지원하는 DDR3 메모리의 전송율이 1333Mbps에서 1600Mbps까지만 오르게 되면, 다음에는 1866Mbps를 지원합니다. 그러나 인텔이 표준 지원하는 DDR3의 전송율은 그게 마지막이 됩니다. 인텔 개발자 포럼(IDF)의 메모리 세션에서 메모리 로드맵의 설명을 담당한  Geof Findley(SrManager, Platform Memory Operation, Intel)는 다음과 같이 설명합니다.

 

"DDR3의 전송율은 1866Mbps가 최고속일 것입니다. JEDEC에서는 2133Mbps도 논의하고 있지만, 그것은 하이엔드 데스크탑과 같은 퍼포먼스 세그먼트에서만 지원하는 Extreme Memory Profile(XMP)에만 한정됩니다. 일반적인 제품에서는 1866Mbps가 최고일 것입니다"

 

일반 메모리 가격대에서 구입할 수 있는 메인 스트림 메모리는 1866Mbps에서 멈출 것입니다. 또한 인텔과 같은 CPU 제조사의 공식 지원도 여기에서 멈출 것입니다.

 

02.jpg

 

인텔의 메모리 로드맵(IDF 2011의 자료)

 

 

고속화에 한계가 있는 DDR3 메모리

 

DDR3가 메인스트림에서는 1866Mbps까지만 지원하는 이유 중에는 DRAM의 문제도 있습니다. 지금의 고속 DRAM은 내부 메모리 셀에서 한번 엑세스할 때마다 여러 데이터를 읽어내는 Prefetch 방법을 사용하여 메모리 코어와 인터페이스의 속도의 차이를 메꾸고 있습니다. 예를 들어 DDR3는 Prefetch8을 사용하여 8n 비트의 데이터를 1 클럭에 읽고 씀으로서 메모리 코어 동작 속도의 8배에 해당하는 버스 전용율을 가능하게 하고 있습니다. 아래 차트는 그 관계를 나타낸 그림입니다. Prefetch4의 DDR2와 비교하여 Prefetch8의 DDR3은 메모리 코어 속도가 같을때 2배의 전송율을 실현합니다. 메모리 코어 자체도 느리긴 하지만 고속화되고 있기 때문에 전송율의 상한도 올라가고 있습니다.

 

03.jpg

 
DDR의 Prefetch 아키텍처. 

 

04.jpg

 

DRAM 셀과 IO 클럭의 관계

 

그러나 메모리 코어의 속도를 크게 개선시킬 수는 없습니다. 따라서 DRAM 버스를 지나치게 빠르게 만들어도 메모리 코어를 따라갈 수가 없습니다. 따라서 빠른 속도로 작동하는 제품은 제품 수율이 낮을 수밖에 없습니다.

 

05.jpg


DDR DRAM 전송율

 

DDR3는 많은 제조사에서 1866Mbps 정도 까지가 충분한 수율을 확보할 수 있는 한계에 가깝다고 추측하고 있습니다. 2133Mbps는 수율이 한정되기 때문에 보급이 한정될 것으로 보입니다. 2133Mbps 이상은 DDR4의 속도에 해당됩니다.

 

위 그림에서 DDR4은 Prefetch 8n입니다. 이것은 뱅크 그루핑에 의해 다른 뱅크에 병렬 액세스를 하여, 액세스를 Prefetch 8 수준으로 줄이기 위한 것입니다. 실질적으로는 메모리 코어에 Prefetch 16 수준 대역의 액세스를 하는 것으로 추정됩니다.

 

메모리 액세스가 커지면 한번에 CPU나 GPU에서 읽고 쓰는 메모리의 양이 커집니다. 그러나 프로세서에서 필요로 하는 데이터의 크기는 특정 어플리케이션 이외에는 커지지 않습니다. 그 때문에 메모리 엑세스의 크기가 커지면 CPU에서의 액세스가 낭비됩니다. DDR4의 뱅크 그루핑은 그런 낭비를 막고 고속 DRAM 인터페이스를 효율적으로 사용시키기 위한 기술입니다.

 

이 방법은 램버스 Mobile XDR DRAM의 Micro-threading과 기본적으로는 같은 방법으로 추측됩니다. Wide I/O도 동일하게 원-칩에서 4채널 액세스를 동시에 하면서 메모리 액세스 크기를 줄이고 있습니다. 다른 뱅크와 병렬 엑세스를 통해 액세스 크기를 줄이는 방법은 고속 메모리 시대에서 표준적인 방법이 되는것 같습니다. 다만 이러한 기술은 특허 문제가 생기는 경우가 많기 때문에 DDR4의 뱅크 그루핑도 엑세스 크기가 줄어들지는 모릅니다.

 

 

저전압 DDR3L과 초저전압 버전 DDR3UL


4〜5년마다 2배 정도의 느린 페이스로 발전하고 있는 메인스트림 DRAM의 고속화 대신, 새로운 요소로 DRAM의 저전력화가 시작되고 있습니다. JEDEC은 DDR3의 저전압 버전인 DDR3L을 규격화하여 보급을 시작하고 있습니다. 그리고 인텔도 서버 CPU에서 저전압 버전 DDR3L의 지원을 진행하며, 내년부터는 노트북에서도 DDR3L의 지원을 시작합니다. 메모리 탑재량이 많은 서버와, 배터리로 작동하는 모바일은 모두 DRAM의 전력이 줄어드는 의미가 큽니다.

 

일반 DDR3이 1.5V로 작동하는데 비해 DDR3L은 1.35V 작동으로 90% 저전압화 했습니다. 전압은 전력 소비에 밀접한 연권이 있으므로 실제 구동시 소비 전력은 이론적으로 80%까지 줄어듭니다. 아래의 JEDEC 슬라이드에서는 동일한 전송율에서 일반 전압 버전보다 80% 이하로 전력이 감소하고 있습니다. 또한 JEDEC은 전압을 1.25V로 줄인 DDR3UL(DDR3U라고 불리는 경우도 있음)도 추진하고 있습니다. 이쪽은 십몇%의 전력이 더 줄어들게 됩니다.

 

06.jpg

 
DRAM 전압과 전력에 관한 JEDEC의 자료

 

실제 제품에서는 다소 다른 부분이 있습니다. 아래의 하이닉스 슬라이드를 보면 쉽게 알 수 있습니다. DDR3L에서는 실제 작동하는 IDD0 이나 IDD1에서는 80% 대의 전력으로 작동하며, 대기 상태의 IDD2N 등에서도 80% 정도로 줄어들고, 대기 상태에서 셀프 리프레시를 하는 IDD6 에서도 90% 정도로 감소하고 있습니다. DDR3UL은 여기서 십몇%가 더 줄어듭니다. 이를 보면 DDR3L에서는 작동시 뿐만 아니라 대기 상태의 메모리 전력도 줄어드는 것을 알 수 있습니다. 이것은 배터리 구동의 노트북에서 작동 시간이 늘어난다는 것을 의미합니다.

 

07.jpg

 

DDR3의 전압과 전력에 관한 하이닉스의 자료

 

 

DDR3를 오래 유지하기 위해 제조 공정의 미세화가 진행

 

DDR3의 저전압 파생 규격이 계속 등장하는 배경 중에는 DDR3의 제조 공정 발전이 있습니다. DDR3은 삼성의 80나노 공정으로 생산을 시작하여 다른 회사들도 70나노에서는 첫 세대의 1Gb 양산칩을 만들었습니다. 거기에서 60나노, 50나노, 40나노대를 거치면서 지금은 2Gb를 30나노 공정에서 생산하고 있습니다. 즉, 제조 공정은 80나노-70나노60나노대-50나노대-40나노대-30나노대로 발전하고 있으며, 20나노대 공정에도 도달하려 하고 있습니다.

 

DRAM의 제조 공정은 2년마다 빨라지고 있습니다. 이것은 낸드 플래시 메모리의 제조 공정 발전이 2년마다 이루어진 것과 관련이 있습니다. DRAM와 낸드 플래시를 같이 생산하는 회사는 낸드 플래시에 첨단 공정을 사용하고, 그 공정을 다음 단계에서 DRAM에 사용하는 경우가 있습니다. 낸드 플래시의 공정 미세화는 그 속도가 느려졌다가 최근 경쟁을 통해 다시 빨라지고 있으며, 이것이 DRAM에도 영향을 주고 있는 것으로 보입니다.

 

08.jpg

 

DRAM의 제조 공정과 용량의 로드맵

 

DDR3이 80나노에서 20나노대까지 다양한 세대의 공정에서 제조되는 것은, DDR3가 그만큼 오래 지속되고 있기 때문엡니다. 즉, DDR4 세대로 이행이 늦어지면서 DDR3는 제조 공정의 미세화가 진행되고, 여기에 부차적으로 전압을 낮추는 것도 쉬워지고 있습니다. 또한 똑같은 전압에서도 제조 공정 미세화를 통해 약간은 전력이 줄어들게 됩니다. DDR3의 저전력화는 느린 이행 속도에 대한 댓가라 할 수 있습니다.

 

09.jpg

 

제조 공정에 의한 전력 저하(하이닉스).

 

10.jpg

 

삼성은 50나노대에서 20나노대로 가면 소비 전력을 65% 줄일 수 있다고 보고 있습니다.

 

제조 공정의 미세화가 진행될동안 칩의 다이 사이즈는 작아지고 있습니다. 기존의 DRAM 다이는 80평방mm 정도가 PC용 양산 사이즈였지만 지금은 그것을 훨씬 밑도는 사이즈가 되고 있습니다. 다이가 소형화한 이유는 DRAM 가격의 침체가 줄곧 계속되고 있고, 제조 비용을 될 수 있는한 줄여야 수익을 낼 수 있기 때문입니다.

 

현재 DDR3의 가격은 주력인 2Gb가 1달러 전후, 1Gb는 60센트 정도가 되고 있습니다. 일반적으로는 여기까지 다이 크기가 작아지면, 더 큰 용량의 가격이 단가가 저렴하기 때문에 DRAM 다이의 용량 발전이 이루어지게 됩니다. 하지만 지금은 PC 메모리에서 대용량화의 압력이 낮기 때문에 DRAM의 용량 발전도 크게 진행되진 않는 상황입니다. 이런 상황에서 DRAM 제조사는 DDR3 공정 전화의 장점을 DDR3L 같은 저전력 버전의 파생에서 찾으려 하고 있습니다. 또, 반대로 DDR3 파생 제품의 개발에 자원을 분할하는 것도 DDR4가 늦는 원인 중의 하나라고 JEDEC에서 설명하고 있습니다.

 

 

가격과 속도를 맞바꾼 DDR3L

 

DDR3L은 속도와 가격을 맞바꾼 제품입니다. DDR3L의 전송율은 일반 DDR3과 비교하여 동일 공정에서 한단계 떨어집니다. 일반 DDR3이 1600Mbps인데, 현재 메인스트림 DDR3L은 1333Mbps이며. 일반 제품에서 1866Mps가 메인스트림이 되면 DDR3L은 1600Mbps가 메인스트림이 됩니다. 제조사 중에는 고속으로 작동하는 제품의 도입을 서두르는 곳도 있습니다.

 

DDR3L은 DDR3과 기본적으로는 같은 다이를 사용한 제품입니다. DDR3 중에서 저전압으로 구동하는 특징이 사양에 맞는 것을 선별하고 있습니다. 삼성은 DDR3L에서 셀프 리프레시 전류 IDD6을 줄일 수 있는 다이를 선별해야 하기 때문에, 약간의 가격 상승 요소가 있다고 설명하고 있습니다. 그래도 양산 효과가 큰 DDR3와 같은 다이이기 때문에 DDR3과 완전히 다른 다이를 사용하는 LPDDR2/LPDDR3보다는 저렴하다고 설명합니다.

 

DDR3L은, DDR4까지의 틈을 메꾸는 스펙이라는 인상이 강합니다. DDR3UL보다도 더 낮은 1.2V로 작동하고, DDR3보다 뛰어난 저전력 요소를 갖춘 DDR4는  DDR3L과 비교하여 동일한 전송율에서 저전력으로 작동할 전망입니다.

 

11.jpg

 

하이닉스의 DDR3L.

 

12.jpg

 

 1866Mbps DDR4에서 보다 전력이 줄어듭니다(하이닉스).

 

13.jpg

 

DDR4는 모바일용 기능이 강화됩니다.

 

14.jpg

 

DRAM의 모바일 용 DDR4(하이닉스)

 

15.jpg

 

DDR3L보다 뛰어난 점(삼성)