본문 바로가기
IT 뉴스

AMD의 3세대 불도저 "Steamroller" 안내

by 피시미워요 2012. 12. 20.

 얼마 전 '핫 칩스' 컨퍼런스에서 AMD의 새로운 CTO'Mark Papermaster'에 의해 최초로 공개된 AMD의 차세대 x86 코어 '스팀롤러' 관련 정보가 Anandtech에 올라왔습니다.


AMD 도 싱글 스레드의 성능향상 없이는 더 이상 앞으로 나갈 수 없음을 절실하게 느꼈고 이를 스팀롤러에 반영했다고 하네요. 전기 먹어도 먹는 만큼 성능만 잘 나와주면 참 좋겠습니다.

 

스팀롤러는 AMD2000년대 중반에 공개하여 2011년말 출시된 불도저 아키텍처의 3세대에 해당하는 코어입니다. 2세대가 되는 최적화된 불도저 '파일드라이버''트리니티 APU'의 형태로 출시되며, 올해 말에는 통합 그래픽스가 없는 파일드라이버 기반의 하이엔드 데스크탑 CPU가 출시될 예정인데요.


스팀롤러는 기본적으로 불도저/파일드라이버 아키텍처와 같은 맥락으로 디자인된 보다 발전적인 코어입니다. 인텔은 이에 대해 (28nm 벌크는 32nm SOI에 가깝기 때문에) 커다란 공정의 변화가 없기 때문에 틱도 아니고, 아키텍처가 발전되었지만 대체로 변화가 없기 때문에 톡도 아니라고 언급했다고 합니다. 물론 인텔측 입장인것이고요.

불도저/파일드라이버 프론트 엔드의 가장 큰 이슈 중 하나는 페치와 디코더의 공유(Shared fetch and decode hardware)였습니다.

스팀롤러는 이것을 각 모듈에 디코더를 복사하는 것으로 다루며, 결국 각 코어는 자체적으로 4-wide 명령어 디코더를 내장하게 되었고 각 디코더는 (매번 다른 사이클에서 교대로 동작하기보다는) 병렬적으로 동작할 수 있게 되었습니다. 물론 그렇다고 성능이 드라마틱하게 놀랍게 향상되는 것은 아니지만, 이것은 스팀롤러의 모든 변화 중 가장 쉽게 성능을 크게 올려줄 것입니다.

단점은 분명해지는데요, 면적과 전력 소모가 늘어난다는 것입니다.

단가가 올라가는 소리가 들리시나요? 그만큼 치명적인 단점이죠

저가 정책을 펼수 밖에 없는 AMD가 내부적으로도 마진을 많이 남길수 없다는 말입니다.



다시 본론으로 들어가서 스팀롤러는 파일드라이버로부터 분기 예측기(Branch predictor)를 상속받았지만, 보다 높은 성능(대부분 서버 워크로드에서)을 위해 개선된 형태를 띕니다. 분기 목표 버퍼 또한 커졌으며 분기 예측 실패를 최대 20% 낮출 수 있을 것이라고 자신합니다.

정수 실행 유닛 자체는 변화가 없지만 다른 부분의 향상을 통해 정수 성능이 개선되었습니다. 비록 AMD가 명시하지는 않았지만 정수와 부동 소수점 레지스터 파일은 스팀롤러에서 커졌으며, 로드 오퍼레이션(2 피연산함수, operands) 또한 간결해져서 물리적 레지스터 파일에서 단지 한개의 엔트리를 차지하게 됩니다. 이것은 각 RF의 효율적인 크기를 증가하는데 도움을 줄 것입니다. 스케줄링 윈도 또한 사이즈가 커져 기존 Execution Resources의 이용을 크게 늘려줄 것입니다.

스팀롤러에서는 공유하는 L1 명령 캐시의 크기가 커졌습니다. 불도저는 각 코어가 1-way를 사용하는 2-way 64KB L1 명령 캐시를 가졌습니다. 따라서 불도저는 코어당 캐시의 크기가 기존 디자인보다 줄어들었고, 이것을 늘리는 것은 일리가 있는 것입니다. AMD는 커진 L1이 명령어-캐시의 놓침(Miss)30%가량 줄일 수 있다고 주장했습니다. L1-L2간의 인터페이스도 또한 개선되었습니다. 스팀롤러에서 L2/L3 캐시 레이튼시의 큰 감소는 없습니다.


AMDHigh Density Cell Library가 사용된 새로운 자동화 프로시져(절차)를 통해 30%의 면적 감소와 AMD의 내부 분석에 기반하면 동작(Operation)15~30%의 에너지 절감을 가져올 것이라고 밝혔습니다.

 

Anandtech에서는 '스팀롤러'에 대해 AMD의 불도저/파일드라이버 아키텍처가 잘 발전된 것으로 보이며, 2세대인 파일드라이버가 성능보다는 전력 효율에 집중했다면, 스팀롤러는 성능에서 큰 임팩트를 줄 것으로 보인다고 언급했습니다.

스팀롤러는 여전히 2013년 글로벌파운드리즈(GF)28nm 벌크 공정을 사용할 예정이며, 언급된 개선들은 좋아보이지만 스팀롤러가 Haswell에 대응해서 충분한 제품이 될 수 있을지는 의문이며,

 이제는 실 제품 출시후 벤치를 보기 전까지는 믿음이 안가는군요...

불도저 출시 전에는 제품들 내놓을때마다 관심을 가지고 기다리곤 했는데..

이번 불도저는 그동안의 AMD에 대한 모든 믿음을 한번에 밀어버릴 정도로 쇼크였던지라