Subscribe: feed hugetuget

Senin, 13 Agustus 2012

Mengenal Teknologi Arsitektur Prosesor AMD Buldozer

Bulldozer (mikroarsitektur)
Bulldozer adalah Arsitektur prosesor terbaru dari Advanced Micro Devices (AMD) Accelerated Processing Unit (APU) nama kode untuk prosesor server dan desktop dirilis pada tanggal 12 Oktober 2011 dengan mikroarsitektur keluarga 15h , penerus keluarga 10h (K10) mikroarsitektur M-SPACE metodologi desain.

Bulldozer dirancang dari awal, bukan pengembangan prosesor sebelumnya. Inti prosesor ini secara khusus ditujukan pada TPD 10-125 watt. AMD mengklaim peningkatan efisiensi dramatis performa per watt dalam komputasi kinerja tinggi aplikasi (HPC) dengan menggunakan core Bulldozer.

Inti Bulldozer mendukung sebagian besar instruksi set dilaksanakan oleh Intel prosesor tersedia di diperkenalkan (termasuk SSE4.1 , SSE4.2 , AES , CLMUL , dan AVX ) serta instruksi masa depan menetapkan diusulkan oleh AMD ( XOP dan FMA4 ).

Deskripsi Dasar
Menurut AMD, Bulldozer berbasis CPU didasarkan pada GlobalFoundries nm 32 ' Silicon pada insulator (SOI) teknologi proses dan menggunakan kembali pendekatan Desember untuk kinerja komputer multitasking dengan argumen, menurut tekan catatan, "menyeimbangkan sumber daya komputer berdedikasi dan berbagi untuk memberikan, inti hitungan desain yang sangat kompak tinggi yang mudah direplikasi pada chip untuk skala kinerja ". Dengan kata lain, dengan menghilangkan beberapa "berlebihan" unsur-unsur yang secara alami menyusup ke multicore desain, AMD berharap untuk mengambil lebih baik keuntungan dari kemampuan perangkat keras, saat menggunakan daya yang lebih kecil.

Bulldozer implementasi berbasis dibangun di 32nm SOI dengan HKMG tiba pada Oktober 2011 untuk kedua server dan desktop. Segmen server termasuk chip ganda 16-benang Opteron Interlagos nama kode (untuk Socket G34 ) dan chip tunggal benang 4-8 Valencia (untuk Socket C32 ), sedangkan 4-8 thread Zambezi ditargetkan pada desktop Socket AM3 + .

Bulldozer merupakan desain ulang pertama dari arsitektur prosesor AMD sejak 2003, ketika perusahaan meluncurkan K8 prosesornya, dan juga memiliki dua 128-bit FMA -mampu FPUs yang dapat digabungkan menjadi satu 256-bit FPU. Desain ini disertai dengan dua kelompok integer, masing-masing dengan 4 pipa (tahap fetch / decode dibagi). Bulldozer juga akan memperkenalkan shared cache L2 dalam arsitektur baru. Layanan pemasaran AMD menyebutnya desain "Modul". Sebuah desain prosesor 16-thread yang akan menampilkan delapan dari "modul", namun sistem operasi akan mengenali satu "modul" sebagai dua core logis.

"modul", yang digambarkan sebagai dua core, dapat dibandingkan dengan inti tunggal dengan Intel HyperThreading . Satu-satunya perbedaan antara kedua pendekatan adalah Bulldozer yang menyediakan penjadwal berdedikasi dan unit integer untuk setiap thread, sedangkan pada inti Intel semua thread harus bersaing untuk sumber daya eksekusi yang tersedia.

Blok diagram dari dual Core-cluster Bulldozer lengkap Integer (Modul)


Cara Kerja AMD Buldozer

Bulldozer terdiri dari delapan core dengan clock sebesar 3,6 GHz dan 1,2 miliar transistor. Prosesor baru AMD FX 8150 ini menawarkan spesifikasi yang mengesankan. Intel Sandy-Bridge-Core i7-2600 saja hanya bekerja dengan 1 miliar transistor, demikian juga dengan AMD Phenom II. Pendahulunya hanya menawarkan 900 juta transistor. Untuk kelas server, tidak ada yang mampu bersaing dengan kekuatan prosesor ini. Namun, hasil benchmark pada kelas Desktop tidak begitu spektakuler. Alasannya, arsitektur prosesor Bulldozer baru pertama kalinya diaplikasikan.

Arsitektur Bulldozer berbasis pada core yang lebih cepat, banyak, namun spesifikasinya lebih kecil. Core prosesor saling berbagi resources sehingga tidak ada lagi core individu. Sebaliknya, dua core digabung menjadi satu modul untuk melakukan operasi-operasi integer. Keduanya juga saling berbagi Floating Point Unit (FPU), sama seperti Intel Multithreading. Namun, di sini resources dari satu physical core digunakan secara bersama-sama oleh dua logical threads. Dengan Bulldozer, AMD menghadirkan perbedaan antara prosesor 8 core yang sebenarnya dan Intel Multithreading.

Resources Sharing dalam satu modul


CPU modern memiliki floating unit sendiri pada setiap core performa floating point pada Bulldozer memang lebih kecil karena dua core dalam satu modul harus berbagi FPU. Untuk operasi 128 Bit, FPU menyediakan 4 ALU. Sementara, pada Phenom II (walaupun hanya dengan 3 ALU), basisnya per core. Jika dua core Bulldozer menggunakan FPU, kondisi paling buruk adalah hanya tersedia dua ALU untuk setiap thread.

Dua ALU langsung memproses instruksi MMX dan SSE. Selanjutnya, operasi AVX 256-Bit dikirim ke dua ALU 128 Bit lainnya untuk diproses. Prosesor Intel dapat memproses dua operasi AVX dalam satu cycle, sedangkan Bulldozer hanya satu operasi. Walaupun begitu, prosesor AMD adalah CPU pertama yang mendukung FMA-Instruction dengan 4 operasi. Operasi addition dan multiaplikasi dilakukan dalam satu cycle. Kemampuan ini sangat menguntungkan bagi apalikasi multimedia. Sementara Intel baru akan menginterasikan FMA mulai 2013.

Selain FPU, dua core tersebut juga berbagi satu Front End yang menerima instruksi x86 dan mempersiapkan proses selanjutnya dalam core. Proses ini lalu diselesaikan oleh empat Decoder. Phenom II memiliki tiga decoder, namun hanya satu core yang dipersiapkan. Dalam Integer-Core, Bulldozer masih melakukan reduksi. Di sini, hanya tersediadua ALU (Arithmetic Logic Units) untuk operasi integer, sedangkan Phenom-II-Core menyediakan 3 ALU. Artinya, seluruh chip Bulldozer dengan 8 core hanya mampu melakukan 16 operasi integer per cycle, sedangkan Phenom II dapat melakukan 18 operasi integer dengan 6 core. Hanya saja, sebuah modul Bulldozer dengan 2 core masih memiliki kelebihan. Front-End dan FPU yang saling berbagi membuat konsumsi daya menjadi lebih hemat. Energi yang hemat ini dapat dioptimalkan untuk kecepatan. Dalam Turbo mode, clock rate FC dapat dinaikkan menjadi 3,9 GHz.

Selain clock yang lebih tinggi, Bulldozer juga bekerja dengan 20-stage pipeline yang lebih panjang dibandingkan dengan Phenom II (hanya 12 stage). Dengan begitu, Bulldozer dapat menyelesaikan 20 subtask per clock kalau berhasil memenuhi pipeline. Untuk tujuan tersebut, Bulldozer memiliki dua stage Branch Target Buffer yang besar. Gunanya, mempersiapkan possible jump point untuk kode yang akan dikerjakan sebelum kode tersebut diproses. Arsitektur baru ini memerlukan sebuah adaptasi pada sistem operasi. Windows 7 dapat mendistribusikan threads secara seimbang ke berbagai physical core sehingga multithreading efektif pada sistem Intel. Pada Bulldozer, muncul sebuah kendala karena berarti threads dari proses yang sama tidak berjalan pada satu modul. Keuntungannya, kedua core dapat mengakses data yang sama dalam L2-Chace dan tidak harus melalui L3-Chace yang lambat. Adaptasi baru akan dilakukan pada Windows 8. Walau begitu, versi Desktop tidak lebih cepat dari varian Sandy-Bridge dalam kisaran harga yang sama karena performa floating point yang kecil. Pada server, kondisinya berbeda. Berkat arsitektur Bulldozer, prosesor Interlagos yang diluncurkan AMD dengan 16 core bekerja lebih baik dari prosesor Xeon terbaru. Di sini, paralelisasi operasi Integer secara masif berperan besar dan dalam area ini Bulldozer belum terkalahkan.



Related Post:

0 komentar:

Posting Komentar