Selasa, 14 Juni 2011

Memahami Intel Core I7

Core I7 menandai diperkenalkannya Nahal, berdasarkan arsitektur dengan banyak perubahan pada prosesor Penryn dan atas, termasuk yang terintegrasi memory controller dan sudah lama ditunggu-tunggu migrasi FSB ke serial bus, point-to-point, dua perbaikan yang telah tahun sebelumnya telah diperkenalkan oleh AMD , yang Intel telah menolak sampai saat itu.
Sedangkan prosesor Core I7 masih ceruk, maka arsitektur baru memberikan dasar untuk prosesor Intel selama bertahun-tahun, sehingga sangat penting untuk mempelajari sedikit tentang hal itu.


Dimulai dengan konteks sejarah sedikit, pada awal tahun 2006, Intel berada dalam situasi yang rumit. ThePentium D, berdasarkan arsitektur NetBurst efisien hilang ke Athlon X2 dalam hal kinerja dan dalam hal efisiensi, pemborosan energi dan menghasilkan sangat sedikit.
Pada saat itu, AMD prosesor yang lebih tinggi di kedua desktop dan di server dan Intel kehilangan tanah cepat di kedua front. Ketika semuanya tampak hilang, Intel membuat arsitektur Core, yang menyebabkan Core 2 Duo prosesor dan yang lain dari baris saat ini. Untuk menghindari kesalahan yang sama dibuat dengan platform NetBurst, Intel telah banyak berinvestasi dalam penelitian dan pengembangan, untuk mengembangkan arsitektur baru di tahun paralel dan investasi besar dalam mengembangkan teknik baru pembuatan dan modernisasi pabriknya.
Departemen pemasaran, bergegas untuk menciptakan sebuah istilah yang melambangkan sebuah fase baru, "tick-točka" sekarang sedang digunakan secara ekstensif dalam bahan iklan dari Intel. Idenya sederhana: untuk menyajikan arsitektur baru dan teknik manufaktur baru dalam beberapa tahun alternatif, dimana "centang" adalah peluncuran arsitektur baru (seperti Penryn dan Nehal) sementara "točka" adalah peluncuran sebuah teknik baru untuk manufaktur (45 nanometer atau 32 nanometer, misalnya), menutup siklus.
Rencananya adalah untuk menjaga publik tertarik, mengumumkan baru arsitektur , atau migrasi ke proses manufaktur baru sekali setiap tahun dan mempertahankan laju evolusi, bahwa AMD memiliki kesulitan untuk mengikuti.
Dalam ide, migrasi ke teknik 0065 mikron pada tahun 2005 adalah "centang", peluncuran platform Core di tahun 2006 adalah "točka" dan peluncuran Penryn pada tahun 2007, berdasarkan pada arsitektur baru 0045 mikron "baru" tik, yang diikuti dengan pengumuman Nahal (diucapkan "nerreilem"), yang mewakili sebuah arsitektur baru, masih diproduksi dengan menggunakan teknologi 45 nanometer, tapi dengan perubahan beberapa arsitektur di Penryn.
Seperti semua prosesor lainnya dari Intel, " Nehal "hanya nama-kode architecture.To secara efektif mencapai rak, ia memperoleh nama Intel Core I7 .
Tidak seperti Yorkfield, yang digunakan dalam Core 2 Quad prosesor seri Q9000 dari (yang diperoleh dengan menggabungkan dua prosesor dual-core, dihubungkan melalui FSB), yang Nehal adalah prosesor quad-core asli, dimana 4 core berbagi chip silikon yang sama:

Yang 4 core terdiri dari tidak kurang dari 731 juta transistor, bahwa bahkan dengan teknologi produksi 45 nanometer, menempati area seluas 263 mm ². Untuk mendapatkan sebuah ide, itu lebih dari 10 kali ukuran dari sebuah, Atom 230 yang hanya 25,9 mm ².
Untuk mengakomodasi 4 core, Intel telah membuat beberapa perubahan dalam arsitektur cache. Alih-alih cache L2 besar bersama, Intel memilih untuk menggunakan arsitektur yang serupa dengan yang digunakan oleh AMD Phenom, dengan cache L2 kecil (256-KB) untuk setiap core dan dermawan 8MB cache L3 antara semua core. Dalam arsitektur, cache L3 mengambil posisi bahwa Core 2 Duo dieksekusi oleh L2 cache, melayani sebagai reservoir data umum.
Perbedaan besar antara cache dan Phenom Nahal terletak pada bagaimana data disimpan dalam cache. AMD digunakan dalam cache "eksklusif", di mana menyimpan data cache dari data cache L1 dan L3 toko berbeda dengan L2, memaksimalkan ruang penyimpanan L2. Intel, di sisi lain, menggunakan "inklusif" di mana menyimpan salinan L1 dan L2 cache data juga disimpan dalam cache L3.
Sementara mengurangi total volume data yang dapat disimpan dalam cache, sistem dari Intel memberikan keuntungan kecil di kinerja, karena prosesor tidak perlu untuk memeriksa data di masing-masing cache independen.
Alasan lain untuk menggunakan penempatan cache inklusif adalah rendah baru-daya (C3 dan C6) yang terjadi oleh prosesor, di mana beberapa (atau semua inti) benar-benar off, mengurangi konsumsi dari tingkat rendah, tetapi pada gilirannya menyebabkan hilangnya data yang tersimpan dalam cache L1 dan L2. Sebagai cache L3 adalah independen dari 4 core, itu tetap aktif, yang memungkinkan pengisian inti dari cache L3 setuju, tapi prosesor perlu melakukan operasi untuk memeriksa, Anda tidak perlu mendapatkan data kembali ke RAM.
Ini adalah tempat investasi Intel dalam teknik-teknik produksi baru dibayar, karena dengan transistor yang lebih kecil, mereka mampu untuk memproduksi lebih banyak prosesor dan cache lebih, mengimbangi hilangnya ruang yang disebabkan oleh penggunaan sistem dengan volume yang lebih besar yang unik cache.
L1 cache masih dibagi menjadi dua blok ( 32 KB untuk data dan 32 KB untuk instruksi), serta dalam semua kasus-kasus sebelumnya, tapi ada peningkatan latency akses, yang meningkat dari 3 sampai 4 siklus pada Penryn. Hilangnya kinerja diimbangi dengan pengurangan latency L2 cache, yang jatuh jauh, 15-11 siklus.
Ini pengurangan waktu akses adalah salah satu pembenaran Intel untuk penggunaan cache L2 sebagai kecil. Dengan hanya 11 siklus untuk mengakses, ia bekerja lebih seperti tingkat cache "satu setengah," yang berfungsi sebagai perantara antara cache L1 dan blok besar cache L3.
Cache L3 bekerja dengan latency 39 siklus, yang mungkin tampak cukup dibandingkan dengan latency dari L1 cache dan L2, tetapi sedikit lebih cepat dari L3 cache yang digunakan dalam Phenom, yang selain lebih kecil, bekerja dengan latency sebuah dari 43 siklus.
Perubahan lain dramatis adalah dimasukkannya sebuah memory controller terintegrasi , dan kami telah AMD. Memory controller terintegrasi, secara substansial mengurangi waktu latency dalam memori, menghasilkan keuntungan yang besar dalam kinerja. Alasan utama Athlon X2 tetap kompetitif dengan Core 2 Duo, meskipun telah cache jauh lebih persis karena fakta menggunakan driver khusus, sementara pekerjaan Core 2 Duo tergantung pada chipset.
Yang luas, kita dapat mengatakan bahwa Athlon X2 perlu mengakses memori lebih sering (karena cache yang lebih kecil) tetapi dalam kembali kehilangan waktu kurang karena setiap akses ke memori controller terintegrasi. Intel meskipun menolak, tapi akhirnya harus menjual ide.
Alih-alih menggunakan saluran-controller tunggal, atau dual-channel, Intel memilih untuk menggunakan controller triple-channel, dengan dukungan untuk memori DDR3, operasi sampai 1:33 GT / s. Ini berarti total bandwidth hingga 32 GB / s (bila menggunakan 3 modul). Untuk mendapatkan ide, yaitu 40 kali lebih banyak dari kami 10 tahun yang lalu, ketika modul memori dapat digunakan SDR PC-100 dengan Pentium III.
Tiga saluran beroperasi secara independen, sehingga prosesor untuk memulai membaca baru pada salah satu modul sementara masih mengharapkan angka untuk membaca sebelum, di module.This lain membantu mengurangi waktu latency dari memori akses, yang secara proporsional jauh lebih tinggi dalam modul DDR3.
Tentu saja, untuk mendapatkan manfaat terbaik dari saluran-triple, Anda harus menggunakan modul dalam trio. Dengan menggunakan modul tunggal, salah satu saluran akan diaktifkan dan, menggunakan empat, pangsa modul terakhir saluran yang sama dengan yang pertama.

Masalah dengan controller terintegrasi adalah bahwa hal itu secara substansial meningkatkan jumlah kontak dari prosesor, yang benar-benar istirahat kompatibilitas dengan pelat Socket 775 hari ini. Versi saluran-triple Nehal menggunakan soket LGA dengan tidak kurang dari 1366 kontak. Format ini juga berubah prosesor, untuk empat persegi panjang, seperti pada Pentium Pro:

Perubahan perusahaan prosesor, meluncurkan chipset baru, X58 , yang setara dengan ICH10, yang berkonsentrasi pada interface I / O:


Karena memory controller dipindahkan ke prosesor, chipset X58 adalah relatif sederhana, pada dasarnya berfungsi sebagai antarmuka antara prosesor QPI bus, peripheral PCI Express dan chip ICH10 (diakses melalui bus DMI), yang berkonsentrasi antarmuka lainnya . Transistor untuk lini PCI Express menempati sebagian besar chip mati dan itulah sebabnya dia masih menempati area yang relatif besar.
kebaruan lain adalah bahwa X58 yang disertifikasi oleh nVidia untuk penggunaan SLI (yaitu, yang pertama di mana Intel setuju untuk membayar lisensi), yang memungkinkan pengembangan plak yang kompatibel dengan kedua SLI dan CrossFireX dengan. Seperti kita berbicara tentang pasar high-end atas sini, di mana ia dibayar $ 999 oleh prosesor dan $ 400 untuk motherboard, dukungan SLI telah menjadi sumber penting.
Poin utamanya adalah bahwa saluran-triple tersedia dalam prosesor, keluarga I7 yang ditujukan untuk server dan workstation untuk kinerja tinggi. The i5 prosesor untuk desktop (berdasarkan core Lynnfield) hanya memiliki dua saluran diaktifkan, perubahan yang tercermin dalam soket, yang memiliki sejumlah kecil kontak.

0 komentar:

Posting Komentar

Share

Twitter Delicious Facebook Digg Stumbleupon Favorites