Nehalem ซีพียูรหัสร้อน ขุมพลังใหม่จากอินเทล

หลังจากเพลี่ยงพล้ำเสียท่าให้กับเอเอ็มดีมานานพอสมควร ในที่สุดซีพียูสถาปัตยกรรม MicroArchitecture รุ่นใหม่อย่าง Core 2 Duo ก็ช่วยพาให้อินเทลทะยานขึ้นสู่ตำแหน่งผู้นำได้อย่างสวยงามอีกครั้ง และยังไม่ทันที่เอเอ็มดีจะได้โต้ตอบอะไร อินเทลก็ยังเฉาะซ้ำด้วย Core 2 Quad อีกระลอก หนำซ้ำอินเทลยังได้ประกาศสงครามด้วยซีพียูรุ่นใหม่ที่พร้อมวางจำหน่ายอย่าง Penryn เรียกได้ว่าแทบจะกลบเอเอ็มดีไม่ให้โผล่ขึ้นมาหายใจได้อีกเลย!!

ขณะที่ผมกำลังเขียนบทความนี้ เอเอ็มดีเพิ่งจะได้วางจำหน่าย “Phenom X4” ที่ติดโรคเลื่อนซ้ำแล้วซ้ำเล่า (ซึ่งให้ผลการทดสอบที่ค่อนข้างน่าผิดหวังเมื่อเทียบกับซีพียู 4 คอร์อย่าง Core 2 Quad จากอินเทล) จะมีก็แต่เพียงแผนงานในอนาคตของเอเอ็มดีที่ดูแล้วให้ความรู้สึกน่าทึ่งอย่าง “Fusion” ที่ได้นำหน่วยประมวลผลกราฟิกเข้าไปไว้รวมกันกับซีพียู อย่างไรก็ตามสำหรับอินเทลเองก็ได้มีการเปิดเผยสเปกออกมาบ้างแล้ว ซึ่งก็มีจุดที่น่าสนใจไม่ได้น้อยหน้าไปกว่า Fusion ของเอเอ็มดีเลย ในบทความนี้เราจะมาทำความรู้จักกับซีพียูในสถาปัตยกรรม “Nehalem” จากอินเทลกันพอสังเขป
ประวัติ : ต้นกำเนิดของ Core MicroArchitecture จากอินเทล
Architecture (สถาปัตยกรรม) คือคำที่มีความหมายถึงรูปแบบโครงสร้างของซีพียู ซึ่งจะเกี่ยวข้องกับรูปแบบของไปป์ไลน์ กระบวนการผลิต ขนาดของหน่วยความจำแคช รวมทั้งสัญญาณนาฬิกา โดยสิ่งที่อินเทลได้พัฒนามาอย่างต่อเนื่องก็คือการเพิ่มไปป์ไลน์เสตจให้มากที่สุดเพื่อเน้นการเพิ่มสัญญาณนาฬิกา แต่ปัญหาที่ตามมาก็คือ “อินเทลไม่สามารถลดกระบวนการผลิตได้ทันตามไปป์ไลน์เสตจที่เพิ่มขึ้น” ผลลัพธ์ที่ตามาทำให้ซีพียูที่ทำงานด้วยความเร็วสูงๆ ก็จะมีความร้อนสูงขึ้นตามไปด้วย รูปแบบการพัฒนานี้ดำเนินมาตั้งแต่ซีพียูยุคเพนเทียมจนถึงเพนเทียมโฟร์ (รหัส Prescott) ซึ่งมีไปป์ไลน์เสตจถึง 31 หน่วยเลยทีเดียว

สถาปัตยกรรมยอดเยี่ยมที่ทำให้อินเทลขึ้นแท่นผู้นำ

ความเป็นมาของสถาปัตยกรรม Core
ช่วงเวลานั้นด้วยข้อจำกัดทางด้านเทคโนโลยีทำให้อินเทลไม่สามารถเพิ่มสัญญาณนาฬิกาได้มากกว่า 4GHz นั่นจึงเป็นที่มาของ “Core MicroArchitecture” ในซีพียูรหัส Conroe จากอินเทล ซึ่งได้ลดไปป์ไลน์เสตจลงมาเหลือ 14 หน่วย แต่ด้วยความที่เป็นซีพียูแบบ Dual Core ผนวกกับการพัฒนาโครงสร้างด้านอื่นเข้าไปอย่างเต็มที่ จึงทำให้ Conroe มีประสิทธิภาพมากกว่าซีพียูในรุ่นเดิม รวมทั้งซีพียูของคู่แข่งในขณะนั้นอย่าง Athlon 64 X2 อย่างไม่เห็นฝุ่นเลยทีเดียว (นี่ยังไม่นับความสามารถในเรื่องโอเวอร์คล็อกที่ยอดเยี่ยมเลยด้วยซ้ำ)
Penryn : สิ่งที่เห็นในปัจจุบัน
เพื่อให้เห็นภาพได้ชัดเจนยิ่งขึ้น ก่อนจะไปพูดถึงอนาคต เราคงต้องย้อนรอยมามองปัจจุบันกันสักนิด เนื่องจากซีพียูรหัส Penryn (โค้ดเนม Yorkfield) นั้น ถ้าจะเรียกว่าเป็นต้นกำเนิดของ Nehalem เลยก็ไม่ผิดนัก เพราะมีส่วนที่เหมือนกันหลายอย่างหลายประการด้วยกัน โดยที่ Core MicroArchitecture ทั้ง Penryn และ Nehalem ล้วนแล้วแต่ได้รับการพัฒนาเพิ่มเติมมาจาก Conroe อยู่หลายจุดด้วยกัน เช่น
* การเปลี่ยนเทคโนโลยีทรานซิสเตอร์มาใช้ MetalGate ร่วมกับเทคโนโลยีการผลิตแบบใหม่ระดับ 45nm ซึ่งจากเดิมจะใช้ Polysilicon รวมทั้งเปลี่ยนวัสดุภายใน Dielectrics Gate จาก Silicon Dioxied มาเป็น High-k จากการเปลี่ยนแปลงขนานใหญ่ดังกล่าวจะทำให้อินเทลสามารถผลิตซีพียูที่มีอัตราการใช้พลังงานลดลง ความร้อนน้อยลง ทั้งยังเหลือพื้นที่ให้บรรจุทรานซิสเตอร์ลงไปได้อีก ส่งผลให้สามารถพัฒนาประสิทธิภาพของซีพียูขึ้นไปได้อีกมากทีเดียว

อุ่นเครื่องให้พร้อมก่อนพบกับ Nehalem

วัสดุตัวเก่งที่ช่วยลดอัตราการใช้พลังงานของซีพียูได้อย่างน่าทึ่ง

ด้วยจำนวน Die ที่เล็กลงต่อหนึ่งเวเฟอร์ ช่วยลดต้นทุนการผลิตได้อีกมาก
* ปรับปรุงการทำงานของเทคโนโลยีภายในของ Core MicroArchitecture ทั้ง Intel? Wide Dynamic Execution (การคำนวณเลขฐาน), Intel? Intelligent Power Capability (อัตราส่วนประสิทธิภาพต่อวัตต์ที่สูงกว่าเดิม), Intel? Advanced Smart Cache (เพิ่มขนาดของ L2 Cache ให้ใหญ่ขึ้น), Intel? Smart Memory Access (เพิ่มช่องทางการทำ Cache) และ Intel? Advanced Digital Media Boost (เพิ่มชุดคำสั่ง SSE4)

การปรับปรุงคุณสมบัติของสถาปัตยกรรม Core ให้ดียิ่งขึ้น
* ซีพียู Quad Core บน Penryn จะเป็น Native Quad Core (สี่หัวแบบแท้ๆ) ซึ่งหน่วยประมวลผลทั้งสี่สามารถสื่อสารกันได้โดยตรง และทำงานแบบแยกเป็นอิสระต่อกันโดยที่ไม่ต้องสื่อสารผ่าน FSB (Front Side Bus) เหมือนกับ Kentsfield อีกต่อไป

Penryn จะเป็นซีพียูสี่หัวแท้ๆ ตัวแรกจากอินเทล
Nehalem : Core MicroArchitecture รุ่นถัดไป
ซีพียู Nehalem หรือที่คาดกันว่าจะมีโค้ดเนมเป็น “Bloomfield” ซึ่งมีแผนวางตลาดในไตรมาสที่ 4 ของปี 2008 นั้นจะมีรูปแบบการพัฒนาสถาปัตยกรรมภายในส่วนใหญ่เหมือนกันกับ Conroe และ Penryn แต่จะได้รับการปรับปุรงเพิ่มเติมดังต่อไปนี้

Nehalem ยังคงใช้กระบวนการผลิต 45nm เช่นเดียวกับ Penryn

ในที่สุดอินเทลก็จับเอา Memory Controller มาใส่ไว้ในซีพียูของตนเสียที

ด้วย Core MicroArchitecture รุ่นใหม่นี้จะทำให้ Nehalem เร็วกว่า Conroe ถึงสามเท่าเลยทีเดียว
HyperTherading เวอร์ชันใหม่
ผู้อ่านบางท่านอาจสงสัยว่าทำไมต้องมีการเพิ่มไปป์ไลน์เสตจขึ้นมาอีก ในเมื่อ CoreArchitecture นั้นจะเน้นในเรื่องของความสามารถในการประมวลผลแบบ Multi CPU ซึ่งให้ความสำคัญกับการประหยัดพลังงานไม่น้อยไปกว่าเรื่องของประสิทธิภาพ คำตอบในเรื่องนี้ก็คือ อินเทลจะนำเทคโนโลยีอย่าง “HyperThreading” หรือเทคโนโลยีที่ทำให้ระบบปฏิบัติการมองเห็นซีพียูเป็นจำนวนสองเท่าต่อหนึ่งชิป (ที่เคยเห็นจากเพนเทียมโฟร์ Northwood และ Prescott) โดยอินเทลได้เพิ่มจำนวนไปป์ไลน์เสตจเข้าไปเพื่อให้ซีพียูแต่ละคอร์สามารถใช้เทคโนโลยีนี้ได้อย่างมีประสิทธิภาพ ซึ่งในขณะนี้ยังไม่ระบุจำนวนไปป์ไลน์เสตจที่แน่นอน แต่คาดว่าน่าจะมีจำนวนอย่างต่ำ 28 หน่วยต่อหนึ่งแกนประมวลผล

เทคโนโลยี HyperThreading กลับมาอีกครั้งใน Nehalem
บรรจุ Memory Controller ไว้ในซีพียู
จุดอ่อนของอินเทลเพียงข้อเดียวหากจะนำไปเทียบกับเอเอ็มดีในขณะนี้ก็คือ เรื่องของ Memory Bandwidth แม้เราจะนำซีพียูอย่าง Core 2 Extreme ไปเทียบกับ Athlon X2 บนซ็อกเก็ต 939 ที่ใช้กับหน่วยความจำแบบ DDR ธรรมดาก็ยังมีประสิทธิภาพตามหลัง นั่นเป็นเพราะเอเอ็มดีมี Memory Controller หรือส่วนที่ควบคุมหน่วยความจำอยู่บน Die เดียวกับซีพียู ซึ่งสามารถประสานการทำงานกับซีพียูด้วยค่าหน่วงเวลาที่ต่ำมากๆ ทำให้ซีพียูทำงานร่วมกับหน่วยความจำได้รวดเร็วขึ้น ในขณะที่ส่วนควบคุมหน่วยความจำของอินเทลที่ผ่านมานั้นจะไปอยู่ในชิป Northbridge ซึ่งจะทำงานได้ช้ากว่ามาก แต่ปัญหานี้ของอินเทลจะได้รับการแก้ไขใน Nehalem ซึ่งอินเทลอ้างว่า Memory Controller ของตนนั้นทำงานได้มีประสิทธิภาพกว่าเอเอ็มดี และยังใช้พลังงานน้อยกว่าอีกด้วย!
ปรับปรุง I/O ระหว่างซีพียูกับอุปกรณ์รอบข้างขนานใหญ่
สำหรับ Nehalem นั้นจะทำงานร่วมกับแรมความเร็วสูงอย่าง DDR3 ได้อย่างมีประสิทธิภาพสูงสุด เนื่องจากอินเทลได้ปรับปรุงช่องทางการส่งผ่านข้อมูลระหว่างหน่วยความจำกับซีพียูให้เร็วกว่าเดิม ซึ่งสามารถรับ-ส่งข้อมูลได้ถึงสามช่องทางด้วยกัน โดยอินเทลเรียกกระบวนการนี้ว่า Triple Channel ที่ช่วยลดปัญหาคอขวดของ I/O ได้ถึง 1.5 เท่า เมื่อเทียบกับ Dual Channel (หมายเหตุ : ในไดอะแกรมนั้น Nehalem ยังคงรองรับ Dual Channel ซึ่งอาจจัดเตรียมไว้สำหรับซีพียูในรุ่นประหยัด) ทั้งยังได้ปรับปรุง Interconnect Link Controller สำหรับการเชื่อมต่อระหว่างซีพียูกับอุปกรณ์รอบข้างให้มีความเร็วสูงถึง 6.4Bbps นอกจากนี้ Nehalem ยังมาพร้อมกับ L2 Cache (All die) จำนวน 4 x 0.5MB และ L3 Cache ขนาดใหญ่ถึง 8MB เลยทีเดียว

ปรับปรุงช่องทางการส่งผ่านข้อมูลครั้งใหญ่เพื่อลดปัญหาคอขวด
เร็วขึ้นอีกระดับด้วย L2 Cache ความเร็วสูงกับ L3 Cache 8MB ที่เพิ่มขึ้นมา
(อาจจะ) เพิ่มหน่วยประมวลผลกราฟิกไว้ในซีพียู
สำหรับในเรื่องหน่วยประมวลผลกราฟิกในซีพียูนั้นยังไม่มีความแน่ชัดเกี่ยวกับเรื่องนี้มากนัก ตามข่าวลือบนเว็บไซต์บางแห่งได้บอกไว้ว่า Nehalem จะมาพร้อมกับหน่วยประมวลผลกราฟิกในตัวเลย แต่ข้อมูลในบางแหล่งก็อ้างว่า Nehalem จะมีความยืดหยุ่นในการที่ผู้ใช้สามารถเลือกสเปกของซีพียูได้เอง ไม่ว่าจะในเรื่องของการเพิ่มแกนประมวลผล ช่องทางของ Memory Controller รวมทั้งหน่วยประมวลผลกราฟิกเข้าไปได้เอง แต่เท่าที่ดูจากไดอะแกรมปัจจุบันของอินเทลกลับพบว่าหน่วยประมวลผลกราฟิกยังต้องเชื่อมต่อผ่าน Northbridge ด้วยอินเทอร์เฟซ PCI-Express 2.0 อยู่เช่นเดิม ซึ่งก็อาจเป็นไปได้ว่าจะมี Nehalem สองเวอร์ชัน คือเวอร์ชันที่มีชิปกราฟิกในตัวและเวอร์ชันที่ต้องใส่กราฟิกการ์ดต่างหากสำหรับพาวเวอร์ยูสเซอร์ ซึ่งจะเป็นอย่างไรนั้นคงต้องติดตามกันต่อไป!
ซ็อกเก็ตใหม่ : ผู้ใช้เตรียมอัพเกรด
หลังจากผูกติดกับซ็อกเก็ต 775 มานานหลายปี ในที่สุดอินเทลก็ขยับไปใช้ซ็อกเกตแบบใหม่เสียที ในเบื้องต้นนั้นคาดว่าจะมี Nehalem ให้เห็นกันสองรุ่น คือ LGA1366 (ซ็อกเก็ต B) และ LGA715 (ซ็อกเก็ต H) โดยความแตกต่างนั้นยังไม่มีข้อสรุป อาจเป็นไปได้ว่า Nehalem รุ่น LGA1366 ที่มีหน้าสัมผัสจำนวนมากน่าจะมาจากคอนโทรลเลอร์ของหน่วยความจำที่เพิ่มขึ้นมา ในขณะที่ LGA715 ที่มีหน้าสัมผัสน้อยกว่าอาจจะไม่มีส่วนควบคุมหน่วยความจำ ซึ่งอาจเป็นที่มาของซีพียูสำหรับคนกระเป๋าเบาอย่าง Celeron ก็เป็นได้

สิ่งที่ยูสเซอร์จะได้รับ : ความเร็วที่เหลือเชื่อ
ก่อนอื่นเลยก็เรื่องของ Memory Controller ที่เพิ่มขึ้นมา ซึ่งจะทำให้ Nehalem กลายเป็นซีพียูรุ่นแรกที่เรียกได้ว่าแทบจะไร้จุดอ่อนแล้ว ผนวกกับเทคโนโลยี HyperThreading ที่จะทำให้ซีพียู 4 คอร์นั้นสามารถทำงานได้เสมือนว่าเป็นซีพียู 8 คอร์ได้เลยทีเดียว (ในกรณีที่มีแอพพลิเคชันที่เหมาะสมมารองรับ) แค่นี้ก็น่าจะทำให้ Nehalem มีประสิทธิภาพเหนือกว่า Conroe ในปัจจุบัน รวมทั้ง Penryn ที่จะวางจำหน่ายเร็วๆ นี้อยู่ไม่น้อยแล้ว มาดูกันครับว่าเราจะได้รับอะไรจาก Nehalem บ้างเมื่อมันออกวางตลาด!

ซีพียู 8 คอร์ (4 คอร์ HyperThreading) จะทำให้ดูทรงพลังเมื่อเปิด TaskManager
1. บรรดาเกมเมอร์จะได้รับผลประโยชน์ไปเต็มๆ เพราะนอกจากซีพียูจะสามารถประมวลผล AI และระบบฟิสิกส์ได้รวดเร็วขึ้นแล้ว ยังเป็นขุมพลังสำหรับขับเคลื่อนกราฟิกการ์ดในยุคถัดไปได้อย่างเพียงพอ
2.บรรดานักตัดต่อวิดีโอ รวมถึงกราฟิกดีไซน์ระดับมืออาชีพคงจะถูกใจไม่น้อย ซึ่งได้รับอานิสงส์มาจากไปป์ไลน์เสตจจำนวนมากผนวกกับชุดคำสั่ง SSE4 นั้นจะช่วยเรนเดอร์วิดีโอกราฟิกให้เร็วขึ้นอย่างไม่เคยเป็นมาก่อน
3.ด้วยจำนวนไปป์ไลน์เสตจที่เพิ่มขึ้นมา (จากการคาดการณ์ไว้ว่าน่าจะประมาณสองเท่าจาก Conroe และ Penryn) ก็จะทำให้อินเทลกลับมาเร่งสัญญาณนาฬิกาของซีพียูได้อีกครั้งหนึ่ง และคาดว่าจะทะลุกำแพง 5Ghz ได้ไม่ยากเย็นนัก (ว้าว !!!)
4.ด้วยกระบวนการผลิตแบบ 45nm จะช่วยเพิ่มขีดความสามารถในการโอเวอร์คล็อกให้สูงยิ่งขึ้นไปอีก ปัจจุบันซีพียูโค้ดเนม Penryn เองก็มีผู้โอเวอร์คล็อกไปแตะแถวๆ 6GHz กันแล้ว ถึงตอนที่ Nehalem ออกมาจริงๆ นั้น ผู้ใช้ทั่วไปอาจจะสามารถโอเวอร์คล็อกซีพียูรุ่นนี้ไปได้สูงกว่า 6GHz ได้สบายๆ (อู้ววววว…)

บทสรุป : เทคโนโลยีก้าวกระโดดครั้งยิ่งใหญ่>
หากจะกล่าวว่า Nehalem เป็นซีพียูในยุคปฏิวัติอีกครั้งหนึ่งของอินเทลก็คงจะไม่ผิดนัก (คงจำกันได้ในยุคที่อินเทลเปลี่ยนจาก 486 มาเป็นเพนเทียม หรือจากยุคเพนเทียมมาเป็นเพนเทียมทู) แม้ว่าสถาปัตยกรรมภายในส่วนใหญ่ยังคงพัฒนาต่อยอดมาจาก Conroe และ Penryn แต่ด้วยคุณสมบัติดีๆ ที่เพิ่มขึ้นมานั้นจะทำให้คุณได้พบกับ “สุดยอดซีพียูสำหรับเดสก์ทอปของโลก” ทันทีที่มีวางจำหน่ายเลยทีเดียว จากสถานการณ์ในช่วงหนึ่งปีกว่าที่ผ่านมานี้ ดูเหมือนว่าอินเทลจะเป็นผู้นำในตลาดซีพียูเดสก์ทอปแบบเด็ดขาด และเมื่อมองแผนงานที่เป็นรูปเป็นร่างในอนาคตก็อดสงสัยไม่ได้เหมือนกันว่า เอเอ็มดีจะกลับมาทวงบัลลังก์คืนได้เหมือนกับยุค Athlon 64 หรือไม่!!!

ถ้าถามว่าเราควรจะขยับไปใช้ Nehalem หรือไม่? คำตอบคงไม่ตายตัว จริงอยู่ที่ว่ามันอาจเป็นซีพียูที่เร็วจนยากจะจินตนาการได้ แต่หากมันได้วางตลาดจริงๆ แล้วล่ะก็ จะเกิดปรากฏการณ์ที่ทำให้ยูสเซอร์ต้องปรับตัวกันขนานใหญ่ ไม่ว่าจะเป็นการซื้อเมนบอร์ดรุ่นใหม่ หน่วยความจำแบบใหม่ (เนื่องจาก Nehalem จะขยับไปใช้ DDR3 อย่างเต็มตัว) และอาจจะเลยเถิดไปจนถึงการ์ดจออีกด้วย เรียกได้ว่าเปลี่ยนกันทีเดียวเกือบยกชุดเลย แต่ถ้าเป็นผู้ที่ซื้อคอมพิวเตอร์ใหม่ยกชุดก็ไม่ต้องคิดอะไรมากเลย เนื่องจากพอวันนั้น อุปกรณ์คอมพิวเตอร์ทั่วไปก็คงจะมีราคาไม่แพงนัก โดยเฉพาะเมื่อหน่วยความจำที่มีราคาสูงลิบลิ่วอย่าง DDR3 เข้าสู่ตลาดอย่างเต็มตัว ก็จะมีราคาแทบไม่แตกต่างจาก DDR2 ในปัจจุบัน
ความจริงแล้วซีพียูในแพลตฟอร์มปัจจุบันเองก็สามารถตอบสนองต่อการทำงานรวมทั้งการเล่นเกมได้ดีระดับหนึ่งแล้ว หากจะใช้ต่อไปก็ไม่น่าจะมีปัญหาใดๆ แต่ก็อย่างว่าล่ะครับ เมื่อมีของใหม่วางจำหน่าย สิ่งที่เรามีอยู่มันก็จะช้าลงโดยอัตโนมัติ เป็นอย่างนี้ทุกยุคทุกสมัยและตลอดไป เอาล่ะครับ ขอตัวไปปั่นบทความเก็บเงินซื้อ Nehalem ก่อน แล้วพบกันใหม่
ที่มา ARIP : Hardware Zone

หลังจากเพลี่ยงพล้ำเสียท่าให้กับเอเอ็มดีมานานพอสมควร ในที่สุดซีพียูสถาปัตยกรรม MicroArchitecture รุ่นใหม่อย่าง Core 2 Duo ก็ช่วยพาให้อินเทลทะยานขึ้นสู่ตำแหน่งผู้นำได้อย่างสวยงามอีกครั้ง และยังไม่ทันที่เอเอ็มดีจะได้โต้ตอบอะไร อินเทลก็ยังเฉาะซ้ำด้วย Core 2 Quad อีกระลอก หนำซ้ำอินเทลยังได้ประกาศสงครามด้วยซีพียูรุ่นใหม่ที่พร้อมวางจำหน่ายอย่าง Penryn เรียกได้ว่าแทบจะกลบเอเอ็มดีไม่ให้โผล่ขึ้นมาหายใจได้อีกเลย!!

ขณะที่ผมกำลังเขียนบทความนี้ เอเอ็มดีเพิ่งจะได้วางจำหน่าย “Phenom X4” ที่ติดโรคเลื่อนซ้ำแล้วซ้ำเล่า (ซึ่งให้ผลการทดสอบที่ค่อนข้างน่าผิดหวังเมื่อเทียบกับซีพียู 4 คอร์อย่าง Core 2 Quad จากอินเทล) จะมีก็แต่เพียงแผนงานในอนาคตของเอเอ็มดีที่ดูแล้วให้ความรู้สึกน่าทึ่งอย่าง “Fusion” ที่ได้นำหน่วยประมวลผลกราฟิกเข้าไปไว้รวมกันกับซีพียู อย่างไรก็ตามสำหรับอินเทลเองก็ได้มีการเปิดเผยสเปกออกมาบ้างแล้ว ซึ่งก็มีจุดที่น่าสนใจไม่ได้น้อยหน้าไปกว่า Fusion ของเอเอ็มดีเลย ในบทความนี้เราจะมาทำความรู้จักกับซีพียูในสถาปัตยกรรม “Nehalem” จากอินเทลกันพอสังเขป
ประวัติ : ต้นกำเนิดของ Core MicroArchitecture จากอินเทล
Architecture (สถาปัตยกรรม) คือคำที่มีความหมายถึงรูปแบบโครงสร้างของซีพียู ซึ่งจะเกี่ยวข้องกับรูปแบบของไปป์ไลน์ กระบวนการผลิต ขนาดของหน่วยความจำแคช รวมทั้งสัญญาณนาฬิกา โดยสิ่งที่อินเทลได้พัฒนามาอย่างต่อเนื่องก็คือการเพิ่มไปป์ไลน์เสตจให้มากที่สุดเพื่อเน้นการเพิ่มสัญญาณนาฬิกา แต่ปัญหาที่ตามมาก็คือ “อินเทลไม่สามารถลดกระบวนการผลิตได้ทันตามไปป์ไลน์เสตจที่เพิ่มขึ้น” ผลลัพธ์ที่ตามาทำให้ซีพียูที่ทำงานด้วยความเร็วสูงๆ ก็จะมีความร้อนสูงขึ้นตามไปด้วย รูปแบบการพัฒนานี้ดำเนินมาตั้งแต่ซีพียูยุคเพนเทียมจนถึงเพนเทียมโฟร์ (รหัส Prescott) ซึ่งมีไปป์ไลน์เสตจถึง 31 หน่วยเลยทีเดียว

สถาปัตยกรรมยอดเยี่ยมที่ทำให้อินเทลขึ้นแท่นผู้นำ

ความเป็นมาของสถาปัตยกรรม Core
ช่วงเวลานั้นด้วยข้อจำกัดทางด้านเทคโนโลยีทำให้อินเทลไม่สามารถเพิ่มสัญญาณนาฬิกาได้มากกว่า 4GHz นั่นจึงเป็นที่มาของ “Core MicroArchitecture” ในซีพียูรหัส Conroe จากอินเทล ซึ่งได้ลดไปป์ไลน์เสตจลงมาเหลือ 14 หน่วย แต่ด้วยความที่เป็นซีพียูแบบ Dual Core ผนวกกับการพัฒนาโครงสร้างด้านอื่นเข้าไปอย่างเต็มที่ จึงทำให้ Conroe มีประสิทธิภาพมากกว่าซีพียูในรุ่นเดิม รวมทั้งซีพียูของคู่แข่งในขณะนั้นอย่าง Athlon 64 X2 อย่างไม่เห็นฝุ่นเลยทีเดียว (นี่ยังไม่นับความสามารถในเรื่องโอเวอร์คล็อกที่ยอดเยี่ยมเลยด้วยซ้ำ)
Penryn : สิ่งที่เห็นในปัจจุบัน
เพื่อให้เห็นภาพได้ชัดเจนยิ่งขึ้น ก่อนจะไปพูดถึงอนาคต เราคงต้องย้อนรอยมามองปัจจุบันกันสักนิด เนื่องจากซีพียูรหัส Penryn (โค้ดเนม Yorkfield) นั้น ถ้าจะเรียกว่าเป็นต้นกำเนิดของ Nehalem เลยก็ไม่ผิดนัก เพราะมีส่วนที่เหมือนกันหลายอย่างหลายประการด้วยกัน โดยที่ Core MicroArchitecture ทั้ง Penryn และ Nehalem ล้วนแล้วแต่ได้รับการพัฒนาเพิ่มเติมมาจาก Conroe อยู่หลายจุดด้วยกัน เช่น
* การเปลี่ยนเทคโนโลยีทรานซิสเตอร์มาใช้ MetalGate ร่วมกับเทคโนโลยีการผลิตแบบใหม่ระดับ 45nm ซึ่งจากเดิมจะใช้ Polysilicon รวมทั้งเปลี่ยนวัสดุภายใน Dielectrics Gate จาก Silicon Dioxied มาเป็น High-k จากการเปลี่ยนแปลงขนานใหญ่ดังกล่าวจะทำให้อินเทลสามารถผลิตซีพียูที่มีอัตราการใช้พลังงานลดลง ความร้อนน้อยลง ทั้งยังเหลือพื้นที่ให้บรรจุทรานซิสเตอร์ลงไปได้อีก ส่งผลให้สามารถพัฒนาประสิทธิภาพของซีพียูขึ้นไปได้อีกมากทีเดียว

อุ่นเครื่องให้พร้อมก่อนพบกับ Nehalem

วัสดุตัวเก่งที่ช่วยลดอัตราการใช้พลังงานของซีพียูได้อย่างน่าทึ่ง

ด้วยจำนวน Die ที่เล็กลงต่อหนึ่งเวเฟอร์ ช่วยลดต้นทุนการผลิตได้อีกมาก
* ปรับปรุงการทำงานของเทคโนโลยีภายในของ Core MicroArchitecture ทั้ง Intel? Wide Dynamic Execution (การคำนวณเลขฐาน), Intel? Intelligent Power Capability (อัตราส่วนประสิทธิภาพต่อวัตต์ที่สูงกว่าเดิม), Intel? Advanced Smart Cache (เพิ่มขนาดของ L2 Cache ให้ใหญ่ขึ้น), Intel? Smart Memory Access (เพิ่มช่องทางการทำ Cache) และ Intel? Advanced Digital Media Boost (เพิ่มชุดคำสั่ง SSE4)

การปรับปรุงคุณสมบัติของสถาปัตยกรรม Core ให้ดียิ่งขึ้น
* ซีพียู Quad Core บน Penryn จะเป็น Native Quad Core (สี่หัวแบบแท้ๆ) ซึ่งหน่วยประมวลผลทั้งสี่สามารถสื่อสารกันได้โดยตรง และทำงานแบบแยกเป็นอิสระต่อกันโดยที่ไม่ต้องสื่อสารผ่าน FSB (Front Side Bus) เหมือนกับ Kentsfield อีกต่อไป

Penryn จะเป็นซีพียูสี่หัวแท้ๆ ตัวแรกจากอินเทล
Nehalem : Core MicroArchitecture รุ่นถัดไป
ซีพียู Nehalem หรือที่คาดกันว่าจะมีโค้ดเนมเป็น “Bloomfield” ซึ่งมีแผนวางตลาดในไตรมาสที่ 4 ของปี 2008 นั้นจะมีรูปแบบการพัฒนาสถาปัตยกรรมภายในส่วนใหญ่เหมือนกันกับ Conroe และ Penryn แต่จะได้รับการปรับปุรงเพิ่มเติมดังต่อไปนี้

Nehalem ยังคงใช้กระบวนการผลิต 45nm เช่นเดียวกับ Penryn

ในที่สุดอินเทลก็จับเอา Memory Controller มาใส่ไว้ในซีพียูของตนเสียที

ด้วย Core MicroArchitecture รุ่นใหม่นี้จะทำให้ Nehalem เร็วกว่า Conroe ถึงสามเท่าเลยทีเดียว
HyperTherading เวอร์ชันใหม่
ผู้อ่านบางท่านอาจสงสัยว่าทำไมต้องมีการเพิ่มไปป์ไลน์เสตจขึ้นมาอีก ในเมื่อ CoreArchitecture นั้นจะเน้นในเรื่องของความสามารถในการประมวลผลแบบ Multi CPU ซึ่งให้ความสำคัญกับการประหยัดพลังงานไม่น้อยไปกว่าเรื่องของประสิทธิภาพ คำตอบในเรื่องนี้ก็คือ อินเทลจะนำเทคโนโลยีอย่าง “HyperThreading” หรือเทคโนโลยีที่ทำให้ระบบปฏิบัติการมองเห็นซีพียูเป็นจำนวนสองเท่าต่อหนึ่งชิป (ที่เคยเห็นจากเพนเทียมโฟร์ Northwood และ Prescott) โดยอินเทลได้เพิ่มจำนวนไปป์ไลน์เสตจเข้าไปเพื่อให้ซีพียูแต่ละคอร์สามารถใช้เทคโนโลยีนี้ได้อย่างมีประสิทธิภาพ ซึ่งในขณะนี้ยังไม่ระบุจำนวนไปป์ไลน์เสตจที่แน่นอน แต่คาดว่าน่าจะมีจำนวนอย่างต่ำ 28 หน่วยต่อหนึ่งแกนประมวลผล

เทคโนโลยี HyperThreading กลับมาอีกครั้งใน Nehalem
บรรจุ Memory Controller ไว้ในซีพียู
จุดอ่อนของอินเทลเพียงข้อเดียวหากจะนำไปเทียบกับเอเอ็มดีในขณะนี้ก็คือ เรื่องของ Memory Bandwidth แม้เราจะนำซีพียูอย่าง Core 2 Extreme ไปเทียบกับ Athlon X2 บนซ็อกเก็ต 939 ที่ใช้กับหน่วยความจำแบบ DDR ธรรมดาก็ยังมีประสิทธิภาพตามหลัง นั่นเป็นเพราะเอเอ็มดีมี Memory Controller หรือส่วนที่ควบคุมหน่วยความจำอยู่บน Die เดียวกับซีพียู ซึ่งสามารถประสานการทำงานกับซีพียูด้วยค่าหน่วงเวลาที่ต่ำมากๆ ทำให้ซีพียูทำงานร่วมกับหน่วยความจำได้รวดเร็วขึ้น ในขณะที่ส่วนควบคุมหน่วยความจำของอินเทลที่ผ่านมานั้นจะไปอยู่ในชิป Northbridge ซึ่งจะทำงานได้ช้ากว่ามาก แต่ปัญหานี้ของอินเทลจะได้รับการแก้ไขใน Nehalem ซึ่งอินเทลอ้างว่า Memory Controller ของตนนั้นทำงานได้มีประสิทธิภาพกว่าเอเอ็มดี และยังใช้พลังงานน้อยกว่าอีกด้วย!
ปรับปรุง I/O ระหว่างซีพียูกับอุปกรณ์รอบข้างขนานใหญ่
สำหรับ Nehalem นั้นจะทำงานร่วมกับแรมความเร็วสูงอย่าง DDR3 ได้อย่างมีประสิทธิภาพสูงสุด เนื่องจากอินเทลได้ปรับปรุงช่องทางการส่งผ่านข้อมูลระหว่างหน่วยความจำกับซีพียูให้เร็วกว่าเดิม ซึ่งสามารถรับ-ส่งข้อมูลได้ถึงสามช่องทางด้วยกัน โดยอินเทลเรียกกระบวนการนี้ว่า Triple Channel ที่ช่วยลดปัญหาคอขวดของ I/O ได้ถึง 1.5 เท่า เมื่อเทียบกับ Dual Channel (หมายเหตุ : ในไดอะแกรมนั้น Nehalem ยังคงรองรับ Dual Channel ซึ่งอาจจัดเตรียมไว้สำหรับซีพียูในรุ่นประหยัด) ทั้งยังได้ปรับปรุง Interconnect Link Controller สำหรับการเชื่อมต่อระหว่างซีพียูกับอุปกรณ์รอบข้างให้มีความเร็วสูงถึง 6.4Bbps นอกจากนี้ Nehalem ยังมาพร้อมกับ L2 Cache (All die) จำนวน 4 x 0.5MB และ L3 Cache ขนาดใหญ่ถึง 8MB เลยทีเดียว

ปรับปรุงช่องทางการส่งผ่านข้อมูลครั้งใหญ่เพื่อลดปัญหาคอขวด
เร็วขึ้นอีกระดับด้วย L2 Cache ความเร็วสูงกับ L3 Cache 8MB ที่เพิ่มขึ้นมา
(อาจจะ) เพิ่มหน่วยประมวลผลกราฟิกไว้ในซีพียู
สำหรับในเรื่องหน่วยประมวลผลกราฟิกในซีพียูนั้นยังไม่มีความแน่ชัดเกี่ยวกับเรื่องนี้มากนัก ตามข่าวลือบนเว็บไซต์บางแห่งได้บอกไว้ว่า Nehalem จะมาพร้อมกับหน่วยประมวลผลกราฟิกในตัวเลย แต่ข้อมูลในบางแหล่งก็อ้างว่า Nehalem จะมีความยืดหยุ่นในการที่ผู้ใช้สามารถเลือกสเปกของซีพียูได้เอง ไม่ว่าจะในเรื่องของการเพิ่มแกนประมวลผล ช่องทางของ Memory Controller รวมทั้งหน่วยประมวลผลกราฟิกเข้าไปได้เอง แต่เท่าที่ดูจากไดอะแกรมปัจจุบันของอินเทลกลับพบว่าหน่วยประมวลผลกราฟิกยังต้องเชื่อมต่อผ่าน Northbridge ด้วยอินเทอร์เฟซ PCI-Express 2.0 อยู่เช่นเดิม ซึ่งก็อาจเป็นไปได้ว่าจะมี Nehalem สองเวอร์ชัน คือเวอร์ชันที่มีชิปกราฟิกในตัวและเวอร์ชันที่ต้องใส่กราฟิกการ์ดต่างหากสำหรับพาวเวอร์ยูสเซอร์ ซึ่งจะเป็นอย่างไรนั้นคงต้องติดตามกันต่อไป!
ซ็อกเก็ตใหม่ : ผู้ใช้เตรียมอัพเกรด
หลังจากผูกติดกับซ็อกเก็ต 775 มานานหลายปี ในที่สุดอินเทลก็ขยับไปใช้ซ็อกเกตแบบใหม่เสียที ในเบื้องต้นนั้นคาดว่าจะมี Nehalem ให้เห็นกันสองรุ่น คือ LGA1366 (ซ็อกเก็ต B) และ LGA715 (ซ็อกเก็ต H) โดยความแตกต่างนั้นยังไม่มีข้อสรุป อาจเป็นไปได้ว่า Nehalem รุ่น LGA1366 ที่มีหน้าสัมผัสจำนวนมากน่าจะมาจากคอนโทรลเลอร์ของหน่วยความจำที่เพิ่มขึ้นมา ในขณะที่ LGA715 ที่มีหน้าสัมผัสน้อยกว่าอาจจะไม่มีส่วนควบคุมหน่วยความจำ ซึ่งอาจเป็นที่มาของซีพียูสำหรับคนกระเป๋าเบาอย่าง Celeron ก็เป็นได้

สิ่งที่ยูสเซอร์จะได้รับ : ความเร็วที่เหลือเชื่อ
ก่อนอื่นเลยก็เรื่องของ Memory Controller ที่เพิ่มขึ้นมา ซึ่งจะทำให้ Nehalem กลายเป็นซีพียูรุ่นแรกที่เรียกได้ว่าแทบจะไร้จุดอ่อนแล้ว ผนวกกับเทคโนโลยี HyperThreading ที่จะทำให้ซีพียู 4 คอร์นั้นสามารถทำงานได้เสมือนว่าเป็นซีพียู 8 คอร์ได้เลยทีเดียว (ในกรณีที่มีแอพพลิเคชันที่เหมาะสมมารองรับ) แค่นี้ก็น่าจะทำให้ Nehalem มีประสิทธิภาพเหนือกว่า Conroe ในปัจจุบัน รวมทั้ง Penryn ที่จะวางจำหน่ายเร็วๆ นี้อยู่ไม่น้อยแล้ว มาดูกันครับว่าเราจะได้รับอะไรจาก Nehalem บ้างเมื่อมันออกวางตลาด!

ซีพียู 8 คอร์ (4 คอร์ HyperThreading) จะทำให้ดูทรงพลังเมื่อเปิด TaskManager
1. บรรดาเกมเมอร์จะได้รับผลประโยชน์ไปเต็มๆ เพราะนอกจากซีพียูจะสามารถประมวลผล AI และระบบฟิสิกส์ได้รวดเร็วขึ้นแล้ว ยังเป็นขุมพลังสำหรับขับเคลื่อนกราฟิกการ์ดในยุคถัดไปได้อย่างเพียงพอ
2.บรรดานักตัดต่อวิดีโอ รวมถึงกราฟิกดีไซน์ระดับมืออาชีพคงจะถูกใจไม่น้อย ซึ่งได้รับอานิสงส์มาจากไปป์ไลน์เสตจจำนวนมากผนวกกับชุดคำสั่ง SSE4 นั้นจะช่วยเรนเดอร์วิดีโอกราฟิกให้เร็วขึ้นอย่างไม่เคยเป็นมาก่อน
3.ด้วยจำนวนไปป์ไลน์เสตจที่เพิ่มขึ้นมา (จากการคาดการณ์ไว้ว่าน่าจะประมาณสองเท่าจาก Conroe และ Penryn) ก็จะทำให้อินเทลกลับมาเร่งสัญญาณนาฬิกาของซีพียูได้อีกครั้งหนึ่ง และคาดว่าจะทะลุกำแพง 5Ghz ได้ไม่ยากเย็นนัก (ว้าว !!!)
4.ด้วยกระบวนการผลิตแบบ 45nm จะช่วยเพิ่มขีดความสามารถในการโอเวอร์คล็อกให้สูงยิ่งขึ้นไปอีก ปัจจุบันซีพียูโค้ดเนม Penryn เองก็มีผู้โอเวอร์คล็อกไปแตะแถวๆ 6GHz กันแล้ว ถึงตอนที่ Nehalem ออกมาจริงๆ นั้น ผู้ใช้ทั่วไปอาจจะสามารถโอเวอร์คล็อกซีพียูรุ่นนี้ไปได้สูงกว่า 6GHz ได้สบายๆ (อู้ววววว…)

บทสรุป : เทคโนโลยีก้าวกระโดดครั้งยิ่งใหญ่>
หากจะกล่าวว่า Nehalem เป็นซีพียูในยุคปฏิวัติอีกครั้งหนึ่งของอินเทลก็คงจะไม่ผิดนัก (คงจำกันได้ในยุคที่อินเทลเปลี่ยนจาก 486 มาเป็นเพนเทียม หรือจากยุคเพนเทียมมาเป็นเพนเทียมทู) แม้ว่าสถาปัตยกรรมภายในส่วนใหญ่ยังคงพัฒนาต่อยอดมาจาก Conroe และ Penryn แต่ด้วยคุณสมบัติดีๆ ที่เพิ่มขึ้นมานั้นจะทำให้คุณได้พบกับ “สุดยอดซีพียูสำหรับเดสก์ทอปของโลก” ทันทีที่มีวางจำหน่ายเลยทีเดียว จากสถานการณ์ในช่วงหนึ่งปีกว่าที่ผ่านมานี้ ดูเหมือนว่าอินเทลจะเป็นผู้นำในตลาดซีพียูเดสก์ทอปแบบเด็ดขาด และเมื่อมองแผนงานที่เป็นรูปเป็นร่างในอนาคตก็อดสงสัยไม่ได้เหมือนกันว่า เอเอ็มดีจะกลับมาทวงบัลลังก์คืนได้เหมือนกับยุค Athlon 64 หรือไม่!!!

ถ้าถามว่าเราควรจะขยับไปใช้ Nehalem หรือไม่? คำตอบคงไม่ตายตัว จริงอยู่ที่ว่ามันอาจเป็นซีพียูที่เร็วจนยากจะจินตนาการได้ แต่หากมันได้วางตลาดจริงๆ แล้วล่ะก็ จะเกิดปรากฏการณ์ที่ทำให้ยูสเซอร์ต้องปรับตัวกันขนานใหญ่ ไม่ว่าจะเป็นการซื้อเมนบอร์ดรุ่นใหม่ หน่วยความจำแบบใหม่ (เนื่องจาก Nehalem จะขยับไปใช้ DDR3 อย่างเต็มตัว) และอาจจะเลยเถิดไปจนถึงการ์ดจออีกด้วย เรียกได้ว่าเปลี่ยนกันทีเดียวเกือบยกชุดเลย แต่ถ้าเป็นผู้ที่ซื้อคอมพิวเตอร์ใหม่ยกชุดก็ไม่ต้องคิดอะไรมากเลย เนื่องจากพอวันนั้น อุปกรณ์คอมพิวเตอร์ทั่วไปก็คงจะมีราคาไม่แพงนัก โดยเฉพาะเมื่อหน่วยความจำที่มีราคาสูงลิบลิ่วอย่าง DDR3 เข้าสู่ตลาดอย่างเต็มตัว ก็จะมีราคาแทบไม่แตกต่างจาก DDR2 ในปัจจุบัน
ความจริงแล้วซีพียูในแพลตฟอร์มปัจจุบันเองก็สามารถตอบสนองต่อการทำงานรวมทั้งการเล่นเกมได้ดีระดับหนึ่งแล้ว หากจะใช้ต่อไปก็ไม่น่าจะมีปัญหาใดๆ แต่ก็อย่างว่าล่ะครับ เมื่อมีของใหม่วางจำหน่าย สิ่งที่เรามีอยู่มันก็จะช้าลงโดยอัตโนมัติ เป็นอย่างนี้ทุกยุคทุกสมัยและตลอดไป เอาล่ะครับ ขอตัวไปปั่นบทความเก็บเงินซื้อ Nehalem ก่อน แล้วพบกันใหม่
ที่มา ARIP : Hardware Zone
Comment