Technology

เจาะลึก Vera CPU ไม้ตายใหม่จาก Nvidia งัดมาสู้กับ Agentic AI

By Arnon Puitrakul - 14 มิถุนายน 2026

เจาะลึก Vera CPU ไม้ตายใหม่จาก Nvidia งัดมาสู้กับ Agentic AI

เมื่องาน Computex 2026 ที่ผ่านมา Nvidia ขึ้น Keynote เปิดตัวของเล่นใหม่อีกตามเคย แต่สิ่งที่ทำให้เราต้องสะดุดตา มันคือการที่ Nvidia ลงมาเล่นตลาด CPU จริงจังมากขึ้นด้วยการเปิดตัวสถาปัตยกรรมใหม่อย่าง Rubin มันเป็นจุดเปลี่ยนเกมที่สำคัญมาก เพราะ Nvidia บอกว่าอนาคตของ AI ไม่ได้ขึ้นอยู่กับแค่ว่า GPU เร็วเท่าไหร่อย่างเดียวแล้ว แต่มันคือการออกแบบระบบที่มีประสิทธิภาพสุงสุดต่อต้นทุนเป็นหลัก

การที่ Nvidia ออกมาพูดแบบนี้ เขาเห็น Pain Point จริง ๆ ของระบบคอมพิวเตอร์ปัจจุบันกับการทำงาน AI มาก ๆ เพราะทุกวันนี้ เราว่า เรื่องความเร็วในการคำนวณมันก้าวกระโดดไปเร็วมาก ๆ ปัญหาคือเราถ่ายข้อมูลมาให้คำนวณได้เร็วพอ และการจัดการชุดคำสั่งได้ดีพอหรือยัง

I/O Wall กำแพงของระบบแบบเดิม ๆ

ถ้าเราลองย้อนดูประสิทธิภาพในการทำงานของ Data Centre มาเรื่อย ๆ เราจะเห็นว่า มันเริ่มเห็น Trend บางอย่างที่เกิดขึ้นใน Server Farm นาดใหญ่คือ GPU ราคามหาศาลตัว Top สุด ทำงานไม่มีประสิทธิภาพลดลง ไม่สามารถ Utilise ได้เต็มความสามารถของตัวเองได้ตลอดเวลา

ปัญหาคือ CPU เดิม ๆ อย่าง x86 ที่ Intel และ AMD ใช้กัน มันถูกออกแบบมาเพื่อรัน OS และจัดการงานทั่ว ๆ ไป เมื่อเราเอามาจับคู่กับ AI ที่ต้องการทำ Matrix Operation แบบมหาศาล เราจะเจอกับปัญหาที่เรียกว่า I/O Wall หรือก็คือ CPU พวกนี้เสียเวลาไปกับการจัดการ Data Packet เช่นการทำ Decompression และ Virtualisation เยอะมาก เหมือนเราเอาคนขับรถที่เก่งมาก ๆ ขับรถไป แกะกล่องข้าวกลางวันไปด้วย ยังไงมันย่อมช้ากว่าการขับรถเฉย ๆ แน่นอน ทำให้การส่งข้อมูลต่อให้ GPU ไปคำนวณต่อช้ากว่าที่ GPU ต้องการมหาศาล

คอขวดตรงนี้ มันมีความพยายามเข้ามาแก้ปัญหาอยู่หลายรอบมาก ๆ โดยเการเพิ่มความเร็วของ Memory ให้มีความเร็วสูงมากขึ้นเรื่อย ๆ แต่ก็ต้องยอมรับว่า มันเป็นเรื่องยากมาก ๆ ที่เราจะสามารถทำให้ Primary Memory ของ CPU เร็วพอ ๆ กับฝั่ง GPU ด้วย เช่นในทุกวันนี้ RAM เราใช้งานมาตรฐาน DDR5 กัน แต่ GPU กำลังจะโดดไประดับ HBM4 แล้ว ดังนั้น เราจะเห็นว่า ตอนนี้มันไม่ได้อยู่ที่แค่เรื่องความเร็วของ CPU เท่านั้นแต่มันคือความเร็วในการจัดการข้อมูลมหาศาลเพื่อให้ถึงมือผู้คำนวณมากที่สุด

RISC-V เข้ามาเป็นทางเลือกให้ Nvidia

เพื่อเป็นการแก้ปัญหานี้ Nvidia เลยไม่ได้แค่ออกแบบ GPU ใหม่ แต่เขาสร้าง Vera CPU ข้นมาใหม่ทั้งหมด ซึ่งหัวใจสำคัญที่สุดคือ การที่ Nvidia เลือกหันกลับไปที่ RISC-V แบบ Custom ขึ้นมา

คำถามที่เราสงสัยอย่างแรกคือ ทำไม Nvidia หันไปใช้งาน RISV-V แทนที่จะเป็น x86 ที่มัน Mature มานานแล้ว เหตุผลอยู่ที่ว่า x86 มีข้อจำกัดเรื่อง คำสั่งเก่า ๆ ที่ฝักรากลึกและแก้ไขได้ยากเพื่อให้เหมาะสมกับงานเฉพาะทาง แต่ RISC-V สำหรับ Vera นั้น Nvidia สามารถออกบ Instruction Set ใหม่ได้หมดเลย โดยตัดงานจุกจิกที่ CPU ไม่ถนัดออก แล้วใส่ความสามารถเฉพาะจุดเข้าไป

หน้าที่ของ Vera ใน Vera Rubin Architecture ไม่ได้เป็นการมาแข่งกับ CPU ตัวอื่น ๆ ในการทำงาน Office หรือเปิดเว็บ แต่มันคือ AI-Native Processor เลยถูกออกแบบมาเพื่อรับโหลดหนัก ๆ ของ GPU โดยตรง เรียกว่าตรงกันข้ามกับ CPU ตอนนี้ที่ GPU ถูกออกแบบมาเพื่อ Offload CPU แต่ตอนนี้ Nvidia กำลังจะบอกว่า อ่อไม่ ๆ เราจะให้ CPU นี่แหละ Offload งานที่ GPU ไม่เก่งแทน มันจะเข้าไปทำหน้าที่เป็นพวกส่วนของการจัดการ Network และการจัดการข้อมูลในตัวมันเลย ประกอบกับการ Custom Instruction Set เลยทำให้มันสามารถทำงานได้แบบเร็ว และประหยัดพลังงานมาก ๆ

ผลลัพธ์ที่ได้คือ GPU Rubin เปลี่ยนจากคนที่ทำทุกอย่างกลายเป็น เครื่องคิดเลขขนาดใหญ่ ไม่ต้องสนใจเลยว่าข้อมูลจะมาจากไหน หน้าตาเป็นอย่างไร มันแค่ทำหน้าที่รับข้อมูลที่พร้อมใช้งานจาก Vera CPU ไปคำนวณทำงานได้ทันที

ข้อมูลใหญ่ขึ้น Memory ก็ต้องเร็วขึ้นด้วย HBM4

หลังจาก Nvidia จัดการเพื่อให้ข้อมูลพอถึง GPU ก็พร้อมคำนวณทันทีแล้ว ปัญหาต่อไปคือ แล้วข้อมูลมันจะมาจากไหนละ Memory แบบเดิม ๆ ที่เราใช้กับงานพวกนี้คือ HBM3 เมื่อก่อนมันอาจจะเร็วมาก ๆ นะ แต่พอมาวันนี้ข้อมูลเราใหญ่ขึ้นทุกวัน ทำให้ความจุและความเร็วของมันเริ่มไม่ตอบสนองการทำงานในปัจจุบันแล้ว

เพื่อแก้โจทย์นี้ Nvidia บอกว่า ไม่ยาก ๆๆๆ เราก็เปลี่ยนมาใช้หน่วยความจำที่เร็วขึ้นอย่าง HBM4 ความเจ๋งมันไม่ได้อยู่แค่ว่า เราเพิ่มความจุมันได้เท่านั้น แต่เราสามารถเพิ่ม Bandwidth ในการส่งข้อมูลได้ ตามมาตรฐานมันทำได้ถึง 1.8 TB/s ซึ่งถือว่าเป็นการพัฒนาแบบก้าวกระโดดมาก ๆ เมื่อเทียบกับยุคก่อนหน้า

แต่ที่สิ่งที่เราคิดว่า มันเข้ามาตอบโจทย์มาก ๆ คือ การประหยัดพลังงาน เพราะ HBM4 ถูกออกแบบมาให้ใช้แรงดันไฟฟ้าที่ต่ำกว่าในขณะที่เร็วกว่าเดิม มันเลยเข้ามาแก้เรื่อง Cost of Ownership ได้จัง ๆ เลย คิดดูนะว่า Server เราต้องรันแบบ 24/7 ถ้า Hardware ตัวไหนกินไฟน้อยลงไปสักหน่อย แต่ถ้ารวม ๆ กันหลายร้อยเครื่อง ผลลัพธ์ย่อมเห็นเป็นบิลค่าไฟที่น้อยลงแน่นอน

Nvidia C2C และ CXL จุดเชื่อมของระบบให้เป็นหนึ่งเดียว

เมื่อเรามีสมองอย่าง Vera CPU, แขนขากล้ามโตอย่าง Rubin GPU และ หัวใจอย่าง HBM4 อีกสิ่งสำคัญที่ขาดไม่ได้คือ ส่วนที่เชื่อมต่ออวัยวะพวกนี้เข้าหากันเป็นระบบเดียว ถ้าใครเคยประกอบคอม เราจะรู้ว่า GPU เชื่อมต่อกับ CPU ผ่าน PCIe ซึ่ง ถ้าเราลองไปดูสเปกมันดู จะเห็นว่า สายพวกนี้มีความเร็วจำกัด และไม่ได้ยืดหยุ่นมากพอเพื่อทำงานกับการแลกเปลี่ยนข้อมูลมหาศาลเลย

Nvidia บอกว่า โน ๆ เรามี NVLink-C2C มันคือ ทางโคตรด่วนพิเศษเร้วกว่า Thunder Express ที่เชื่อมต่อระหว่าง Vera และ Rubin เข้าด้วยกัน มองว่าทั้งสองส่วนนี้วางติดอยู่บนแผน Silicon Die ตัวเดียวกันเลยก็ได้ นอกจากนี้ยังรองรับมาตรฐาน CXL (Compute Express Link) ที่ช่วยเรื่องการทำ Memory Pooling อย่างฉลาดมาก ๆ

การมีอยู่ของ C2C และ CXL ทำให้ Vera และ Rubin ทำงานแบบ Unified Memory เหมือนที่เราเห็นใน Apple Silicon หมายความว่า เราไม่ต้อง Copy ข้อมูลจาก RAM ของ CPU ใส่ของ GPU อีกต่อไปแล้ว ไม่ว่าข้อมูลจะอยู่ไหนทุกคนจะเข้ามาดึงไปใช้งานได้ในทันที โดยไม่ต้องผ่านขั้นตอนการส่งผ่านไปมาเลย นั่นทำให้ Latency หรือความหน่วงลดลงจนแทบจะเหลือ 0 แบบที่เราเห็นใน Apple Silicon (จริง ๆ Apple ก็ใช้ทริกนี้ในการทำให้มันประสิทธิภาพสูงนี่แหละ)

สรุป : เครื่องแรงกว่า ไม่ได้แปลว่าจะแรงกว่าได้จริงเสมอไป

เมื่อเรารวมส่วนประกอบทุกอย่าง เราจะเห็นว่า Vera Rubin ไม่ได้ออกมาเพื่อขายความเร็วอย่างเดียว แต่มันคือการขายคำตอบทางวิศวกรรมที่เข้ามาแก้ปัญหาที่เราเจอกันอยู่ตอนนี้ได้แบบสุดกราฟมาก ๆ การเอา RISC-V มา Custom Instruction Set มาทำหน้าที่ย้ายงาน Network และ OS ออกมา เพื่อให้ GPU ที่แรงอยู่แล้ว รวมกับ HBM4 อีก ที่ให้พลังการย้ายข้อมูลมหาศาลแต่กินไฟน้อย กับ NVLink ที่เชื่อมต่อกันแบบไร้รอยต่อ

มันทำให้เราเห็น Cost-Effectiveness ได้อย่างชัดเจน เราไม่ต้องไปซื้อ SmartNICs อย่าง Nvidia BlueField มาเพิ่มแล้ว เพราะ Vera จัดการเองได้หมด ทำให้เราสามารถวาง GPU จำนวนเยอะ ๆ ใน Rack เดียวกันได้แน่นขึ้น (Higher Density) โดยไม่ต้องกังวลเรื่องความร้อน หรือ ความแออัดของสายสัญญาณ และที่สำคัญทำให้เงินลงทุนมหาศาลในการซื้อ GPU มันทำงานได้คุ้มค่า ไม่ต้องเสียเวลารอข้อมูลอีกต่อไป

เราว่า การมาถึงของ Vera Rubin มันเป็นการหาทางออก แก้ปัญหาที่เรากำลังเจออยู่ได้ฉลาดมาก ๆ สวนทางกับเจ้าอื่น ๆ ที่พยายามทำให้ SoC ตัวเองแรงขึ้นเรื่อย ๆ แต่ก็แลกมากับการกินไฟและความร้อนมากขึ้น ซึ่งในช่วงหลายปีที่ผ่านมา เราก็เริ่มเห็นแล้วว่า ความชันของกราฟในการเพิ่มขึ้นของประสิทธิภาพมันช้าลงเรื่อย ๆ ถือว่า Nvidia เดิมเกมได้โคตรน่ากลัว กะกินรวบในวงการ HPC เลยมั้งเนี่ย