Technology

เจาะลึก Vera CPU ไม้ตายใหม่จาก Nvidia งัดมาสู้กับ Agentic AI

By Arnon Puitrakul - 14 มิถุนายน 2026

เมื่องาน Computex 2026 ที่ผ่านมา Nvidia ขึ้น Keynote เปิดตัวของเล่นใหม่อีกตามเคย แต่สิ่งที่ทำให้เราต้องสะดุดตา มันคือการที่ Nvidia ลงมาเล่นตลาด CPU จริงจังมากขึ้นด้วยการเปิดตัวสถาปัตยกรรมใหม่อย่าง Rubin มันเป็นจุดเปลี่ยนเกมที่สำคัญมาก เพราะ Nvidia บอกว่าอนาคตของ AI ไม่ได้ขึ้นอยู่กับแค่ว่า GPU เร็วเท่าไหร่อย่างเดียวแล้ว แต่มันคือการออกแบบระบบที่มีประสิทธิภาพสุงสุดต่อต้นทุนเป็นหลัก

การที่ Nvidia ออกมาพูดแบบนี้ เขาเห็น Pain Point จริง ๆ ของระบบคอมพิวเตอร์ปัจจุบันกับการทำงาน AI มาก ๆ เพราะทุกวันนี้ เราว่า เรื่องความเร็วในการคำนวณมันก้าวกระโดดไปเร็วมาก ๆ ปัญหาคือเราถ่ายข้อมูลมาให้คำนวณได้เร็วพอ และการจัดการชุดคำสั่งได้ดีพอหรือยัง

I/O Wall กำแพงของระบบแบบเดิม ๆ

ถ้าเราลองย้อนดูประสิทธิภาพในการทำงานของ Data Centre มาเรื่อย ๆ เราจะเห็นว่า มันเริ่มเห็น Trend บางอย่างที่เกิดขึ้นใน Server Farm นาดใหญ่คือ GPU ราคามหาศาลตัว Top สุด ทำงานไม่มีประสิทธิภาพลดลง ไม่สามารถ Utilise ได้เต็มความสามารถของตัวเองได้ตลอดเวลา

ปัญหาคือ CPU เดิม ๆ อย่าง x86 ที่ Intel และ AMD ใช้กัน มันถูกออกแบบมาเพื่อรัน OS และจัดการงานทั่ว ๆ ไป เมื่อเราเอามาจับคู่กับ AI ที่ต้องการทำ Matrix Operation แบบมหาศาล เราจะเจอกับปัญหาที่เรียกว่า I/O Wall หรือก็คือ CPU พวกนี้เสียเวลาไปกับการจัดการ Data Packet เช่นการทำ Decompression และ Virtualisation เยอะมาก เหมือนเราเอาคนขับรถที่เก่งมาก ๆ ขับรถไป แกะกล่องข้าวกลางวันไปด้วย ยังไงมันย่อมช้ากว่าการขับรถเฉย ๆ แน่นอน ทำให้การส่งข้อมูลต่อให้ GPU ไปคำนวณต่อช้ากว่าที่ GPU ต้องการมหาศาล

คอขวดตรงนี้ มันมีความพยายามเข้ามาแก้ปัญหาอยู่หลายรอบมาก ๆ โดยเการเพิ่มความเร็วของ Memory ให้มีความเร็วสูงมากขึ้นเรื่อย ๆ แต่ก็ต้องยอมรับว่า มันเป็นเรื่องยากมาก ๆ ที่เราจะสามารถทำให้ Primary Memory ของ CPU เร็วพอ ๆ กับฝั่ง GPU ด้วย เช่นในทุกวันนี้ RAM เราใช้งานมาตรฐาน DDR5 กัน แต่ GPU กำลังจะโดดไประดับ HBM4 แล้ว ดังนั้น เราจะเห็นว่า ตอนนี้มันไม่ได้อยู่ที่แค่เรื่องความเร็วของ CPU เท่านั้นแต่มันคือความเร็วในการจัดการข้อมูลมหาศาลเพื่อให้ถึงมือผู้คำนวณมากที่สุด

RISC-V เข้ามาเป็นทางเลือกให้ Nvidia

เพื่อเป็นการแก้ปัญหานี้ Nvidia เลยไม่ได้แค่ออกแบบ GPU ใหม่ แต่เขาสร้าง Vera CPU ข้นมาใหม่ทั้งหมด ซึ่งหัวใจสำคัญที่สุดคือ การที่ Nvidia เลือกหันกลับไปที่ RISC-V แบบ Custom ขึ้นมา

คำถามที่เราสงสัยอย่างแรกคือ ทำไม Nvidia หันไปใช้งาน RISV-V แทนที่จะเป็น x86 ที่มัน Mature มานานแล้ว เหตุผลอยู่ที่ว่า x86 มีข้อจำกัดเรื่อง คำสั่งเก่า ๆ ที่ฝักรากลึกและแก้ไขได้ยากเพื่อให้เหมาะสมกับงานเฉพาะทาง แต่ RISC-V สำหรับ Vera นั้น Nvidia สามารถออกบ Instruction Set ใหม่ได้หมดเลย โดยตัดงานจุกจิกที่ CPU ไม่ถนัดออก แล้วใส่ความสามารถเฉพาะจุดเข้าไป

หน้าที่ของ Vera ใน Vera Rubin Architecture ไม่ได้เป็นการมาแข่งกับ CPU ตัวอื่น ๆ ในการทำงาน Office หรือเปิดเว็บ แต่มันคือ AI-Native Processor เลยถูกออกแบบมาเพื่อรับโหลดหนัก ๆ ของ GPU โดยตรง เรียกว่าตรงกันข้ามกับ CPU ตอนนี้ที่ GPU ถูกออกแบบมาเพื่อ Offload CPU แต่ตอนนี้ Nvidia กำลังจะบอกว่า อ่อไม่ ๆ เราจะให้ CPU นี่แหละ Offload งานที่ GPU ไม่เก่งแทน มันจะเข้าไปทำหน้าที่เป็นพวกส่วนของการจัดการ Network และการจัดการข้อมูลในตัวมันเลย ประกอบกับการ Custom Instruction Set เลยทำให้มันสามารถทำงานได้แบบเร็ว และประหยัดพลังงานมาก ๆ

ผลลัพธ์ที่ได้คือ GPU Rubin เปลี่ยนจากคนที่ทำทุกอย่างกลายเป็น เครื่องคิดเลขขนาดใหญ่ ไม่ต้องสนใจเลยว่าข้อมูลจะมาจากไหน หน้าตาเป็นอย่างไร มันแค่ทำหน้าที่รับข้อมูลที่พร้อมใช้งานจาก Vera CPU ไปคำนวณทำงานได้ทันที

ข้อมูลใหญ่ขึ้น Memory ก็ต้องเร็วขึ้นด้วย HBM4

หลังจาก Nvidia จัดการเพื่อให้ข้อมูลพอถึง GPU ก็พร้อมคำนวณทันทีแล้ว ปัญหาต่อไปคือ แล้วข้อมูลมันจะมาจากไหนละ Memory แบบเดิม ๆ ที่เราใช้กับงานพวกนี้คือ HBM3 เมื่อก่อนมันอาจจะเร็วมาก ๆ นะ แต่พอมาวันนี้ข้อมูลเราใหญ่ขึ้นทุกวัน ทำให้ความจุและความเร็วของมันเริ่มไม่ตอบสนองการทำงานในปัจจุบันแล้ว

เพื่อแก้โจทย์นี้ Nvidia บอกว่า ไม่ยาก ๆๆๆ เราก็เปลี่ยนมาใช้หน่วยความจำที่เร็วขึ้นอย่าง HBM4 ความเจ๋งมันไม่ได้อยู่แค่ว่า เราเพิ่มความจุมันได้เท่านั้น แต่เราสามารถเพิ่ม Bandwidth ในการส่งข้อมูลได้ ตามมาตรฐานมันทำได้ถึง 1.8 TB/s ซึ่งถือว่าเป็นการพัฒนาแบบก้าวกระโดดมาก ๆ เมื่อเทียบกับยุคก่อนหน้า

แต่ที่สิ่งที่เราคิดว่า มันเข้ามาตอบโจทย์มาก ๆ คือ การประหยัดพลังงาน เพราะ HBM4 ถูกออกแบบมาให้ใช้แรงดันไฟฟ้าที่ต่ำกว่าในขณะที่เร็วกว่าเดิม มันเลยเข้ามาแก้เรื่อง Cost of Ownership ได้จัง ๆ เลย คิดดูนะว่า Server เราต้องรันแบบ 24/7 ถ้า Hardware ตัวไหนกินไฟน้อยลงไปสักหน่อย แต่ถ้ารวม ๆ กันหลายร้อยเครื่อง ผลลัพธ์ย่อมเห็นเป็นบิลค่าไฟที่น้อยลงแน่นอน

Nvidia C2C และ CXL จุดเชื่อมของระบบให้เป็นหนึ่งเดียว

เมื่อเรามีสมองอย่าง Vera CPU, แขนขากล้ามโตอย่าง Rubin GPU และ หัวใจอย่าง HBM4 อีกสิ่งสำคัญที่ขาดไม่ได้คือ ส่วนที่เชื่อมต่ออวัยวะพวกนี้เข้าหากันเป็นระบบเดียว ถ้าใครเคยประกอบคอม เราจะรู้ว่า GPU เชื่อมต่อกับ CPU ผ่าน PCIe ซึ่ง ถ้าเราลองไปดูสเปกมันดู จะเห็นว่า สายพวกนี้มีความเร็วจำกัด และไม่ได้ยืดหยุ่นมากพอเพื่อทำงานกับการแลกเปลี่ยนข้อมูลมหาศาลเลย

Nvidia บอกว่า โน ๆ เรามี NVLink-C2C มันคือ ทางโคตรด่วนพิเศษเร้วกว่า Thunder Express ที่เชื่อมต่อระหว่าง Vera และ Rubin เข้าด้วยกัน มองว่าทั้งสองส่วนนี้วางติดอยู่บนแผน Silicon Die ตัวเดียวกันเลยก็ได้ นอกจากนี้ยังรองรับมาตรฐาน CXL (Compute Express Link) ที่ช่วยเรื่องการทำ Memory Pooling อย่างฉลาดมาก ๆ

การมีอยู่ของ C2C และ CXL ทำให้ Vera และ Rubin ทำงานแบบ Unified Memory เหมือนที่เราเห็นใน Apple Silicon หมายความว่า เราไม่ต้อง Copy ข้อมูลจาก RAM ของ CPU ใส่ของ GPU อีกต่อไปแล้ว ไม่ว่าข้อมูลจะอยู่ไหนทุกคนจะเข้ามาดึงไปใช้งานได้ในทันที โดยไม่ต้องผ่านขั้นตอนการส่งผ่านไปมาเลย นั่นทำให้ Latency หรือความหน่วงลดลงจนแทบจะเหลือ 0 แบบที่เราเห็นใน Apple Silicon (จริง ๆ Apple ก็ใช้ทริกนี้ในการทำให้มันประสิทธิภาพสูงนี่แหละ)

สรุป : เครื่องแรงกว่า ไม่ได้แปลว่าจะแรงกว่าได้จริงเสมอไป

เมื่อเรารวมส่วนประกอบทุกอย่าง เราจะเห็นว่า Vera Rubin ไม่ได้ออกมาเพื่อขายความเร็วอย่างเดียว แต่มันคือการขายคำตอบทางวิศวกรรมที่เข้ามาแก้ปัญหาที่เราเจอกันอยู่ตอนนี้ได้แบบสุดกราฟมาก ๆ การเอา RISC-V มา Custom Instruction Set มาทำหน้าที่ย้ายงาน Network และ OS ออกมา เพื่อให้ GPU ที่แรงอยู่แล้ว รวมกับ HBM4 อีก ที่ให้พลังการย้ายข้อมูลมหาศาลแต่กินไฟน้อย กับ NVLink ที่เชื่อมต่อกันแบบไร้รอยต่อ

มันทำให้เราเห็น Cost-Effectiveness ได้อย่างชัดเจน เราไม่ต้องไปซื้อ SmartNICs อย่าง Nvidia BlueField มาเพิ่มแล้ว เพราะ Vera จัดการเองได้หมด ทำให้เราสามารถวาง GPU จำนวนเยอะ ๆ ใน Rack เดียวกันได้แน่นขึ้น (Higher Density) โดยไม่ต้องกังวลเรื่องความร้อน หรือ ความแออัดของสายสัญญาณ และที่สำคัญทำให้เงินลงทุนมหาศาลในการซื้อ GPU มันทำงานได้คุ้มค่า ไม่ต้องเสียเวลารอข้อมูลอีกต่อไป

เราว่า การมาถึงของ Vera Rubin มันเป็นการหาทางออก แก้ปัญหาที่เรากำลังเจออยู่ได้ฉลาดมาก ๆ สวนทางกับเจ้าอื่น ๆ ที่พยายามทำให้ SoC ตัวเองแรงขึ้นเรื่อย ๆ แต่ก็แลกมากับการกินไฟและความร้อนมากขึ้น ซึ่งในช่วงหลายปีที่ผ่านมา เราก็เริ่มเห็นแล้วว่า ความชันของกราฟในการเพิ่มขึ้นของประสิทธิภาพมันช้าลงเรื่อย ๆ ถือว่า Nvidia เดิมเกมได้โคตรน่ากลัว กะกินรวบในวงการ HPC เลยมั้งเนี่ย

Agent Harness คืออะไร ทำไมถึงเป็นจุดเปลี่ยนสำคัญใน Modern AI

20 กรกฎาคม 2026 - 1 min read

Agent Harness เราได้ยินมันบ่อยมากขึ้นเรื่อย ๆ ว่าแต่มันคืออะไร และมันเข้ามาช่วยอะไรเราได้บ้าง ในบทความนี้เราจะมาเล่าให้อ่านกัน...

วิศวกร Safeguard ป้องกัน LLM จากการโดน Jailbreak อย่างไร

13 กรกฎาคม 2026 - 1 min read

LLM เก่งขึ้นทุกวัน จนบางทีจะดูเป็นอันตรายมาก ๆ วิศวกร เขามีวิธีการอย่างไรเพื่อป้องกันไม่ให้ Model ตอบคำตอบที่ไม่ควรตอบ วันนี้เราจะมาเล่าให้อ่านกัน...

ทำยังไงถึงจะประหยัดค่า AI ในการทำงานได้

04 กรกฎาคม 2026 - 1 min read

เมื่อหลายปีก่อน เราพูดบ่อยมาก ๆ ว่าเราน่าจะประหยัด Token ในการใช้ AI แต่คนก็บอกว่า นี่ เราจะต้องยัด Token เข้าไปเยอะ ๆ ใช้ Reasoning เยอะ ๆ สิมันจะได้ฉลาด แต่วันนี้ราคา Token นับวันยิ่งแพงขึ้นเรื่อย ๆ ทำยังไงกันละ เราถึงจะได้ความฉลาดเท่าเดิม แต่ประหยัดเงินในกระเป๋าของเราได้...

รู้จักกับ NVFP4 มาตรฐานการ Quantised จาก Nvidia

17 มิถุนายน 2026 - 1 min read

ก่อนหน้านี้ เรารีวิว DGX Spark สำหรับใช้งานในบ้านเราไป เลยทำให้เราได้ไปนั่งหา Model เพื่อมารัน จนอ่านไปเจอกับ NVFP4 ที่เป็น Quantisation ของ Nvidia เอง แล้วมันเป็นอะไรที่เจ๋งมาก ๆ วันนี้เราจะมาเล่าให้อ่านกันว่า ทำไมมันเจ๋ง และ ใครควรจะใช้...