انویدیا در کنفرانس GTC 2025، نسل آینده پردازندههای گرافیکی مراکز داده خود را معرفی کرد. این شرکت با رونمایی از پلتفرم روبین (Rubin) و روبین اولترا (Rubin Ultra)، چشمانداز خود را برای سالهای 2026 و 2027 مشخص کرد. در ادامه با همه مشخصات فنی و پتانسیلهای عظیم این پردازندههای گرافیکی و همچنین پردازنده VERA آشنا شوید.
در کنفرانس GTC 2025، جنسن هوانگ، مدیرعامل شرکت انویدیا، بهروزرسانی جدیدی از نقشه راه پردازندههای گرافیکی مراکز داده این شرکت برای سالهای 2026 و 2027 را ارائه کرد. او از پلتفرم روبین، که بهزودی در نیمه دوم سال 2025 وارد بازار خواهد شد، و روبین اولترا، که در نیمه دوم 2027 معرفی خواهد شد، پرده برداشت.
این معرفیها در حالی صورت میگیرد که انویدیا هنوز تولید کامل پردازنده گرافیکی Blackwell B200 را به پایان نرسانده و پردازنده B300 را برای نیمه دوم سال 2025 آماده کرده است، اما همزمان با این پیشرفتها، شرکت نگاهی به آینده دارد و در تلاش است تا همکاران خود را برای گذار به نسلهای جدیدتر آماده کند.
در همین رابطه بخوانید:
– غول پردازشی Blackwell Ultra B300 معرفی شد؛ 288 گیگابایت حافظه HBM3e و 15 پتافلاپ عملکرد FP4

تحول در نامگذاری و توپولوژی NVLink
یکی از نکات مهمی که در این کنفرانس مطرح شد، اصلاح نحوه نامگذاری پردازندههای گرافیکی بود.
نامگذاری Blackwell اشتباه بود
در بخشهای ابتدایی این نطق، جنسن هوانگ، مدیرعامل انویدیا، توضیح داد که Blackwell B200 در واقع دارای دو هسته (die) در هر GPU است که باعث تغییر در توپولوژی NVLink میشود. بنابراین، اگرچه این پردازنده در ابتدا Blackwell B200 NVL72 نامگذاری شده بود، اما بهتر بود با نام NV144L معرفی میشد. این تغییر در نامگذاری در پردازندههای روبین نیز اعمال خواهد شد.
مشخصات پردازندههای روبین (Rubin NVL144)
طبق اعلام انویدیا پردازنده Rubin NVL144 جایگزین مدل Blackwell NVL72 خواهد شد و بهطور کامل با زیرساختهای فعلی سازگار خواهد بود.
بهبود چشمگیر در عملکرد محاسباتی
در اولین نمودار منتشر شده توسط هوانگ، اطلاعات مربوط به مدل روبین NVL144 نمایش داده شد که بهطور کامل با زیرساختهای موجود Blackwell NVL72 سازگار است. پردازنده B300 NVL72 توان محاسباتی 1.1 پتافلاپس در محاسبات FP4 فشرده ارائه میدهد، در حالی که مدل روبین NVL144 با همان 144 هسته GPU، توان محاسباتی 3.6 پتافلاپس در FP4 را ارائه خواهد داد.
به صورت کلی میتوان ارتقاهای ایجاد شده در این نسل را به صورت زیر عنوان و خلاصه کرد:
- 3.6 پتافلاپس قدرت پردازشی در FP4 (در مقابل 1.1 پتافلاپس در Blackwell B300 NVL72)
- 1.2 اگزافلاپس توانایی پردازشی در آموزش FP8 (در مقایسه با 0.36 اگزافلاپس در B300)
- بهبود 3.3 برابری در عملکرد محاسباتی نسبت به نسل قبل
ارتقاء حافظه و ارتباطات بینپردازشی
روبین به عنوان نقطه عطفی در انتقال از حافظه HBM3/HBM3e به HBM4 نیز تلقی خواهد شد. ظرفیت حافظه همچنان 288 گیگابایت به ازای هر GPU خواهد بود، مشابه B300، اما پهنای باند از 8 ترابایت بر ثانیه به 13 ترابایت بر ثانیه افزایش خواهد یافت. انویدیا اعلام کرده که حافظه HBM4e برای مدل روبین اولترا مورد استفاده قرار خواهد گرفت.
نکته دیگر این است که پیوند NVLink سریعتری نیز توسط تیم سبز ارائه خواهد شد که از پهنای باند 260 ترابایت بر ثانیه برخوردار خواهد بود. مضاف بر این یک لینک جدید CX9 بین رکها با پهنای باند 28.8 ترابایت بر ثانیه نیز به خدمت گرفته میشود، که ظرفیت پهنای باند آن دو برابر پهنای باند B300 و CX8 خواهد بود.
با توجه به موارد فوق میتوان گفت که اهم ارتقاهای ایجاد شده حافظه در روبین به شرح زیر خواهند بود:
- گذار از HBM3/HBM3e به HBM4
- استفاده از HBM4e در نسخه روبین اولترا
- افزایش پهنای باند حافظه از 8 ترابایت بر ثانیه به 13 ترابایت بر ثانیه
- استفاده از NVLink جدید با دو برابر پهنای باند (260 ترابایت بر ثانیه)
- معرفی لینک CX9 بین رکها با پهنای باند 28.8 ترابایت بر ثانیه (2 برابر CX8)
پردازنده مرکزی ورا (Vera CPU): قدرتی جدید در معماری پردازشی انویدیا
با معرفی نسل جدید پردازندههای گرافیکی روبین، انویدیا پردازنده مرکزی جدید خود را نیز به نام ورا (Vera CPU) معرفی کرد که جایگزین پردازندههای Grace خواهد شد. این پردازنده که بر اساس معماری ARM سفارشیشده توسعه یافته، با هدف ارائه عملکرد بهینه در پردازشهای مراکز داده و هوش مصنوعی طراحی شده است.
ورا از 88 هسته پردازشی و 176 رشته موازی بهره میبرد که امکان پردازش حجم عظیمی از دادهها را با کمترین تأخیر فراهم میکند. همچنین، این پردازنده برای ارتباط مستقیم و بدون وقفه با پردازندههای گرافیکی روبین، به یک رابط NVLink با پهنای باند 1.8 ترابایت بر ثانیه مجهز شده است که تعامل بین GPU و CPU را به سطح جدیدی ارتقا میدهد.
در کنار این مشخصات، ورا بهینهسازیهای خاصی برای پردازشهای مبتنی بر هوش مصنوعی و یادگیری عمیق دارد که آن را به گزینهای ایدهآل برای مراکز داده تبدیل میکند. با ترکیب ورا و روبین، انویدیا در تلاش است یک اکوسیستم پردازشی کاملاً هماهنگ و یکپارچه ایجاد کند که نهتنها قدرت پردازشی را به حداکثر برساند، بلکه مصرف انرژی و بازدهی کلی سیستم را نیز بهینه کند.
این پردازنده، علاوه بر پشتیبانی از حافظههای پرسرعت HBM، با فناوریهای جدید ارتباطی و شبکهای ترکیب شده تا عملکردی پایدار و مقیاسپذیر در بارهای پردازشی سنگین ارائه دهد. ورا تنها یک پردازنده مرکزی نیست؛ بلکه هستهای کلیدی در نسل جدید پردازشهای انویدیا خواهد بود.
مشخصات پردازندههای روبین اولترا (Rubin Ultra NVL576)
بخش مهم و جذاب دیگر این مراسم معرفی پردازندههای روبین اولترا بود که طبق اعلام شرکت، در نیمه دوم سال 2027 وارد بازار خواهد شد. در این مدل، پردازنده ورا همچنان باقی خواهد ماند، اما از نظر پردازش گرافیکی، تغییرات بزرگی را تجربه خواهیم کرد. آرایش جدیدی در رکها جایگزین خواهد شد که به نام NVL576 شناخته میشود. این مدل قادر خواهد بود تا 576 پردازنده گرافیکی را در یک رک جای دهد که مصرف توان آن هنوز مشخص نشده است.
افزایش تعداد GPU، حافظه و پهنای باند
در حالی که مدل روبین NVL144 دارای 75 ترابایت حافظه سریع (برای هر دو پردازنده CPU و GPU) در هر رک است، مدل روبین اولترا NVL576 دارای 365 ترابایت حافظه خواهد بود. پردازندههای گرافیکی این مدل از حافظه HBM4e بهره خواهند برد، اما جالب اینجاست که انویدیا پهنای باند 4.6 پتابایت بر ثانیه برای حافظه HBM4e را اعلام کرده است، که در مجموع با 576 پردازنده گرافیکی، این مقدار به 8 ترابایت بر ثانیه برای هر GPU میرسد.
نکته مهمی که باید در اینجا به آن اشاره کنیم این است که به نظر میرسد پهنای باند اعلامی برای روبین اولترا کمتر از مدلهای قبلی باشد، اما احتمالاً این شرایط به نحوه اتصال چهار هسته GPU در هر پکیج مرتبط است. همچنین هر چهار پردازنده GPU در هر رک دارای 1 ترابایت حافظه HBM4e خواهند بود و قادر به انجام 100 پتافلاپ محاسبات FP4 خواهند بود.
عملکرد استنباط (inference) در FP4 به 15 اگزافلاپس خواهد رسید، در حالی که محاسبات آموزش FP8 به 5 اگزافلاپس افزایش خواهد یافت. این رقم تقریبا چهار برابر ظرفیت محاسباتی روبین NVL144 است که منطقی است چرا که تعداد پردازندههای گرافیکی نیز چهار برابر خواهد شد. در این مدل، هر پکیج از چهار هسته GPU تشکیل شده تا چگالی محاسباتی افزایش یابد.
رابط NVLink7 در مدل روبین اولترا شش برابر سریعتر از مدل روبین خواهد بود و قادر به ارائه پهنای باند 1.5 پتابایت بر ثانیه است. همچنین ارتباطات CX9 بین رکها نیز شاهد چهار برابر بهبود در پهنای باند به 115.2 ترابایت بر ثانیه خواهند بود که احتمالاً به دلیل افزایش تعداد لینکها است.
به صورت کلی میتوانیم ارتقاهای صورت گرفته در پردازنده روبین اولترا را به شرح زیر خلاصه کنیم:
- تا 576 پردازنده گرافیکی در هر رک
- 15 اگزافلاپس قدرت استنباطی در FP4
- 5 اگزافلاپس قدرت آموزش در FP8
- استفاده از 4 هسته GPU در هر پکیج برای افزایش چگالی پردازشی
- 365 ترابایت حافظه سریع در هر رک
- استفاده از HBM4e با پهنای باند 4.6 پتابایت بر ثانیه
- هر 4 پردازنده GPU دارای 1 ترابایت حافظه HBM4e
- 100 پتافلاپ توان محاسباتی FP4
- رابط NVLink7، شش برابر سریعتر از مدل روبین با 1.5 پتابایت بر ثانیه پهنای باند
- ارتقاء پهنای باند CX9 بین رکها به 115.2 ترابایت بر ثانیه (4 برابر نسخه قبلی)
آینده پردازندههای انویدیا: معماری فاینمن (Feynman)
انویدیا با معرفی روبین و روبین اولترا، مسیر خود را تا سال 2027 مشخص کرده است، اما این پایان راه نیست. پس از روبین، معماری بعدی انویدیا در مراکز داده با نام فیزیکدان نظری ریچارد فاینمن معرفی خواهد شد.
این نامگذاری نشان میدهد، در صورتی که انویدیا الگوی نامگذاری خود را ادامه دهد، در آینده شاهد پردازندههای فاینمن (Feynman GPUs) و پردازندههای مرکزی ریچارد (Richard CPUs) خواهیم بود.
معماری Feynman نام خود را از ریچارد فاینمن، فیزیکدان نظری برجسته آمریکایی گرفته است که به دلیل نقش کلیدیاش در مکانیک کوانتومی، الکترودینامیک کوانتومی و مدل پارتونی در فیزیک ذرات شناخته میشود. انتخاب این نام نشاندهندهی رویکرد جدید انویدیا در پردازشهای پیشرفتهی هوش مصنوعی است که احتمالاً به روشهای محاسباتی الهامگرفته از فیزیک کوانتومی نزدیکتر خواهد شد.
درحالیکه هنوز اطلاعات خاصی در مورد این معماری عنوان نشده باید گفت که معماری فاینمن احتمالاً یکی از بزرگترین جهشهای انویدیا در حوزه پردازشهای هوش مصنوعی و یادگیری عمیق خواهد بود. استفاده از حافظههای نسل بعدی، بهینهسازی پردازندهی مرکزی و افزایش قدرت پردازشی، آن را به یک راهکار ایدهآل برای مراکز داده و پردازشهای پیچیدهی هوش مصنوعی تبدیل خواهد کرد.
همچنین، اگر انویدیا از مفاهیم الهامگرفته از فیزیک کوانتومی برای افزایش بهرهوری پردازش استفاده کند، میتوان انتظار داشت که معماری فاینمن سرآغاز یک تغییر اساسی در دنیای محاسبات هوش مصنوعی باشد.
source