انویدیا در کنفرانس GTC 2025، نسل آینده پردازنده‌های گرافیکی مراکز داده خود را معرفی کرد. این شرکت با رونمایی از پلتفرم روبین (Rubin) و روبین اولترا (Rubin Ultra)، چشم‌انداز خود را برای سال‌های 2026 و 2027 مشخص کرد. در ادامه با همه مشخصات فنی و پتانسیل‌های عظیم این پردازنده‌های گرافیکی و همچنین پردازنده VERA آشنا شوید.

در کنفرانس GTC 2025، جنسن هوانگ، مدیرعامل شرکت انویدیا، به‌روزرسانی جدیدی از نقشه راه پردازنده‌های گرافیکی مراکز داده این شرکت برای سال‌های 2026 و 2027 را ارائه کرد. او از پلتفرم روبین، که به‌زودی در نیمه دوم سال 2025 وارد بازار خواهد شد، و روبین اولترا، که در نیمه دوم 2027 معرفی خواهد شد، پرده برداشت.

این معرفی‌ها در حالی صورت می‌گیرد که انویدیا هنوز تولید کامل پردازنده گرافیکی Blackwell B200 را به پایان نرسانده و پردازنده B300 را برای نیمه دوم سال 2025 آماده کرده است، اما هم‌زمان با این پیشرفت‌ها، شرکت نگاهی به آینده دارد و در تلاش است تا همکاران خود را برای گذار به نسل‌های جدیدتر آماده کند.

در همین رابطه بخوانید:

– غول‌ پردازشی Blackwell Ultra B300 معرفی شد؛ 288 گیگابایت حافظه HBM3e و 15 پتافلاپ عملکرد FP4

نقشه راه پردازنده های انویدیا
نقشه راه پردازنده های انویدیا

تحول در نام‌گذاری و توپولوژی NVLink

یکی از نکات مهمی که در این کنفرانس مطرح شد، اصلاح نحوه نام‌گذاری پردازنده‌های گرافیکی بود.

نام‌گذاری Blackwell اشتباه بود

در بخش‌های ابتدایی این نطق، جنسن هوانگ، مدیرعامل انویدیا، توضیح داد که Blackwell B200 در واقع دارای دو هسته (die) در هر GPU است که باعث تغییر در توپولوژی NVLink می‌شود. بنابراین، اگرچه این پردازنده در ابتدا Blackwell B200 NVL72 نام‌گذاری شده بود، اما بهتر بود با نام NV144L معرفی می‌شد. این تغییر در نام‌گذاری در پردازنده‌های روبین نیز اعمال خواهد شد.

nvl72.webp

مشخصات پردازنده‌های روبین (Rubin NVL144)

طبق اعلام انویدیا پردازنده Rubin NVL144 جایگزین مدل Blackwell NVL72 خواهد شد و به‌طور کامل با زیرساخت‌های فعلی سازگار خواهد بود.

بهبود چشمگیر در عملکرد محاسباتی

در اولین نمودار منتشر شده توسط هوانگ، اطلاعات مربوط به مدل روبین NVL144 نمایش داده شد که به‌طور کامل با زیرساخت‌های موجود Blackwell NVL72 سازگار است. پردازنده B300 NVL72 توان محاسباتی 1.1 پتافلاپس در محاسبات FP4 فشرده ارائه می‌دهد، در حالی که مدل روبین NVL144 با همان 144 هسته GPU، توان محاسباتی 3.6 پتافلاپس در FP4 را ارائه خواهد داد.

nvl144.webp

به صورت کلی می‌توان ارتقاهای ایجاد شده در این نسل را به صورت زیر عنوان و خلاصه کرد:

  • 3.6 پتافلاپس قدرت پردازشی در FP4 (در مقابل 1.1 پتافلاپس در Blackwell B300 NVL72)
  • 1.2 اگزافلاپس توانایی پردازشی در آموزش FP8 (در مقایسه با 0.36 اگزافلاپس در B300)
  • بهبود 3.3 برابری در عملکرد محاسباتی نسبت به نسل قبل

ارتقاء حافظه و ارتباطات بین‌پردازشی

روبین به عنوان نقطه عطفی در انتقال از حافظه HBM3/HBM3e به HBM4 نیز تلقی خواهد شد. ظرفیت حافظه همچنان 288 گیگابایت به ازای هر GPU خواهد بود، مشابه B300، اما پهنای باند از 8 ترابایت بر ثانیه به 13 ترابایت بر ثانیه افزایش خواهد یافت. انویدیا اعلام کرده که حافظه HBM4e برای مدل روبین اولترا مورد استفاده قرار خواهد گرفت.

نکته دیگر این است که پیوند NVLink سریع‌تری نیز توسط تیم سبز ارائه خواهد شد که از پهنای باند 260 ترابایت بر ثانیه برخوردار خواهد بود. مضاف بر این یک لینک جدید CX9 بین رک‌ها با پهنای باند 28.8 ترابایت بر ثانیه نیز به خدمت گرفته می‌شود، که ظرفیت پهنای باند آن دو برابر پهنای باند B300 و CX8 خواهد بود.

با توجه به موارد فوق می‌توان گفت که اهم ارتقاهای ایجاد شده حافظه در روبین به شرح زیر خواهند بود:

  • گذار از HBM3/HBM3e به HBM4
  • استفاده از HBM4e در نسخه روبین اولترا
  • افزایش پهنای باند حافظه از 8 ترابایت بر ثانیه به 13 ترابایت بر ثانیه
  • استفاده از NVLink جدید با دو برابر پهنای باند (260 ترابایت بر ثانیه)
  • معرفی لینک CX9 بین رک‌ها با پهنای باند 28.8 ترابایت بر ثانیه (2 برابر CX8)

پردازنده مرکزی ورا (Vera CPU): قدرتی جدید در معماری پردازشی انویدیا

با معرفی نسل جدید پردازنده‌های گرافیکی روبین، انویدیا پردازنده مرکزی جدید خود را نیز به نام ورا (Vera CPU) معرفی کرد که جایگزین پردازنده‌های Grace خواهد شد. این پردازنده که بر اساس معماری ARM سفارشی‌شده توسعه یافته، با هدف ارائه عملکرد بهینه در پردازش‌های مراکز داده و هوش مصنوعی طراحی شده است.

ورا از 88 هسته پردازشی و 176 رشته موازی بهره می‌برد که امکان پردازش حجم عظیمی از داده‌ها را با کمترین تأخیر فراهم می‌کند. همچنین، این پردازنده برای ارتباط مستقیم و بدون وقفه با پردازنده‌های گرافیکی روبین، به یک رابط NVLink با پهنای باند 1.8 ترابایت بر ثانیه مجهز شده است که تعامل بین GPU و CPU را به سطح جدیدی ارتقا می‌دهد.

در کنار این مشخصات، ورا بهینه‌سازی‌های خاصی برای پردازش‌های مبتنی بر هوش مصنوعی و یادگیری عمیق دارد که آن را به گزینه‌ای ایده‌آل برای مراکز داده تبدیل می‌کند. با ترکیب ورا و روبین، انویدیا در تلاش است یک اکوسیستم پردازشی کاملاً هماهنگ و یکپارچه ایجاد کند که نه‌تنها قدرت پردازشی را به حداکثر برساند، بلکه مصرف انرژی و بازدهی کلی سیستم را نیز بهینه کند.

این پردازنده، علاوه بر پشتیبانی از حافظه‌های پرسرعت HBM، با فناوری‌های جدید ارتباطی و شبکه‌ای ترکیب شده تا عملکردی پایدار و مقیاس‌پذیر در بارهای پردازشی سنگین ارائه دهد. ورا تنها یک پردازنده مرکزی نیست؛ بلکه هسته‌ای کلیدی در نسل جدید پردازش‌های انویدیا خواهد بود.

مشخصات پردازنده‌های روبین اولترا (Rubin Ultra NVL576)

بخش مهم و جذاب دیگر این مراسم معرفی پردازنده‌های روبین اولترا بود که طبق اعلام شرکت، در نیمه دوم سال 2027 وارد بازار خواهد شد. در این مدل، پردازنده ورا همچنان باقی خواهد ماند، اما از نظر پردازش گرافیکی، تغییرات بزرگی را تجربه خواهیم کرد. آرایش جدیدی در رک‌ها جایگزین خواهد شد که به نام NVL576 شناخته می‌شود. این مدل قادر خواهد بود تا 576 پردازنده گرافیکی را در یک رک جای دهد که مصرف توان آن هنوز مشخص نشده است.

nvl576.webp

افزایش تعداد GPU، حافظه و پهنای باند

در حالی که مدل روبین NVL144 دارای 75 ترابایت حافظه سریع (برای هر دو پردازنده CPU و GPU) در هر رک است، مدل روبین اولترا NVL576 دارای 365 ترابایت حافظه خواهد بود. پردازنده‌های گرافیکی این مدل از حافظه HBM4e بهره خواهند برد، اما جالب اینجاست که انویدیا پهنای باند 4.6 پتابایت بر ثانیه برای حافظه HBM4e را اعلام کرده است، که در مجموع با 576 پردازنده گرافیکی، این مقدار به 8 ترابایت بر ثانیه برای هر GPU می‌رسد.

نکته مهمی که باید در اینجا به آن اشاره کنیم این است که به نظر می‌رسد پهنای باند اعلامی برای روبین اولترا کمتر از مدل‌های قبلی باشد، اما احتمالاً این شرایط به نحوه اتصال چهار هسته GPU در هر پکیج مرتبط است. همچنین هر چهار پردازنده GPU در هر رک دارای 1 ترابایت حافظه HBM4e خواهند بود و قادر به انجام 100 پتافلاپ محاسبات FP4 خواهند بود.

عملکرد استنباط (inference) در FP4 به 15 اگزافلاپس خواهد رسید، در حالی که محاسبات آموزش FP8 به 5 اگزافلاپس افزایش خواهد یافت. این رقم تقریبا چهار برابر ظرفیت محاسباتی روبین NVL144 است که منطقی است چرا که تعداد پردازنده‌های گرافیکی نیز چهار برابر خواهد شد. در این مدل، هر پکیج از چهار هسته GPU تشکیل شده تا چگالی محاسباتی افزایش یابد.

رابط NVLink7 در مدل روبین اولترا شش برابر سریع‌تر از مدل روبین خواهد بود و قادر به ارائه پهنای باند 1.5 پتابایت بر ثانیه است. همچنین ارتباطات CX9 بین رک‌ها نیز شاهد چهار برابر بهبود در پهنای باند به 115.2 ترابایت بر ثانیه خواهند بود که احتمالاً به دلیل افزایش تعداد لینک‌ها است.

به صورت کلی می‌توانیم ارتقاهای صورت گرفته در پردازنده روبین اولترا را به شرح زیر خلاصه کنیم:

  • تا 576 پردازنده گرافیکی در هر رک
  • 15 اگزافلاپس قدرت استنباطی در FP4
  • 5 اگزافلاپس قدرت آموزش در FP8
  • استفاده از 4 هسته GPU در هر پکیج برای افزایش چگالی پردازشی
  • 365 ترابایت حافظه سریع در هر رک
  • استفاده از HBM4e با پهنای باند 4.6 پتابایت بر ثانیه
  • هر 4 پردازنده GPU دارای 1 ترابایت حافظه HBM4e
  • 100 پتافلاپ توان محاسباتی FP4
  • رابط NVLink7، شش برابر سریع‌تر از مدل روبین با 1.5 پتابایت بر ثانیه پهنای باند
  • ارتقاء پهنای باند CX9 بین رک‌ها به 115.2 ترابایت بر ثانیه (4 برابر نسخه قبلی)

آینده پردازنده‌های انویدیا: معماری فاینمن (Feynman)

انویدیا با معرفی روبین و روبین اولترا، مسیر خود را تا سال 2027 مشخص کرده است، اما این پایان راه نیست. پس از روبین، معماری بعدی انویدیا در مراکز داده با نام فیزیکدان نظری ریچارد فاینمن معرفی خواهد شد.

feynman.webp

این نام‌گذاری نشان می‌دهد، در صورتی که انویدیا الگوی نام‌گذاری خود را ادامه دهد، در آینده شاهد پردازنده‌های فاینمن (Feynman GPUs) و پردازنده‌های مرکزی ریچارد (Richard CPUs) خواهیم بود.

معماری Feynman نام خود را از ریچارد فاینمن، فیزیکدان نظری برجسته آمریکایی گرفته است که به دلیل نقش کلیدی‌اش در مکانیک کوانتومی، الکترودینامیک کوانتومی و مدل پارتونی در فیزیک ذرات شناخته می‌شود. انتخاب این نام نشان‌دهنده‌ی رویکرد جدید انویدیا در پردازش‌های پیشرفته‌ی هوش مصنوعی است که احتمالاً به روش‌های محاسباتی الهام‌گرفته از فیزیک کوانتومی نزدیک‌تر خواهد شد.

درحالیکه هنوز اطلاعات خاصی در مورد این معماری عنوان نشده باید گفت که معماری فاینمن احتمالاً یکی از بزرگ‌ترین جهش‌های انویدیا در حوزه پردازش‌های هوش مصنوعی و یادگیری عمیق خواهد بود. استفاده از حافظه‌های نسل بعدی، بهینه‌سازی پردازنده‌ی مرکزی و افزایش قدرت پردازشی، آن را به یک راهکار ایده‌آل برای مراکز داده و پردازش‌های پیچیده‌ی هوش مصنوعی تبدیل خواهد کرد.

همچنین، اگر انویدیا از مفاهیم الهام‌گرفته از فیزیک کوانتومی برای افزایش بهره‌وری پردازش استفاده کند، می‌توان انتظار داشت که معماری فاینمن سرآغاز یک تغییر اساسی در دنیای محاسبات هوش مصنوعی باشد.

source

توسط siahnet.ir