مدیرعامل انویدیا، جنسن هوانگ، با شروع کنفرانس GTC 2025 روی صحنه آمد تا نسل جدید GPUهای هوش مصنوعی Nvidia B300 Blackwell Ultra را معرفی کند. این پردازنده تا ۵۰ درصد نسبت به نسل قبل سریعتر است و به ۲۸۸ گیگابایت حافظه HBM3e با پهنای باند ۸ ترابایت بر ثانیه مجهز است.
ویژگیهای کلیدی Blackwell Ultra B300
طبق اعلام Nvidia، این GPU برای «عصر استدلال» طراحی شده است که به مدلهای جدید هوش مصنوعی با قابلیت «Test-Time Compute» مانند DeepSeek R1 اشاره دارد. این مدلها قادرند فراتر از تکرار اطلاعات آموزش دیده، پاسخ خروجی خود را بررسی و اصلاح کنند. اما معرفی Blackwell Ultra B300 تنها به یک پردازنده محدود نمیشود؛ بلکه به عنوان بخشی از سیستمهای جدیدی مانند راهکارهای سرور NVL16، ایستگاه DGX GB300 و سیستمهای کامل NV72L عمل میکند.
با تجمیع هشت رَک NV72L، امکان ساخت یک سامانه مجتمع تحت عنوان Blackwell Ultra DGX SuperPOD فراهم میشود که شامل:
- 288 پردازنده Grace
- 576 پردازنده گرافیکی Blackwell Ultra،
- 300 ترابایت حافظه HBM3e،
- و توان پردازشی بالغ بر 11.5 اگزافلاپ برای دادههای FP4 است.
این سیستمها که Nvidia آنها را «کارخانه هوش مصنوعی» مینامد، میتوانند به عنوان زیرساختهای ابررایانهای برای کاربردهای هوش مصنوعی مورد استفاده قرار گیرند.
بهبود در عملکرد و طراحی چیپ
Nvidia اعلام کرده است که GPUهای Blackwell Ultra شامل مدلهای GB300 و B300 از چیپهای متفاوتی نسبت به نسلهای قبلی GB200 و B200 بهره میبرند. این پردازندهها به گونهای طراحی شدهاند تا نیازهای مدلهای هوش مصنوعی استدلالی را با افزایش ۱.۵ برابری عملکرد FP4 برآورده کنند. احتمالاً این امر به معنای استفاده از تراشههای بزرگتر با تعداد هستههای تنسور بیشتر در مدل B300 است.
بهبود عملکرد محاسباتی در B300 نسبت به B200 به وضوح قابل مشاهده است. افزایش ۵۰ درصدی حافظه روی پردازنده، امکان توسعه مدلهای هوش مصنوعی با تعداد پارامترهای بیشتر را فراهم میکند. انویدیا نمونههایی از کارایی این فناوری را ارائه کرده است.
به عنوان مثال، با استفاده از دستورالعملهای FP4 و نرمافزار جدید Dynamo برای اجرای مدلهای استنتاج مانند DeepSeek، یک رَک NV72L میتواند تا ۳۰ برابر عملکرد استنتاج بالاتری نسبت به سختافزار مشابه با معماری Hopper ارائه دهد. در یک مثال دیگر، Blackwell Ultra قادر است تا با مدل DeepSeek R1-671B حداکثر ۱۰۰۰ توکن در ثانیه تولید کند در حالی که Hopper تنها ۱۰۰ توکن در ثانیه ارائه میدهد؛ بدین ترتیب زمان پاسخگویی به یک درخواست بزرگ از ۱.۵ دقیقه به تنها ۱۰ ثانیه کاهش مییابد.
در همین رابطه بخوانید:
– تراشه هوشمصنوعی Blackwell Ultra GB300 با خنک کننده مایع؛ انقلاب دوم سیستم های خنک کننده در راه است؟
زمان عرضه Blackwell Ultra
پیشبینی میشود محصولات مبتنی بر B300 در نیمه دوم سال جاری میلادی به بازار عرضه شوند. با توجه به درآمد ۱۱ میلیارد دلاری حاصل از مدلهای قبلی (B200/B100) در سال مالی گذشته، انتظار میرود Nvidia بتواند با ارائه این فناوری نوین، به طور چشمگیری درآمد خود را در سال آینده افزایش دهد.
source