مدیرعامل انویدیا، جنسن هوانگ، با شروع کنفرانس GTC 2025 روی صحنه آمد تا نسل جدید GPUهای هوش مصنوعی Nvidia B300 Blackwell Ultra را معرفی کند. این پردازنده تا ۵۰ درصد نسبت به نسل قبل سریع‌تر است و به ۲۸۸ گیگابایت حافظه HBM3e با پهنای باند ۸ ترابایت بر ثانیه مجهز است.

ویژگی‌های کلیدی Blackwell Ultra B300

طبق اعلام Nvidia، این GPU برای «عصر استدلال» طراحی شده است که به مدل‌های جدید هوش مصنوعی با قابلیت «Test-Time Compute» مانند DeepSeek R1 اشاره دارد. این مدل‌ها قادرند فراتر از تکرار اطلاعات آموزش دیده، پاسخ خروجی خود را بررسی و اصلاح کنند. اما معرفی Blackwell Ultra B300 تنها به یک پردازنده محدود نمی‌شود؛ بلکه به عنوان بخشی از سیستم‌های جدیدی مانند راهکارهای سرور NVL16، ایستگاه DGX GB300 و سیستم‌های کامل NV72L عمل می‌کند.

blackwell-ultra-2.jpg

با تجمیع هشت رَک NV72L، امکان ساخت یک سامانه مجتمع تحت عنوان Blackwell Ultra DGX SuperPOD فراهم می‌شود که شامل:

  • 288 پردازنده Grace
  • 576 پردازنده گرافیکی Blackwell Ultra،
  • 300 ترابایت حافظه HBM3e،
  • و توان پردازشی بالغ بر 11.5 اگزافلاپ برای داده‌های FP4 است.

این سیستم‌ها که Nvidia آن‌ها را «کارخانه‌ هوش مصنوعی» می‌نامد، می‌توانند به عنوان زیرساخت‌های ابررایانه‌ای برای کاربردهای هوش مصنوعی مورد استفاده قرار گیرند.

بهبود در عملکرد و طراحی چیپ

Nvidia اعلام کرده است که GPUهای Blackwell Ultra شامل مدل‌های GB300 و B300 از چیپ‌های متفاوتی نسبت به نسل‌های قبلی GB200 و B200 بهره می‌برند. این پردازنده‌ها به گونه‌ای طراحی شده‌اند تا نیازهای مدل‌های هوش مصنوعی استدلالی را با افزایش ۱.۵ برابری عملکرد FP4 برآورده کنند. احتمالاً این امر به معنای استفاده از تراشه‌های بزرگتر با تعداد هسته‌های تنسور بیشتر در مدل B300 است.

blackwell-ultra-2.jpg

بهبود عملکرد محاسباتی در B300 نسبت به B200 به وضوح قابل مشاهده است. افزایش ۵۰ درصدی حافظه روی پردازنده، امکان توسعه مدل‌های هوش مصنوعی با تعداد پارامترهای بیشتر را فراهم می‌کند. انویدیا نمونه‌هایی از کارایی این فناوری را ارائه کرده است.

به عنوان مثال، با استفاده از دستورالعمل‌های FP4 و نرم‌افزار جدید Dynamo برای اجرای مدل‌های استنتاج مانند DeepSeek، یک رَک NV72L می‌تواند تا ۳۰ برابر عملکرد استنتاج بالاتری نسبت به سخت‌افزار مشابه با معماری Hopper ارائه دهد. در یک مثال دیگر، Blackwell Ultra قادر است تا با مدل DeepSeek R1-671B حداکثر ۱۰۰۰ توکن در ثانیه تولید کند در حالی که Hopper تنها ۱۰۰ توکن در ثانیه ارائه می‌دهد؛ بدین ترتیب زمان پاسخگویی به یک درخواست بزرگ از ۱.۵ دقیقه به تنها ۱۰ ثانیه کاهش می‌یابد.

در همین رابطه بخوانید:

– تراشه هوش‌مصنوعی Blackwell Ultra GB300 با خنک کننده مایع؛ انقلاب دوم سیستم‌ های خنک کننده در راه است؟

زمان عرضه Blackwell Ultra

پیش‌بینی می‌شود محصولات مبتنی بر B300 در نیمه دوم سال جاری میلادی به بازار عرضه شوند. با توجه به درآمد ۱۱ میلیارد دلاری حاصل از مدل‌های قبلی (B200/B100) در سال مالی گذشته، انتظار می‌رود Nvidia بتواند با ارائه این فناوری نوین، به طور چشمگیری درآمد خود را در سال آینده افزایش دهد.

source

توسط siahnet.ir