در حالی که مصرف برق سرسام‌آور شتاب دهنده‌های انویدیا در پردازش مدل‌های هوش مصنوعی به یک چالش جهانی تبدیل شده، شرکت نوپای Positron با معرفی شتاب‌دهنده‌های Atlas ادعا می‌کند که عملکرد بسیار بهتری از انویدیا ارائه می‌دهد. آن هم تنها با یک سوم مصرف برق این پردازنده‌ها. حالا باید دید ادعای این شرکت چقدر صحیح است و آیا Positron می‌تواند انحصال انویدیا را در بازار به چالش بکشد.

شتاب‌دهنده Atlas، زنگ خطری برای انویدیا؟

شرکت Positron AI یک استارتاپ نوپای آمریکایی است که کمتر از دو سال از تاسیس آن می‌گذرد و حالا ادعا می‌کند که شتاب‌دهنده جدیدش به نام Atlas می‌تواند عملکرد بسیار بهتری نسبت به مدل‌های انویدیا داشته باشد و حتی مصرف برق را تا یک سوم کاهش دهد.

اینطور که این شرکت ادعا می‌کند، در حالی که یک سرور مبتنی بر 8 کارت H200 انویدیا حدود 5900 وات انرژی مصرف می‌کند. مدلهای Atlas همین کار را با حدود 2000 وات مصرف برق انجام می‌دهند. اگر این ادعا درست باشد، انویدیا رقیب بسیار سرسختی پیدا کرده است.

 

شتابدهنده های atlas

Atlas دقیقاً چیست؟

به گفته tomshardware، اطلس یک سیستم شتاب دهنده است که از 8 تراشه خاص به نام Archer تشکیل شده است. این تراشه‌ها برای اجرای مدل‌های هوش مصنوعی طراحی شده‌اند و برای کاربردهای دیگر مانند آموزش مدل یا محاسبات، چندان مناسب نیستند. این یعنی برخلاف کارت‌های همه کاره انویدیا، اطلس فقط روی اجرای سریع‌تر و کم‌مصرف‌تر مدل‌های هوش مصنوعی تمرکز کرده است.

در یکی از تست‌هایی که خود شرکت Positron انجام داده است، شتاب دهنده اطلس موفق شده مدل Llama 3.1 8B را با سرعت 280 توکن بر ثانیه برای هر کاربر اجرا کند، در حالی که مدل H200 سرعت 180 توکن بر ثانیه دارد و البته سه برابر مصرف برق بیشتر. اگر نمی‌دانید، توکن برثانیه واحدی برای سنجش سرعت پاسخگویی کلامی مدل به کاربران است.

از طرفی مصرف برق دیتاسنترها حالا یک چالش بزرگ جهانی است و پردازش مدل‌های هوش مصنوعی آنقدر برق مصرف می‌کند که برخی سرورها به اندازه مصرف برق یک شهر کوچک، توان مصرفی دارند. به همین خاطر هم توسعه مدل‌های هوش مصنوعی با این حجم از مصرف برق یک مشکل بزرگ است.

شرکت Cloudflare با توجه به این مشکلات تصمیم گرفته شتابدهنده شرکت Positron را امتحان کند و اگر این مدل‌ها بتوانند طبق گفته Positron به همین خوبی عمل کنند، زنگ خطر برای انویدیا به صدا درآمده است.

Positron تراشه‌های خود را در کارخانه TSMC در آریزونا تولید می‌کند و کارت‌ها هم در خاک آمریکا مونتاژ می‌شوند. با این حال چون اطلس از حافظه پیشرفته HBM استفاده می‌کند، فرآیند بسته بندی تراشه احتمالا در تایوان خواهد بود.

قدم بعدی چیست؟

Positron در حال کار روی نسل دوم شتاب دهنده‌های خود به نام Asimov است که قرار است در سال 2026 معرفی شود. این سیستم از حافظه 2 ترابایتی و پهنای باند شبکه‌ای 16 ترابیت بر ثانیه استفاده می‌کند و امکان اجرای مدل‌هایی تا 16 میلیون پارامتر را فراهم می‌کند. با این توصیفات، اگر این شرکت بتواند به گفته‌های خود عمل کند و ادعاهای آن در تست‌های مستقل هم تایید شود، انحصار انویدیا در خطر جدی قرار دارد.

source

توسط siahnet.ir