در حالی که مصرف برق سرسامآور شتاب دهندههای انویدیا در پردازش مدلهای هوش مصنوعی به یک چالش جهانی تبدیل شده، شرکت نوپای Positron با معرفی شتابدهندههای Atlas ادعا میکند که عملکرد بسیار بهتری از انویدیا ارائه میدهد. آن هم تنها با یک سوم مصرف برق این پردازندهها. حالا باید دید ادعای این شرکت چقدر صحیح است و آیا Positron میتواند انحصال انویدیا را در بازار به چالش بکشد.
شتابدهنده Atlas، زنگ خطری برای انویدیا؟
شرکت Positron AI یک استارتاپ نوپای آمریکایی است که کمتر از دو سال از تاسیس آن میگذرد و حالا ادعا میکند که شتابدهنده جدیدش به نام Atlas میتواند عملکرد بسیار بهتری نسبت به مدلهای انویدیا داشته باشد و حتی مصرف برق را تا یک سوم کاهش دهد.
اینطور که این شرکت ادعا میکند، در حالی که یک سرور مبتنی بر 8 کارت H200 انویدیا حدود 5900 وات انرژی مصرف میکند. مدلهای Atlas همین کار را با حدود 2000 وات مصرف برق انجام میدهند. اگر این ادعا درست باشد، انویدیا رقیب بسیار سرسختی پیدا کرده است.
Atlas دقیقاً چیست؟
به گفته tomshardware، اطلس یک سیستم شتاب دهنده است که از 8 تراشه خاص به نام Archer تشکیل شده است. این تراشهها برای اجرای مدلهای هوش مصنوعی طراحی شدهاند و برای کاربردهای دیگر مانند آموزش مدل یا محاسبات، چندان مناسب نیستند. این یعنی برخلاف کارتهای همه کاره انویدیا، اطلس فقط روی اجرای سریعتر و کممصرفتر مدلهای هوش مصنوعی تمرکز کرده است.
در یکی از تستهایی که خود شرکت Positron انجام داده است، شتاب دهنده اطلس موفق شده مدل Llama 3.1 8B را با سرعت 280 توکن بر ثانیه برای هر کاربر اجرا کند، در حالی که مدل H200 سرعت 180 توکن بر ثانیه دارد و البته سه برابر مصرف برق بیشتر. اگر نمیدانید، توکن برثانیه واحدی برای سنجش سرعت پاسخگویی کلامی مدل به کاربران است.
از طرفی مصرف برق دیتاسنترها حالا یک چالش بزرگ جهانی است و پردازش مدلهای هوش مصنوعی آنقدر برق مصرف میکند که برخی سرورها به اندازه مصرف برق یک شهر کوچک، توان مصرفی دارند. به همین خاطر هم توسعه مدلهای هوش مصنوعی با این حجم از مصرف برق یک مشکل بزرگ است.
شرکت Cloudflare با توجه به این مشکلات تصمیم گرفته شتابدهنده شرکت Positron را امتحان کند و اگر این مدلها بتوانند طبق گفته Positron به همین خوبی عمل کنند، زنگ خطر برای انویدیا به صدا درآمده است.
Positron تراشههای خود را در کارخانه TSMC در آریزونا تولید میکند و کارتها هم در خاک آمریکا مونتاژ میشوند. با این حال چون اطلس از حافظه پیشرفته HBM استفاده میکند، فرآیند بسته بندی تراشه احتمالا در تایوان خواهد بود.
قدم بعدی چیست؟
Positron در حال کار روی نسل دوم شتاب دهندههای خود به نام Asimov است که قرار است در سال 2026 معرفی شود. این سیستم از حافظه 2 ترابایتی و پهنای باند شبکهای 16 ترابیت بر ثانیه استفاده میکند و امکان اجرای مدلهایی تا 16 میلیون پارامتر را فراهم میکند. با این توصیفات، اگر این شرکت بتواند به گفتههای خود عمل کند و ادعاهای آن در تستهای مستقل هم تایید شود، انحصار انویدیا در خطر جدی قرار دارد.
source