اینتل اولین آپدیت بزرگ Project Battlematrix را برای کارتهای حرفهای Arc Pro منتشر کرده است. LLM Scaler 1.0 که تمرکزش روی اجرای سریعتر مدلهای هوش مصنوعی است و میتواند با بهینه سازی چند GPU، کارایی این کارت گرافیکها را تا 80 درصد افزایش دهد.
آپدیتی که کارت گرافیکهای Arc Pro را تا 80 درصد قدرتمندتر میکند!
اینتل اولین آپدیت بزرگ Project Battlematrix (پلتفرم نرمافزاری تخصصی اینتل) را برای کارتهای گرافیک حرفهای Arc Pro منتشر کرده و نام این نسخه را LLM Scaler 1.0. گذاشته است. این آپدیت دقیقا همان چیزی است که اینتل در کامپیوتکس 2025 وعده داده بود و حالا بالاخره آن را منتشر کرده است.
Project Battlematrix مروری بر و آپدیت جدید آن
اینتل این پلتفرم را تحت عنوان یک “پلتفرم همه کاره” برای اجرای مدلهای بزرگ هوش مصنوعی (LLM) روی سیستمهایی با چند کارت Arc Pro معرفی کرد. ایده هم این بود که همه چیز از هماهنگی بین GPUها گرفته تا بهینهسازی انتقال داده و مانیتورینگ یکجا در یک پلتفرم فراهم شوند تا کاربر بتواند مدلهای سنگین را راحتتر اجرا کند.
حالا آپدیت جدید این پلتفرم به نام LLM Scaler 1.0 منتشر شده که میتواند با بهینهسازی چند GPU و استفاده از PCIe P2P برای انتقال مستقیم داده بین کارتها، کارایی را تا 80 درصد بیشتر کند. احتمالا نکاتی در مورد این آپدیت جدید برای شما هم جالب باشد.
زمانی که چند کارت گرافیک در یک سیستم استفاده میشوند، لازم است دادهها بینشان جابهجا شود، تا قبل از این، دادهها باید از کارت گرافیک به پردازنده میرفتند و از پردازنده دوباره به کارت گرافیک بعدی منتقل میشوند. حالا با فناوری Peer-to-Peer PCIe داده مستقیم بین کارتها رد و بدل میشود و نتیجه آن هم سرعت بیشتر است.
با این آپدیت سرعت پردازش ورودیهای چندهزار توکنی تا 4.2 برابر سریعتر شود. در واقع مدلهای بسیار بزرگ مانند مدلهای زبانی با 70 میلیارد پارامتر، زمانی که دستور ورودی خیلی طولانی دریافت میکنند، معمولا کند میشوند. اما آپدیت جدید اینتل سرعت این پردازش را تا 4.2 برابر بیشتر میکند.
سرعت خروجی روی مدلهای 8B تا 32B تا 10 درصد بیشتر میشود. این یعنی پاسخ مدل سریعتر تولید میشود.
در مشخصات منتشر شده از آپدیت جدید، کوانتیزیشن لایه به لایه هم دیده میشود، کوانتیزیشن به معنی کاهش دقت اعداد برای کم کردن حجم داده است. حالا نسخه جدید به صورت لایه به لایه این کار را انجام میدهد تا مصرف حافظه GPU پایین بیاید آن هم در حالی که افت کیفیتی در کار نیست.
قابلیتهای جدیدتری مانند Pipeline Parallelism برای تقسیم مدل به بخشهای مختلف روی GPUها، torch.compile و Speculative Decoding برای پیشبینی بخشهای بعدی خروجی هم در آپدیت جدید دیده میشوند. علاوه بر اینها پشتیبانی از Embedding (تبدیل متن، تصویر یا صدا به بردارهای عددی) و Multi-modal (پردازش همزمان چند نوع ورودی) هم اضافه شده است.
در نهایت ابزارهای مدیریتی جدید مانند مانیتور مصرف برق GPU، آپدیت فریمور از راه دور، تست پهنای باند حافظه کارت گرافیک و ابزارهای عیب یابی سلامت GPU هم در این آپدیت دیده میشوند.
در همین رابطه بخوانید:
– این آپدیت اینتل، عمر باتری و سرعت ویندوز 11 شما را متحول میکند!
– اورکلاک دیوانهوار کارت گرافیک RTX 5090 بدون استفاده از واترکولر
اما چرا این آپدیت برای اینتل اهمیت دارد؟
کارت گرافیکهای Arc Pro در بازار ورک استیشنها رقابت سختی با انویدیا و AMD دارند. این آپدیت جدید اما نشان میدهد که اینتل قصد دارد سهم قابل توجهی از بازار پردازش مدلهای بزرگ هوش مصنوعی را به خودش اختصاص دهد. بهبود عملکرد تا 80 درصد با چند کارت گرافیک یعن شرکتها میتوانند با سخت افزار کمتر یا هزینه پایینتر، خروجی بیشتری بگیرند.
به گفته اینتل، این نسخه در حال حاضر برای لینوکس آماده شده و قرار است به زودی نسخه جدیدی با پایداری و عملکرد بهتر منتشر شود.
source