اینتل اولین آپدیت بزرگ Project Battlematrix را برای کارت‌های حرفه‌ای Arc Pro منتشر کرده است. LLM Scaler 1.0 که تمرکزش روی اجرای سریع‌تر مدل‌های هوش مصنوعی است و می‌تواند با بهینه سازی چند GPU، کارایی این کارت گرافیک‌ها را تا 80 درصد افزایش دهد.

آپدیتی که کارت گرافیک‌های Arc Pro را تا 80 درصد قدرتمندتر می‌کند!

اینتل اولین آپدیت بزرگ Project Battlematrix (پلتفرم نرم‌افزاری تخصصی اینتل) را برای کارت‌های گرافیک حرفه‌ای Arc Pro منتشر کرده و نام این نسخه را LLM Scaler 1.0. گذاشته است. این آپدیت دقیقا همان چیزی است که اینتل در کامپیوتکس 2025 وعده داده بود و حالا بالاخره آن را منتشر کرده است.

Project Battlematrix مروری بر و آپدیت جدید آن

اینتل این پلتفرم را تحت عنوان یک “پلتفرم همه کاره” برای اجرای مدل‌های بزرگ هوش مصنوعی (LLM) روی سیستم‌هایی با چند کارت Arc Pro معرفی کرد. ایده هم این بود که همه چیز از هماهنگی بین GPUها گرفته تا بهینه‌سازی انتقال داده و مانیتورینگ یکجا در یک پلتفرم فراهم شوند تا کاربر بتواند مدل‌های سنگین را راحت‌تر اجرا کند.

آپدیت Project Battlematrix

حالا آپدیت جدید این پلتفرم به نام LLM Scaler 1.0 منتشر شده که می‌تواند با بهینه‌سازی چند GPU و استفاده از PCIe P2P برای انتقال مستقیم داده بین کارت‌ها، کارایی را تا 80 درصد بیشتر کند. احتمالا نکاتی در مورد این آپدیت جدید برای شما هم جالب باشد.

زمانی که چند کارت گرافیک در یک سیستم استفاده می‌شوند، لازم است داده‌ها بینشان جابه‌جا شود، تا قبل از این، داده‌ها باید از کارت گرافیک به پردازنده می‌رفتند و از پردازنده دوباره به کارت گرافیک بعدی منتقل می‌شوند. حالا با فناوری Peer-to-Peer PCIe داده مستقیم بین کارت‌ها رد و بدل می‌شود و نتیجه آن هم سرعت بیشتر است.

با این آپدیت سرعت پردازش ورودی‌های چندهزار توکنی تا 4.2 برابر سریع‌تر شود. در واقع مدل‌های بسیار بزرگ مانند مدل‌های زبانی با 70 میلیارد پارامتر، زمانی که دستور ورودی خیلی طولانی دریافت می‌کنند، معمولا کند می‌شوند. اما آپدیت جدید اینتل سرعت این پردازش را تا 4.2 برابر بیشتر می‌کند.

سرعت خروجی روی مدل‌های 8B تا 32B تا 10 درصد بیشتر می‌شود. این یعنی پاسخ مدل سریع‌تر تولید می‌شود.

در مشخصات منتشر شده از آپدیت جدید، کوانتیزیشن لایه به لایه هم دیده می‌شود، کوانتیزیشن به معنی کاهش دقت اعداد برای کم کردن حجم داده است. حالا نسخه جدید به صورت لایه به لایه این کار را انجام می‌دهد تا مصرف حافظه GPU پایین بیاید آن هم در حالی که افت کیفیتی در کار نیست.

آپدیت کارت گرافیک‌های Arc Pro

قابلیت‌های جدیدتری مانند Pipeline Parallelism برای تقسیم مدل به بخش‌های مختلف روی GPUها، torch.compile و Speculative Decoding برای پیشبینی بخش‌های بعدی خروجی هم در آپدیت جدید دیده می‌شوند. علاوه بر این‌ها پشتیبانی از Embedding (تبدیل متن، تصویر یا صدا به بردارهای عددی) و Multi-modal (پردازش همزمان چند نوع ورودی) هم اضافه شده است.

در نهایت ابزارهای مدیریتی جدید مانند مانیتور مصرف برق GPU، آپدیت فریمور از راه دور، تست پهنای باند حافظه کارت گرافیک و ابزارهای عیب یابی سلامت GPU هم در این آپدیت دیده می‌شوند.

در همین رابطه بخوانید:

– این آپدیت اینتل، عمر باتری و سرعت ویندوز 11 شما را متحول می‌کند!

– اورکلاک دیوانه‌وار کارت گرافیک RTX 5090 بدون استفاده از واترکولر

اما چرا این آپدیت برای اینتل اهمیت دارد؟

کارت گرافیک‌های Arc Pro در بازار ورک استیشن‌ها رقابت سختی با انویدیا و AMD دارند. این آپدیت جدید اما نشان می‌دهد که اینتل قصد دارد سهم قابل توجهی از بازار پردازش مدل‌های بزرگ هوش مصنوعی را به خودش اختصاص دهد. بهبود عملکرد تا 80 درصد با چند کارت گرافیک یعن شرکت‌ها می‌توانند با سخت افزار کمتر یا هزینه پایین‌تر، خروجی بیشتری بگیرند.

به گفته اینتل، این نسخه در حال حاضر برای لینوکس آماده شده و قرار است به زودی نسخه جدیدی با پایداری و عملکرد بهتر منتشر شود.

source

توسط siahnet.ir