طبق گزارشهای منتشر شده، دو کارت گرافیک پرچمدار انویدیا یعنی RTX 5090 و RTX PRO 6000 دچار باگ عجیبی شدهاند. این کارتها پس از چند روز استفاده در ماشین مجازی VM به طور کامل از کار میافتند و تنها راه بازیابی آنها، ریست کامل سیستم است. انویدیا اعلام کرده به دنبال بازتولید این باگ است و به زودی آن را اصلاح خواهد کرد.
باگ خطرناک پرچمداران انویدیا
در حالی که کارت گرافیکهای RTX 5090 و RTX PRO 6000 به عنوان قدرتمندترین محصولات انویدیا از نسل بلک ول شناخته میشوند، حالا گزارشهایی منتشر شده مبنی بر اینکه این کارتها در شرایط مجازیسازی دچار باگ میشوند.
به گزارش wccftech، شرکت CloudRift که خدمات GPU ابری را برای توسعه دهندگان ارائه میدهد، اولین شرکتی بود که این مشکل را گزارش کرد. طبق اعلام آنها، زمانی که GPUهای انویدیا در یک ماشین مجازی از طریق درایور VFIO استفاده میشود و بعد تحت عملیات Function Level Reset قرار میگیرد، کارت گرافیک کاملا قفل میکند و دیگر هیچ پاسخی نمیدهد. این اتفاق باعث قفل نرم افزاری یا Soft Lock میشود که در آن نه میزبان و نه کلاینت نمیتوانند پردازش را کنترل کنند و آن را ادامه دهند.
چنین اتفاقاتی برای دیتاسنترها یا پلتفرمهای ابری تقریبا یک فاجعه است چرا که برای رفع آن باید کل سرور را ریبوت کنند.
در حال حاضر فقط دو کارت RTX 5090 و PRO 6000 با این باگ مواجه هستند، یعنی کارتهایی مانند RTX 4090، Hopper H100 و حتی Blackwell B200 در حال حاضر بدون مشکل کار میکنند. برخی کارشناسان میگویند ریشه مشکل احتمالا مربوط به سخت افزار و فریمور در این دو نسخه خاص است.
در همین رابطه بخوانید:
– نسخه دستکاریشده RTX 5090 با حافظه 128 گیگابایت ساخته شد؛ البته با قیمت 6 برابر نسخه اصلی!
– سلطه بیچونوچرای انویدیا بر بازار کارت گرافیک؛ سهم قطره چکانی AMD و غیبت اینتل
ضمنا ماجرا فقط مربوط به CloudRift نیست. یکی از کاربران پلتفرم Proxmox هم گزارش داده که پس از خاموش کردن ماشین مجازی ویندوز، کل سیستم دچار مشکل شده است. خوشبختانه انویدیا به این اتفاقات واکنش داده و اعلام کرده که موفق به بازتولید مشکل شده تا بتواند روی اصلاح آن کار کند.
جایزه 1000 دلاری CloudRift برای رفع باگ!
گستردگی و مشکلات ناشی از این باگ به حدی جدی است که CloudRift تصمیم گرفته برای رفع یا حتی دور زدن آن جایزه تعیین کند. این شرکت یک جایزه 1000 دلاری برای بهترین راه حل برای رفع این باگ در نظر گرفته که نشان میدهد مشکل جدیتر از این حرفهاست.
source