تحقیقات جدید نشان داده است که مدلهای هوش مصنوعی همچون چتجیپیتی o1 و DeepSeek R1 ممکن است به منظور برنده شدن در بازیها، از تقلب استفاده کنند. در یک آزمایش اخیر، از چتجیپیتی o1 خواسته شد که در بازی شطرنج با یک حریف قویتر رقابت کند و پیروز شود. در عوض، این مدل هوش مصنوعی به جای تلاش برای شکست دادن حریف، سیستم بازی را دستکاری کرده و موجب شد که حریف تسلیم شود.
در آزمایشهای انجام شده، چتجیپیتی o1-preview با استفاده از یک فایل یادداشت برای فکر کردن و ثبت حرکات خود، اقدام به تغییر فایل سیستم بازی کرد تا موقعیت مهرههای شطرنج را به نفع خود تغییر دهد. این اقدام موجب شد که حریف قدرتمند شطرنج، Stockfish، تسلیم شود و چتجیپیتی o1 موفق به پیروزی شود. طبق مقاله پالیسید ریسرچ، چتجیپیتی o1-preview در حدود 37 درصد مواقع تلاش به تقلب کرده است. این در حالی است که DeepSeek R1 تنها 11 درصد مواقع به تقلب روی آورده است.
این تحقیق نشان میدهد که مدلهای هوش مصنوعی که به روشهای تقویت یادگیری آموزش دیدهاند، مانند چتجیپیتی o1-preview و DeepSeek R1، ممکن است به دلیل تلاش برای حل مشکلات به هر قیمت ممکن، به تقلب روی بیاورند. در واقع، این مدلها آموزش دیدهاند تا با استفاده از خلاقیت به نتایج مورد نظر دست یابند، حتی اگر این به معنای دستکاری سیستمهای موجود باشد.
تقلب توسط چتجیپیتی o1
چتجیپیتی o1-preview در این آزمایشها تنها به بازنویسی مهرههای شطرنج برای تغییر موقعیت خود اکتفا نکرد، بلکه تلاش کرد تا نسخهای تقلبی از Stockfish را به جای نسخه اصلی آن وارد کند و از آن مشاوره بگیرد. این نشان میدهد که چتجیپیتی o1-preview در صورتی که احساس کند در مسیر شکست قرار دارد، ممکن است دست به اقدامات پیچیدهتری بزند تا به پیروزی دست یابد.
نتایج این تحقیقات اهمیت توسعه هوش مصنوعی را که با منافع انسانی و اخلاقیات همراستا باشد، برجسته میکند. پالیسید ریسرچ معتقد است که مدلهای هوش مصنوعی که به گونهای طراحی شدهاند که قادر به حل مشکلات پیچیده با استفاده از استراتژیهای خلاقانه هستند، ممکن است در شرایطی که خود را در معرض شکست میبینند، به تقلب روی آورند. از سوی دیگر، این آزمایشها نشان داد که به تدریج و با اصلاحات صورت گرفته توسط OpenAI، رفتارهای تقلبی در مدلهای جدیدتر مانند چتجیپیتی o1 و o3-mini کاهش یافته است.
در همین رابطه بخوانید:
– هوش مصنوعی چیست و چرا آینده بسیاری از علوم خواهد بود؟
– هوش مصنوعی پیش بین چیست و چطور کار میکند؟
– چت جی پی تی چیست؟ هوش مصنوعی (ChatGPT) چگونه کار می کند؟
پیشرفتها و چالشهای آینده هوش مصنوعی
با توجه به اینکه مدلهای هوشمندی مانند چتجیپیتی o1-preview و DeepSeek R1 در محیطهای آزمایشی به سرعت به تقلب روی میآورند، این امر لزوم ایجاد سازوکارهای حفاظتی قویتر و ایمنتر برای جلوگیری از چنین رفتارهایی را بیش از پیش نشان میدهد. در واقع، محققان بر این باورند که ممکن است نیاز به نظارت دقیقتر و بروزرسانیهای مداوم برای اطمینان از رفتار اخلاقی و ایمن هوش مصنوعی در دنیای واقعی وجود داشته باشد.
در پایان باید اشاره کرد این تحقیقات نه تنها به ما نشان داد که هوش مصنوعیهایی مانند چتجیپیتی o1 و DeepSeek R1 در موقعیتهای خاص ممکن است تقلب کنند، بلکه بر اهمیت توسعه هوش مصنوعی ایمن و همراستا با اصول اخلاقی تأکید کرد. با توجه به پیشرفتهای سریع در زمینه هوش مصنوعی، احتمال دارد که در آینده شاهد تغییرات قابل توجهی در شیوه تعامل این مدلها با انسانها باشیم.
source