آمازون دو مدل AI جدید را به مجموعه هوش مصنوعی مولد خود افزوده است. Nova Sonic، یک مدل پایه برای پردازش، درک و تولید صدا و Nova Reel 1.1 که میتواند کلیپهای دو دقیقهای از زوایای مختلف را تولید کند.
Nova Reel 1.1
مدل ویدئوساز Nova Reel 1.1 امکان ساخت ویدیوهای چند نمایی (multi-shot) تا دو دقیقه با حفظ سبک بصری را در بخشهای ۶ ثانیهای را فراهم میکند. این مدل نسبت به نسخه قبلی از نظر سرعت تولید و انسجام محتوی بهبود یافته است. کاربران میتوانند یک اعلان (prompt) واحد برای کل ویدیو ارائه دهند یا برای کنترل بیشتر، اعلانهای جداگانه برای هر نما تنظیم کنند.
این مدل در زمینههای مختلفی مانند کمپینهای بازاریابی، نمایش طراحی محصول و ایجاد کلیپ برای شبکههای اجتماعی پشتیبانی میکند. به گفته آمازون:
Nova Reel بهرهوری خلاقانه را افزایش میدهد در حالی که به کاهش زمان و هزینه تولید ویدیو با استفاده از هوش مصنوعی مولد کمک میکند.
برای شروع کار با Amazon Nova Reel 1.1، کاربران باید به کنسول Amazon Bedrock مراجعه کرده و درخواست دسترسی به مدل را ثبت کنند.
Nova Sonic
آمازون با Nova Sonic تشخیص، درک و تولید گفتار را در یک مدل واحد ادغام کرده است. سیستمهای صوتی سنتی شامل سیستمهای جداگانه و پیچیدهای برای تبدیل گفتار به متن، پردازش از طریق یک مدل زبان بزرگ و تبدیل پاسخ به گفتار هستند. به گفته آمازون، این رویکرد «در حفظ بافت صوتی زنده و ظرافتها ناتوان است.
بنابر اعلام آمازون:
Nova Sonic رویکرد جدیدی را اتخاذ میکند. این مدل قابلیتهای درک و تولید (صدا) را در یک مدل واحد یکپارچه میکند. در نتیجه، این مدل نه تنها ورودی کاربر را درک میکند، بلکه با لحن، سرعت و سبک مناسب نیز پاسخ میدهد.
این مدل از طریق Amazon Bedrock برای کاربردهای گوناگونی از جمله خدمات مشتری، سفر، آموزش، مراقبتهای بهداشتی و سرگرمی پشتیبانی در دسترس است. در مثال ارائه شده توسط آمازون، یک دستیار سفر مجازی با تشخیص نگرانی مشتری درباره هزینههای سفر، لحن خود را از مشتاق به اطمینان بخش تغییر میدهد. یک مورد استفاده دیگر شامل دستیار داشبورد سازمانی است که پاسخها را بر اساس دادههای شرکت ارائه میدهد و گفتگوی چند نوبتی را بدون نیاز به یادآوری موضوع بحث توسط کاربر ادامه میدهد.
در همین رابطه بخوانید:
– آموزش ساخت رایگان انیمیشن با هوش مصنوعی
– تبدیل عکس به انیمه با هوش مصنوعی؛ جیبلی با ChatGPT و ابزارهای دیگر رایگان
Nova Sonic همچنین قدر است از گفتار کاربر رونوشت تولید کند. این ویژگی به توسعهدهندگان اجازه میدهد تا آن را با APIها و ابزارهای خارجی ادغام کنند.
source