آمازون دو مدل AI جدید را به مجموعه هوش مصنوعی مولد خود افزوده است. Nova Sonic، یک مدل پایه برای پردازش، درک و تولید صدا و Nova Reel 1.1 که می‌تواند کلیپ‌های دو دقیقه‌ای از زوایای مختلف را تولید کند.

Nova Reel 1.1

مدل ویدئوساز Nova Reel 1.1 امکان ساخت ویدیوهای چند نمایی (multi-shot) تا دو دقیقه با حفظ سبک بصری را در بخش‌های ۶ ثانیه‌ای را فراهم می‌کند. این مدل نسبت به نسخه قبلی از نظر سرعت تولید و انسجام محتوی بهبود یافته است. کاربران می‌توانند یک اعلان (prompt) واحد برای کل ویدیو ارائه دهند یا برای کنترل بیشتر، اعلان‌های جداگانه برای هر نما تنظیم کنند.

این مدل در زمینه‌های مختلفی مانند کمپین‌های بازاریابی، نمایش طراحی محصول و ایجاد کلیپ برای شبکه‌های اجتماعی پشتیبانی می‌کند. به گفته آمازون:

Nova Reel بهره‌وری خلاقانه را افزایش می‌دهد در حالی که به کاهش زمان و هزینه تولید ویدیو با استفاده از هوش مصنوعی مولد کمک می‌کند.

برای شروع کار با Amazon Nova Reel 1.1، کاربران باید به کنسول Amazon Bedrock مراجعه کرده و درخواست دسترسی به مدل را ثبت کنند.

لوگوی مدل Nova Sonic

Nova Sonic

آمازون با Nova Sonic تشخیص، درک و تولید گفتار را در یک مدل واحد ادغام کرده است. سیستم‌های صوتی سنتی شامل سیستم‌های جداگانه و پیچیده‌ای برای تبدیل گفتار به متن، پردازش از طریق یک مدل زبان بزرگ و تبدیل پاسخ به گفتار هستند. به گفته آمازون، این رویکرد «در حفظ بافت صوتی زنده و ظرافت‌ها ناتوان است.

بنابر اعلام آمازون:

Nova Sonic رویکرد جدیدی را اتخاذ می‌کند. این مدل قابلیت‌های درک و تولید (صدا) را در یک مدل واحد یکپارچه می‌کند. در نتیجه، این مدل نه تنها ورودی کاربر را درک می‌کند، بلکه با لحن، سرعت و سبک مناسب نیز پاسخ می‌دهد.

این مدل از طریق Amazon Bedrock برای کاربردهای گوناگونی از جمله خدمات مشتری، سفر، آموزش، مراقبت‌های بهداشتی و سرگرمی پشتیبانی در دسترس است. در مثال ارائه شده توسط آمازون، یک دستیار سفر مجازی با تشخیص نگرانی مشتری درباره هزینه‌های سفر، لحن خود را از مشتاق به اطمینان بخش تغییر می‌دهد. یک مورد استفاده دیگر شامل دستیار داشبورد سازمانی است که پاسخ‌ها را بر اساس داده‌های شرکت ارائه می‌دهد و گفتگوی چند نوبتی را بدون نیاز به یادآوری موضوع بحث توسط کاربر ادامه می‌دهد.

در همین رابطه بخوانید:

– آموزش ساخت رایگان انیمیشن با هوش مصنوعی

– تبدیل عکس به انیمه با هوش مصنوعی؛ جیبلی با ChatGPT و ابزارهای دیگر رایگان

Nova Sonic همچنین قدر است از گفتار کاربر رونوشت تولید کند. این ویژگی به توسعه‌دهندگان اجازه می‌دهد تا آن را با APIها و ابزارهای خارجی ادغام کنند.

source

توسط siahnet.ir