آیا الگوریتم‌ها، کارگردان‌های جدید برای تولید ویدئو هستند؟

بازگشت

میشل بیس مدیر عامل شرکت Mobile Viewpoint می گوید: برودکسترها و مالکین برندهای مطرح، برای برآورده کردن انتظارات مخاطبان خود در مورد اخبار فوری و پوشش تمام اتفاقات موجود، همواره متحمل فشار برای تسریع بخشیدن به تولید خروجی هستند و این درحالی است که بودجه ها نیز دائما در حال کاهش است.

همین امر راه‌اندازی پخش سنتی را که هم هزینه‌بر بوده و هم متمرکز بر منابع است را  با چالش مواجه می‌کند و استفاده از الگوریتم‌های هوش مصنوعی (AI) در تولید اخبار و ورزش را مطرح می‌کند.

تولید کامل اخبار به طور خودکار بدون نیاز به کارگردان و فیلمبردار و یا سایر عوامل فنی انسانی، شاید هنوز بسیار دور از ذهن باشد اما کمک در تولید با استفاده از هوش مصنوعی در حال حاضر نیز در حال اجرا می باشد. برای مثال در حال حاضر دوربین فیلمبرداری اتوماتیک، کارگردان مجازی و تولید اخبار ورزشی به طور اتوماتیک، برای فوتبال اجرایی شده است.

امروزه این مثال‌ها توسط برودکسترهای کوچکتر و پخش کننده‌های زنده مورد استفاده قرار می‌گیرند، اما انتظار می‌رود طی چند سال آینده سازمان‌های بزرگ نیز این فناوری‌ها را در بر گیرند. کامیون‌های SNG نیز پیرو همین اتفاق با کوله پشتی‌های پخش زنده جایگزین شده‌اند.

بنابراین، مهم است که ما نیز همین امروز در صنعت خود، سازگاری با تکنولوژی‌های مبتنی بر AI را شروع کنیم و در این زمینه آموزش ببینیم. مثالی که اخیرا با پیروی از همین مسیر اجرایی شده است یک برودکستر بلژیکی است که یک استودیوی خبری بدون سرنشین را با استفاده از Newspilot با بکارگیری AI می‌باشد.

این پروژه شامل تکنولوژی عمیق‌سنجی[1] برای ایجاد یک فیلمبردار مجازی، نگه داشتن ارائه کنندگان به شکل درست در کادر و ارائه بازخورد در مورد اینکه آیا آن‌ها واقعا وجود دارند یا خیر. آن‌ها این را با یک کارگردان مجازی که توسط یک GUI مبتنی بر وب هدایت می‌شوند، برای ایجاد بولتن‌های خبری با هزینه‌ای موثر تر ترکیب کرده‌اند.

شرکت رمو تکنولوژی دوربین فیلم برداری منحصر به فردی تولید کرده که به علت بهره‌مندی از هوش مصنوعی از توان کارگردانی هم برخوردار بوده و می‌تواند سوژه قرار گرفته در برابر دوربین را ردگیری کرده و از وی فیلم‌برداری کند.

شرکت سازنده این دوربین که Obsbot Tail نام دارد، اولین دوربین هوش مصنوعی جهان با توان کارگردانی توصیف کرده است.

دوربین مذکور از قابلیت فیلم‌برداری با کیفیت 4K و با دقت 60 فریم در ثانیه برخوردار است و بر روی یک شاسی سوار می‌شود. قابلیت زوم اپتیکال این دوربین هم به 3.5 ایکس می‌رسد. کاربر ابتدا باید سوژه‌ای که قرار است تعقیب شود را برای دوربین مشخص کند و سپس دوربین به طور خودکار آن را دنبال خواهد کرد.

دوربین یادشده با حرکات دست و صورت هم قابل کنترل بوده و یک اپلیکیشن هم برای مدیریت آن در نظر گرفته شده است که برنامه ریزی آن را تسهیل می کند. به منظور پردازش خوب تصاویر یک تراشه پیشرفته به نام HiSilicon Hi3559A بر روی دوربین مذکور نصب شده است. تراشه یادشده برق کمی هم مصرف می کند. پشتیبانی از فناوری پردازش ویدئویی HDR10 از جمله دیگر مزایای این دوربین است که قیمت آن هنوز مشخص نشده است.

یکی دیگر از زمینه های جالب استفاده از تکنولوژی AI در تولیدات ورزشی است. لیگ های کوچکتر با رتبه های پایین تر در رشته های ورزشی مانند هاکی روی زمین، هندبال و بسکتبال اکنون با استفاده از تکنولوژی های در دسترس بر مبنای هوش مصنوعی این فرصت را برای پخش زنده بازی های خود دارند.

قبلا چنین موقعیتی با استفاده از تشخیص تصویر برای دنبال کردن بازی با استفاده از یک دوربین، با موفقیت اجرا شده است. AI می تواند این تولیدات را جالب تر کند زیرا قادر به تشخیص گل شدن توپ، خطاها (کارت های زرد و قرمز)، خطای کرنر و یا خطای تایم اوت و آسیب ها می باشد. اگر این تجربه با تجزیه و تحلیل رفتار بازیکنان ترکیب شود، امکان ایجاد اتوماتیک یک خلاصه فراهم می شود که در مقایسه با بازی کامل، می تواند برای تماشاگران بیشتری مورد استفاده قرار گیرد.

همچنین کنترل تبلیغات مبتنی بر AI می تواند این بازی ها را برای حامیان مالی جذاب تر کند. آگهی های تلویزیونی پشت سرهم مخاطبان را کلافه کرده  و گاها باعث می شود تماشاچیان علاقه خود را برای دیدن ادامه بازی از دست بدهند درحالیکه پخش پویا و هوشمند یک آگهی در طول مکث در بازی می تواند حتی نظرات مخاطبان را بیشتر جلب کند.

AI همچنین نقش مهمی در نمایه سازی محتوا بازی خواهد کرد. امروزه از تکنولوژی های هوش مصنوعی و ابرداده استفاده می شود، اما اغلب اوقات الگوریتم های مورد استفاده بر اساس تبدیل گفتار به متن است. ترکیبی هوشمند از چندین منبع اطلاعات و الگوریتم ها یک روش جالب و طبیعی برای نمایه سازی را ایجاد می کند.

فرانک کاپولا، مدیر اجرایی هگزاگلوب، می گوید: در حاضر نوآوری در مورد کیفیت تصویر بهتر یا پردازش پیشرفته سیگنال نیست، بلکه درواقع نوآوری در مورد متادیتا می باشد.

از آنجاییکه محتوای موجود در اینترنت در حال انفجار است، متادیتا کلید اصلی برای تجربه کاربری بهتر بوده و آگاهی بهتر در مورد اخبار و محتوای ورزشی را تضمین می کند. زمانی که متادیتا به درستی ایندکس شده باشد، با وجودیکه محتوای اصلی تغییری نکرده است ولی قطعا راحت تر یافته شده و برای استفاده مجدد شانس بیشتری دارد و به همین دلیل ارزش آن بیشتر می شود.

امروزه ارائه ویدیو، تعاملی تر شده و هم زمان علاوه بر تلویزیون، در سایر شبکه های اجتماعی مختلف، سرویس های آنلاین و برنامه های کاربردی تلفن همراه اجرا می شود و همین اهمیت متادیتا را بیشتر نشان می دهد. با این حال، ایجاد metadata مناسب آسان نیست زیرا هم نیاز به نیروی انسانی زیادی دارد، و هم کار جذابی نیست و در نتیجه، واقعا گران است. این جایی است که AI به بازی می آید ظهور شبکه های عصبی عمیق و شبکه های عصبی کانولوشن، چارچوب ایده آل برای ایندکس گذاری ویدیو را به ارمغان می آورد.

کسانی که برای نمایه گذاری ویدیوی مناسبی - یا دستی یا خودکار - سرمایه گذاری می کنند، تعامل بیشتر کاربران و اشتراک گذاری بهتر بین پلتفرم های مختلف توسط کاربران را به دست خواهند آورد. با توجه به این مشاهدات در دنیای واقعی ما یک پیش فرض را پیش بینی می کنیم: پیشگامانی که امروز مهارت در حوزه های هوش مصنوعی را شروع می کنند، در آینده شرکت های پیشرو رسانه ای خواهند بود. خبر خوب این است که دسترسی به تکنولوژی های مبتنی بر یادگیری عمیق دیگر منحصر به شرکت های بزرگ نیست. تشخیص چهره و جسم برای همه شرکت ها در دسترس است.

علاوه بر این، این تفکر که استفاده از فن آوری های مبتنی بر AI مانند تشخیص چهره در یک گردش کار، حتما نیاز به استفاده از ابر را دارد اصلا درست نیست. در واقع می توان سیستم های بسیار خوبی را بر روی زیرساخت هر شرکت نصب کرده و این سیستم ها را به صورت سفارشی شده تنظیم کرد هرچند این بدان معنا نیست که فناوری ابر غیر کاربردی خواهد بود بلکه آموزش مدل مبتنی بر AI نیاز به مقادیر زیاد محاسبات قدرت دارد IaaS در این مرحله بسیار مفید خواهد بود اما بدین معنی نیست که بدون ابر امکان پیاده سازی آن وجود ندارد.

با توجه به اهمیت ورود به حوزه هوش مصنوعی، در اداره کل تحقیقات و جهاد خودکفایی نیز فعالیت های تحقیقاتی و عملیاتی در همین زمینه شروع شده که منجر به قراردادهای کاربردی مانند "طراحی و تولید سامانه نرم افزاری تشخیص چهره در ویدئوهای آرشیو" و " تهیه و توسعه سامانه داده کاوی بر روی داده های نظرسنجی مرکز پژوهش سازمان" شده است.

در سامانه اول هدف ارائه سیستمی است که با استفاده از هوش مصنوعی و یادگیری ماشین امکان اجرای فناوری تشخیص جستجوی خودکار و شناسایی چهره های مورد نظر از صحنه هایی از ویدئو است که به طور خودکار از کل ویدئو استخراج شده اند. در نهایت با استفاده از فناوری تشخیص چهره در ویدئوهای آرشیوی متادیتاهای مرتبط با محتوای ویدئویی غنی تر شده و نیاز کاربران را در دستیابی به موضوع مورد جستجو سریع تر مرتفع می نماید.

و در سامانه دوم هدف اصلی ارائه سیستمی برای تحلیل خودکار نظرات افرادی است که در نظر سنجی های صدا وسیما شرکت نموده اند و به سؤالات چند گزینه ای و همینطور سوال پیشنهاد و نظر آزاد پاسخ داده اند. در این تحلیل ارتباط بین پاسخهای افراد به سوالات و پرسشنامه های مختلف مورد بررسی قرار خواهد گرفت. انجام این پروژه و ارائه یک تحلیل جامع از نظرات افراد جامعه میتواند نقش به سزایی در یافتن دغدغه های اصلی مردم و میزان و دلیل رضایتمندی و یا نارضایتی آنها از موارد مورد بررسی و توجه صدا و سیما داشته باشد که به تبع آن ارائه راهکارهای مفید در رفع کاستی ها میسرتر خواهد بود. در مراحل داده کاوی و متن کاوی این پروژه از الگوریتم های هوش مصنوعی استفاده می شود.

 

https://www.ibc.org/production/artificial-intelligence-are-algorithms-the-new-video-director/3079.article

https://www.ibc.org/content-management/artificial-intelligence-ready-to-add-more-value-to-your-content/3080.article

http://www.bartarinha.ir/fa/news/822381

 


[1] Depth-sensing

 

رای شما
میانگین (0 آرا)
The average rating is 0.0 stars out of 5.


Top