Наука и жизнь Софт

Аватары могут стать звездами следующего поколения

В прошлом году Netflix опубликовала колоссальные 1500 часов оригинального контента. А с запуском потоковых сервисов от Apple и Disney рынок видео по запросу становится еще более конкурентным. Медиа-дома и компании уже ищут новые решения для производства контента, чтобы идти в ногу с тенденцией: аватары с искусственным интеллектом.

В ноябре прошлого года китайская государственная медиа-компания Синьхуа дебютировала в качестве первой компании с ведущим новостей с искусственным интеллектом, который выглядел точно так же, как и его реальный коллега Чжан Чжао.

Компания заявила, что аватар говорит как на мандаринском, так и на английском языках. Тогда в Синьхуа заявляли, что ИИ официально является частью их команды, стремясь предоставлять «авторитетные, своевременные и точные новости» круглосуточно, через свои приложения и социальные каналы, такие как WeChat.

Ведущий-аватар с ИИ подготовил более 3400 сообщений новостей с общим временем более 10 000 минут. В феврале ИИ даже дебютировал в роли ведущего-женщины по имени Синь Сяомен. Эти цифры указывают на то, что при такой скорости ИИ могут очень быстро превзойти своих коллег-людей.

Агентство новостей уже работает с китайским поисковым гигантом Soguo над новым образом нового аватара для искусственного интеллекта по имени Синь Сяохао, который сможет показывать, стоять и двигаться более естественно, чем в текущих версиях.

В будущем новостные сайты, которые не производят видео с аватарами, могут использовать эти модели для составления репортажей из своих статей и конкурировать за внимание зрителей с традиционными телеканалами.

В январе этого года китайская телевизионная сеть CCTV выпустила свой Гала-фестиваль Network Spring Festival, который смотрят почти 1,4 миллиарда человек. Впервые хозяева программы — Бэйнинг Са, Сюнь Чжу, Бо Гао, Ян Лонг — сопровождались своими аватарами, созданными ИИ. CCTV работал с американской ИИ-компанией ObEN, создавшей эти аватары.

ObEN специализируется на создании Персонализированного Искусственного Интеллекта (ПИИ) с использованием собственной технологии. Чтобы создать ИИ знаменитостей, компания сканирует людей с помощью 3D-камеры, имитируя их внешний вид. Затем он просит их прочитать сценарий (длительностью около 30−45 минут), чтобы записать голос, и воспроизводит его через аватара, который пытается имитировать тональность и эмоциональность голоса своего человека.

Технология компании может воспроизводить видео знаменитостей в ИИ-аватарах. Кроме того, компания может даже заставить их петь, если музыкальная студия предоставляет им фоновый трек и голосовые подсказки.

В прошлом году компания объединилась с китайской музыкальной группой SNH48, чтобы создать видео с участниками и аватарами.

Генеральный директор ObEN Никхил Джайн говорит, что технология компании может воспроизводить голос ИИ на нескольких языках, даже если они записывают сценарий на английском языке: «Мы разработали наш алгоритм таким образом, чтобы ПИИ мог свободно говорить на английском, китайском, корейском и японском языках, не теряя при этом индивидуальности голоса своего владельца».

«Одна из новых вещей, над которой мы работаем, называется экспрессивная речь, которая позволяет нам генерировать целый ряд новых эмоций. Сочетание эмоций, таких как гнев или грусть, может сделать человека узнаваемым», — говорит Марк Харвилла, главный технолог компании.

Помимо ObEN, еще одна компания — Digital Domain — работает над воскрешением мертвых знаменитостей, воссоздавая их цифровые копии с помощью машинного обучения.

Для создателей аватаров важно помнить, что они, по сути, стремятся заменить людей-артистов, и им придется сделать их эмоционально привлекательными для зрителей.

Хардик Мешери, исследователь естественных языков (NLP) из TCS Research and Innovation, сказал, что нынешнее поколение ИИ хорошо умеет читать информацию, но не очень эмоционально: «Что касается различных ситуаций, то ИИ в основном снабжены ситуациями, которые являются общими и более доступными, поэтому они очень хорошо умеют читать новости о пробках, погоде и т. д. Но естественные ситуации довольно сложны для них, хотя и это можно сделать, поскольку редким событиям они еще не обучены должным образом, но могут справиться и с этим. Еще одной серьезной проблемой с психологической точки зрения является отсутствие эмпатии. Когда человек разговаривает с человеком, более или менее возникает чувство эмпатии или микроэмоций, которые ведут разговор. Эти микроэмоции, хотя их изучают десятилетиями, все еще далеки от правильного моделирования в той или иной форме, в которой ИИ мог бы имитировать их».

Он добавил, что им трудно вести беседу, которая является эмоционально сложной, такой как утешение кого-либо или подбадривание.

На данный момент кажется, что модели готовы читать основные новости или информацию, но они не очень хороши в формате развлечений, который требует от них эмоций.

В любом случае, аватары с ИИ — очень важная вещь в процессе человеческой эволюции. Мы должны создавать инструменты для облегчения нашей жизни, и искусственный интеллект способен это сделать.

Поделиться с миром: