AI клонинги на човешки гласове идват за дял от пазара на аудиокнигите

Аудиокнигите са сравнително скорошен феномен, но датират много по-отдавна от Apple и Amazon.

Концепцията за „говорещи книги“ се появява през 30-те години на миналия век в помощ на хора с увредено зрение. Едва през 70-те години на миналия век аудиокнигите започват да се използват от пътуващите към работа в опит за справяне със стреса. Но едва когато влезе в смартфоните ни, аудио форматът наистина излетя, пише CNBC.

Според прогноза на Wordsrated, изследователска организация в издателската индустрия, продажбите в сектора на аудиокнигите в момента могат да бъдат оценени на над 5 милиарда долара, близо 2 млрд. долара от които в САЩ – най-големият пазар на аудиокниги в света.

Очаква се продажбите да нарастват с 26,4% всяка година за периода 2022 – 2030 г., което ще доведе приходите от аудиокниги до 35 милиарда долара през 2030 г. Това прави аудиокнигите „най-бързо развиващият се книжен формат в света“, според Wordsrated.

Аудиокнигите освен това са още един пазар, който изкуственият интелект може да разтърси. Генерираните от AI гласове са на път да вземат микрофона от актьорите, които четат произведенията.
Готови ли са потребителите AI да им разказва истории?
Истината е, че това вече се случва и тенденцията вероятно ще се ускори, посочва CNBC.
„За много издатели производството на аудиокниги може да бъде голяма инвестиция“, казва Джуди Чанг, директор на продуктовия мениджмънт за Google Play Books, добавяйки, че плащането за актьори е част от уравнението на разходите. Компанията предлага на издателите възможността да създават книги с автоматизиран разказвач, стига да притежават правата върху аудиокнигата.Как хората чуват книгите

Хората обичат аудиокниги. Те са на второ място след музиката като най-често консумиран аудио продукт.
Преживяването с аудиокнига обаче не е като да попитате Alexa за времето или да пуснете песен. И това може да представлява ограничение по отношение на замяната на човешките разказвачи с компютърно генерирани гласове.
„Хората са силно чувствителни към качеството на аудиоразказа, а то много зависи от усещането на слушателя за връзката му с гласа“, казва Дейвид Чикарели, главен изпълнителен директор на Voices, най-големият пазар за озвучаване. „Близо 60% от слушателите се отказват от аудиокнига, защото не им харесва разказвачът“, посочва Чикарели, цитиран от CNBS.
Не е толкова лесно да накарате AI гласа да звучи не само като човек, но и да се свързва със слушателите. В крайна сметка озвучаването на всяка една книга е индивидуално актьорско майсторство, което е трудно да бъде повторено и имитирано.
„Това, което хората могат да правят най-добре – и което изкуственият интелект не може – е свързано с времето“, казва още Чикарели. „Независимо дали става дума за важна пауза или точното пресъздаване на комедиен момент, за гласа на изкуствения интелект е трудно да извлече правилния ритъм.”
Хората четат едни части от сюжета с различна скорост от други части, защото разбират какво четат. AI не го прави. „Професионалните разказвачи знаят кога да го ускорят и след това да се върнат към нормално темпо на четене“, казва Чикарели. Освен това нямат проблем с омографите (т.е. знаят къде да направят ударение).
AI гласовете, разбира се, ще стават по-добри и съпротивлението на слушателя към тях съответно ще намалява, Въпросът с променящите играта нови технологии не е дали, а кога. Чикарели знае това.
„Индустрията разбра, че промяната е във въздуха и че сега, когато вече е тук, AI ще става само по-добър“, коментира той. Аудио клонирането на професионални актьорски гласове е предвидимо, което подчертава важността на това да се върви по този път етично и да се защитават правата на артистите.
Технологиите вече позволяват дори по-емоционално съдържание да бъде изразено синтетични гласове, според Брет Кинсела, основател и главен изпълнителен директор на Voicebot.ai. Все още обаче в целия процес има нужда от гласа на актьор, който след това се трансформира в друг глас.
Какво очакват разказвачите на аудио книги 
„Отказвам работа по озвучаване, свързана с това да направят AI модел по гласа ми“, споделя за CNBC Брад Зифър, талант в озвучаването зад кадър с 14-годишен опит. „Най-добрият начин да се защитя е просто да стоя настрана от този пазар“, добавя той.
„С всеки преход идва страх и несигурност, но при всеки преход ние се учим и израстваме“, смята Мишел Коб, изпълнителен директор на Асоциацията на аудио издателите в САЩ.
Коб казва, че растежът на аудио индустрията разширява обхвата на възможностите си и новите технологии са част от това. С нарастването на слушателите и нарастването на апетита за аудио съдържание, AI може да помогне на работните процеси. Това не е нов инструмент за талантите в озвучаването, продуценти и издатели, много от които го използват, за да подобрят контрола на качеството в постпродукцията“, добавя Коб.
От миналата седмица този подход към гласовата продукция вече включва The Beatles, припомня CNBC.
Тази еволюция неизбежно ще включва рисковете, породени от AI. „Независимо от професията, страхът, че нечие препитание ще бъде изместено от машина, е реален“, казва Коб. Той обаче вярва, че не е сам в преклонението си към „дълбокото, богато, емоционално интелигентно изпълнение“ на истинските разказвачи, владеещи техниката на пленяващото разказване на истории.
Форматите, в които ще се намеси изкуственият интелект 
Най-голямата промяна, която се случва в момента, е фокусирана върху текста и изображенията, а не върху гласа.
Това, разбира се, ще се промени. Аудиокнигите са нарастваща, но все още относително малка част от общия издателски пай и допълнителните изисквания за време и разходи ще продължат да влияят върху вземането на решения до каква степен AI да нахлуе в производството на аудиокниги.
Актьорът Брад Зифър е загрижен за ролята, която AI ще играе в неговата професия. „Много съм предпазлив по отношение на света на изкуственият интелект.

Вярвам, че има голям потенциал, но и че може лесно да се злоупотребява с него. Към момента все още вярвам, че истинското човешко озвучаване няма равно на себе си. Синтезираните гласови алгоритми все още не са на такова ниво, че да могат напълно да възпроизвеждат всички нюанси на човешкия глас“, казва той за CNBC.

AI гласът трябва да овладее разбирането/тълкуването на материала за четене и способността да носи емоция и промяна в емоцията, както повелява сюжетът. И тъй като компаниите започват да експериментират в това отношение, Зифър споделя, че няма да се изненада, ако приходите му бъдат засегнати по някакъв начин.
Актьорът очаква AI да се използва най-широко от компании с по-малки бюджети или такива, фокусирани върху текстове за електронно обучение. „Тези, които искат най-доброто обаче, трябва да оставят работата с озвучаването на хората“, казва той. „Актьорите, които имат истински емоции и могат да вдъхнат живот на работата си, са най-подходящи за динамично и правдоподобно озвучаване.“
Актрисата Андреа Колинс, работеща в областта на озвучаването от 15 години, също е на мнение, че AI ще осигури необходимите компромиси за някои компании. „Мисля, че ще се превърне в чудесен инструмент за клиенти, които търсят проект, който да бъде завършен супер бързо и на разумна цена“, казва тя.
Скоростта обаче е неизбежен фактор и при общото производство на аудиокниги. „Сигурна съм, че изкуственият интелект ще отнеме част от пая, тъй като AI гласът може да се справи с 30 000 думи много по-бързо, отколкото човек“, казва Колинс.
Тя все още не е усетила, че изкуственият интелект има значително влияние върху приходите ѝ, но добавя: „Предполагам, че този ден ще дойде. Така че вместо да си заровя главата в пясъка, се опитвам да го изпреваря“.

Наскоро Колинс предприема стъпки гласът ѝ да бъде клониран. „Повечето от утвърдените артисти, които познавам, правят същото. Надявам се, че клонираният ми глас ще се превърне в друг инструмент в бизнеса ми, работейки върху проекти, изискващи по-пасивно участие, докато аз мога да работя върху по-високобюджетни продукции, изискващи човешки глас“, казва тя.
Джон Кубин, ветеран в озвучаването, казва, че колегите му в професията трябва да бъдат умни в управлението на новата AI реалност. „Още когато технологията се появи, предупредих, че тя ще убие половината от работата на актьорите озвучители“, коментира той.
Джон Кубин сега е фокусиран върху това, което очаква да се превърне в нов пазарен сегмент за дългосрочни проекти – там изкуственият интелект и клонираните човешки гласове могат да се срещнат по средата, например при сценарии от над 100 000 думи.
От бизнес гледна точка ще бъде предизвикателство да се противопоставим на промените, които носи мащаба на AI, добавя Кубин. „Имаше време, в което се шегувах, че би било невероятно, ако мога да правя пари, разказвайки зад кадър, без да се налага да съм глас зад кадър. Е, ето ни тук.“

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *