《辛普森一家》能否使用AI deepfakes来替代配音演员呢?

百家 作者:大数据文摘 2021-03-17 13:24:48

大数据文摘出品

来源:Wired

编译:lin


2015年5月,《辛普森一家》的配音演员哈利·希勒(Harry Shearer)宣布他将离开该剧,他在剧中扮演了许多关键角色,包括令人难以置信的同时饰演了伯恩斯先生和韦伦·史密瑟斯。


截止到2015年,这部动画片已经播出了超过25年,配音演员的片酬从1998年的每集3万美元涨到了2008年的每集40万美元。但是,《辛普森一家》的制片人福克斯公司打算削减成本,并威胁说,除非配音演员减薪30%,否则将取消该剧。


大多数人都同意了,但是希勒(他曾经批评过这部剧的质量下降)拒绝签约——20多年后,他想要挣脱金手铐,赢回自由和时间来追求自己的工作。制片人艾尔·简表示,希勒的标志性角色——包括斯金纳校长、内德·弗兰德斯和奥托·曼——将会重新塑造。


但你永远也无法阻止《辛普森一家》。


几个月后,希勒软化了态度,签订了一份新的协议。这部剧经常拿动画中配音演员的替代开玩笑,但随着它走过第4个10年,笑声背后的标志性声音可能是它继续存在的最大威胁。


扮演斯普林菲尔德镇居民的演员们都快到了退休年龄了——他们大多已经六七十岁了,希勒已经77岁了——他们可能很快就会决定不再演这个角色了。他们当然不需要钱——从新剧集的费用到旧剧集重复的剩余费用,他们坐拥数千万美元。


但也许这个节目的制片人实际上不再需要配音演员了。在最近的一集里,埃德娜·克拉巴佩尔——巴特长期受折磨的老师,在2013年配音演员玛西亚·华莱士去世后,她的角色就从节目中退休了——用之前几集的录音重新回归,作为最后的告别。


计算能力的进步意味着你可以将这一原理扩展到任何角色。deepfakes技术可以从有限的训练数据中制作出令人信服的复制品,而节目制作人有30年的音频可供参考。那么《辛普森一家》能否用人工智能代替配音呢?


“你当然可以为《辛普森一家》里的角色以一种可信的方式配音,”加拿大人工智能研究员和媒体制作人蒂姆•麦克斯麦瑟斯(Tim McSmythurs)表示。他建立了一个可以训练模仿任何人声音的语音模型。“这是否同样具有娱乐性是另一个问题。”


在他的YouTube频道上,谈到人工智能,McSmythurs重拍了《诺丁山》中的标志性场景,由霍默(Homer)饰演茱莉亚·罗伯茨;唐纳德·特朗普(Donald Trump)代替拉尔夫·威格姆(Ralph Wiggum),乔·拜登(Joe Biden)把洋葱系在腰带上,这是当时的风格。


McSmythurs建立了一个通用的人工智能模型,可以将任何文本转换成英语语音。当他想要制造一个新的声音时,他会进一步调整模型,使用那个人说话的两到三个小时的新数据,以及一个文本文本。他说:"模型专注于让声音听起来就是霍默的声音,以及不同的频率。”


之后,就是要求模型生成多个版本的问题了——每个版本都会略有不同——然后根据你的目的选择最好的一个。它的输出可以辨认出是霍默的声音,但它们听起来有点平淡,就好像他在读一些他并不真正理解的东西。“这确实取决于训练数据,”McSmythurs说。“如果模型没有接触到这些广泛的情感,它就不可能从零开始。所以它听起来不像霍默本人那样充满活力。”


英国初创公司Sonantic已经开发出一种方法,将这种情感范围引入人工智能声音中。他们与配音演员一起工作,获得广泛的训练数据——演员用几个小时的时间,用不同的情感语调,在不同的台词中运行。


Sonantic联合创始人兼首席技术官约翰•弗林(John Flynn)表示:“我们知道讽刺和真诚之间的区别,以及声音中细微的线索。”“我们延伸了这些自然的点、细微差别和变化。”


弗林说,需要的训练数据量已经大幅减少,从30到50小时减少到10到20分钟。位于布里斯班的复制工作室(Replica Studios)建立了一个模型,通过输入20个简短但特有的句子的录音,可以训练它重现声音。Replica联合创始人兼首席执行官Shreyas Nivas表示:“你拥有的数据越多,你就能获得越好的性能,但我们可以在几分钟内完成一些事情。”


单词是由音节构成的,音节又是由音素构成的——你的嘴能发出的所有单独的声音。理论上,一个训练模型可以从一个被称为语音pangram的句子中获得它所需要的一切,它包含英语的每个音素,尽管在实践中这取决于你的口音。例如,试着用各种不同的方式来表达:“正如年轻的亚瑟(Arthur)想要的那样,在尼斯湖水域上的米色色调给包括法国女王在内的所有人留下了深刻的印象,之后她又再次听到了那首交响曲。”


语音生成技术已经在视频游戏中得到了应用——Sonantic正在与《辐射》和《外部世界》的开发商Obsidian合作,而Replica拥有许多AAA级和独立游戏工作室作为客户。在游戏中,AI的声音可以通过更广泛的对话填充开放世界,而不是局限于由工作室中的配音演员录制的角色说话。


Nivas表示,该技术在开发阶段特别有用,在开发阶段,人工智能版本的声音可以作为替身,让游戏开发者在让真人配音之前尝试各种选择。


它也可以用来驱动更多的定制化——评论员在像FIFA这样的游戏中尖叫你的真实名字可能是一个应用程序,而Replica为赛博朋克开发了一个mod,可以改变主角的名字,并使每个与他们互动的角色都能说出它。结合AI语音生成、语音识别和GPT-3等文本到语音算法,玩家可以与非玩家角色对话,即时生成对话。


然而,除非Fox决定将剧本撰写和动画也移交给AI,否则《辛普森一家》之类的剧本就不需要这些功能。事实上,使用人工智能来重新塑造一个角色可能比仅仅找一个能模仿霍默的人要麻烦得多。“如果我们的目标是制作另一个集,最好的方法是让演员聚在一起执行这个脚本,他们将提供更高质量表演,因为他们几十年来一直保持成功的完成这些脚本,他们能体现完美的人物特性,“Nivas说,“使用人工智能配音演员需要更多迭代和工作,而不仅仅是重新集结演员阵容。”


对于任何想要用AI重新塑造配音演员的声音的制作人来说,这都是一个法律雷区。宾夕法尼亚大学(University of Pennsylvania)法学教授詹妮弗·罗斯曼(Jennifer Rothman)说:“这一领域的法律是棘手的。”


一方面,合同可能会限制录音室对唱片的处理。除此之外,还有一些劳资谈判的问题。罗斯曼说,美国演员工会(SAG-AFTRA)“非常积极地试图规范配音演员和银幕演员的重复再利用。”


然而,在没有任何合同规定的情况下,著作权法开始发挥作用。罗斯曼说:“谁拥有《辛普森一家》的版权,谁就拥有复制他们已经制作的受版权保护作品的所有权利——包括捕捉到的演员表演录音,以及根据版权法制作衍生作品的权利。”


但这与另一套管理公众权利的法律相冲突,美国各地的法律各不相同。罗斯曼说:“这种宣传权赋予表演者权利,让他们有权控制未经授权使用自己的名字、肖像、表演,通常还有声音。”


伦敦大学玛丽皇后学院的知识产权法教授约翰娜·吉布森说,在虚假背书索赔中,演员还有潜在的追索权。如果《辛普森一家》(The Simpsons)使用了一个深度造假的霍默(Homer)来为巧克力棒做广告,这可以被视为演员丹·卡斯特兰尼塔(Dan Castellaneta)的个人代言。


吉布森说,甚至由同一演员在同一节目中扮演不同角色,法律也可能不同——她用来自Family Guy中Seth Macfarlane 举例,"Brian"的声音事实上是他本人的声音,可能会有更多的保护,而Stewie是专门为动画创作的声音。(当然,在这种情况下,麦克法兰是这部剧的创作者,不太可能被违背他意愿的人工智能取代)。


1993年,《干杯》的两位演员——乔治·温特和约翰·拉岑伯格——起诉派拉蒙公司在机场的酒吧里使用他们的机器人版本的角色。演员们辩称,宣传权让他们能够控制自己的形象,而工作室则辩称,版权法允许他们根据这部情景喜剧创作衍生作品。该案经过了8年的法庭审理,最终达成和解,和解金额不详。Rothman表示:“法律并不明确,这意味着如果合同中没有规定该工作室可以这么做,那么如果提起诉讼,这类纠纷将如何收场就不得而知了。”“这是一个尚未解决的问题。解决这些案件的法律框架相当混乱。”


但是配音演员可能还不需要打电话给他们的律师。制作这些语音生成工具的人都不是为了取代演员。Sonantic和Replica都强调他们与演员合作,他们有适当的收益分享模式,让配音演员每次在游戏中使用自己的“声音”都能赚钱。

Nivas说,随着这项技术的改进以及它产生的声音脱离“怪异的山谷”,他们可以帮助使内容创作民主化–例如,允许辛普森一家的粉丝合法地将自己喜欢的角色的声音用于自己的项目,制作混搭和混音,为已经疲累的的动画剧注入新的活力。


Sonantic公司的首席执行官兼联合创始人齐娜·库雷希(Zeena Qureshi)将目前的语音生成技术比作早期的CGI技术。她说:“它复制了演员的声音,但不会取代他们。”“CGI不会取代电影摄影师,也不会取代演员,但它可以帮助他们虚拟化工作。如果有人退休了,他们的声音还是有用的。”


McSmythurs还与CGI进行了比较,并说,尽管今天可以制作一集令人信服的《辛普森一家》(需要大量的迭代努力),但它可能很难经受住时间的考验-就像CGI拍摄的电影一样 -90年代的制作已经过时了。


他认为该技术可用于制作简短的摘要,例如将已故演员扮演的角色复活以作最后的告别,但他认为AI演员表不会很快成为现实。他说:“配音演员所带来的不仅仅是声音,而是在传递情感内容。” “丹·卡斯特拉内塔(Dan Castellaneta)将这个2D角色赋予温暖,深度和使我们喜欢他的所有特质。人类在树立人的特质方面做得很好。”


相关报道:

https://www.wired.co.uk/article/simpsons-deepfake-voice-actors-ai



志愿者介绍
后台回复志愿者”加入我们



点「在看」的人都变好看了哦!

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接