初创公司利用人工智能和语言学为视频游戏中的面部动画提供动力
多伦多大学的一家初创公司正在推动去年最畅销的电子游戏之一——反乌托邦动作角色扮演游戏 赛博朋克 2077 取得成功JALI Research 源于计算机科学系的研究,开发了一套工具,为游戏的超逼真面部动画提供动力,使角色能够令人信服地以不同语言进行对话。
据游戏开发商 CD Projekt Red 称,多语言动画容量被吹捧为《赛博朋克 2077》的一项新颖功能,该游戏在第一个月的全球销量超过 1370 万份 。
该初创公司的首席执行官莎拉·沃特林 (Sarah Watling) 表示:“拥有全新的动画,可以响应 10 种语言的配音演员录制的对话——而不仅仅是配音英语动画——意味着你正在观看与你所听到的相符的动画。”
“这是 CD Projekt Red 认为会产生巨大影响的事情之一。他们将能够通过为玩家提供本地化体验来发展新的零售市场。”
JALI Research 源于多伦多大学计算机科学系的研究,开发了一套工具,可为视频游戏角色提供超逼真的面部动画。JALI 研究的插图
JALI Research 成立于 2016 年,它使用人工智能将音素(可以分离的最小声音元素)准确映射到视位,即我们在发出声音时在人脸上看到的相应嘴形。
Watling 说 JALI 的技术有助于弥合实际游戏玩法与用于讲述游戏故事的更具电影感的预构建场景之间的差距。“玩游戏的人大部分时间都在玩游戏。因此,我们能够提供的改进也改善了游戏的这一方面,”她说。
该公司的起源可以追溯到首席技术官 Pif Edwards 在文理学院计算机科学系攻读博士学位期间的研究。Edwards 注意到现有的自动对话系统无法与人类语音的细微差别和复杂性相匹配——因此他着手开发一种替代方案。
Edwards 是2016 年一篇论文的主要作者, 该论文介绍了“以动画师为中心的发音嘴型同步视位模型”。 该论文的合著者包括 Chris Landreth,一位奥斯卡获奖动画师 ,曾担任多伦多大学动态图形项目的杰出研究驻校艺术家; Eugene Fiume,西蒙弗雷泽大学计算机科学教授兼应用科学学院院长,在多伦多大学获得研究生和博士学位;和 卡兰辛格,多伦多大学计算机科学系教授。
由此产生的软件利用面部动画装置帮助将音素映射到视位,被称为“JALI”——“颚”和“唇”的组合,论文称这两种解剖特征解释了视觉语音的大部分变化.
Watling 于 2020 年加入这家初创公司担任首席执行官,这一年该公司宣布其软件将为赛博朋克 2077 的 面部动画提供动力 。
她说 JALI 技术的一个关键优势是它使工作室能够以相对较低的成本扩展面部动画。这与关键帧和动作捕捉动画等更昂贵的方法形成对比,后者只对最大的工作室在财务上可行。
“电子游戏世界正变得越来越广阔和身临其境,”她说。“与此同时,游戏玩家对公司的规模相当不分青红皂白。因此,无论您是两人工作室还是大型跨国工作室,对更高沉浸感、更真实感和更高制作价值的期望仍然得到应用。
“我们的技术确实提供了大规模捕捉理想质量的能力,这样投资回报就会随着时间的推移而增加,从而使较小的工作室能够超越自身的重量。”
她感谢多伦多大学广阔的创新生态系统——尤其是 UTEST 项目,该项目目前 正在为其下一个队列接受申请 ——帮助该公司将其研究从实验室推向市场。
“UTEST 计划是课程的完美结合——其中一些是通过 MaRS 提供的,另一些是通过与支持初创企业生命周期中的企业(包括知识产权律师事务所)的各种导师的合作伙伴关系,”她说。“您可以在各个方面与 UTEST 的领导层密切合作,无论是思考您的问题空间或价值主张,还是改进您的宣传。
“同样,创新与合作办公室非常擅长帮助初创公司从最初的构思和发明过程发展到可行的商业道路,克服官僚主义、法律障碍和公司注册。
“我们发现这种体验非常有帮助。”
标签: