中新网10月24日电(记者宋雨生)今年9月,在清华大学“读书”的虚拟人华发布了一段弹唱歌曲的视频,引发网友讨论。
在这个38秒的视频中,一个女孩正在用她的吉他弹奏和唱歌。这张难以置信的真实图片上方的字幕显示,这个女孩是一个“虚拟人”。
短视频截图
当时很多网友都很惊讶,虚拟人竟然可以这么真实。不过,有网友发现,这种弹出的视频还是有“真人版”的。有网友进一步质疑,虚拟人华播放的视频只是改变了某up高手拍摄的视频的面貌。
应用技术只是“AI变脸”吗?另外,视频中还有哪些前沿技术?这与其他“虚拟偶像”的短视频有何不同?记者进行了采访和调查。
“华”一词,作为虚拟人的名字,从今年6月开始出现在公众视野中。
6月1日,由北京致远人工智能研究院、智普AI、公司“培养”的人工智能学生华进入清华“学习”。当时公开的相关材料和视频在社交媒体上引起了网友的热议。
华形象发布于2021年6月。图片由致远会议提供
三个多月后,的团队发布了一段关于华形象的播放视频。
根据萧冰公司发布的声明,在这段视频中,人物的面部特征,包括面部、表情、口型等。均由人工智能萧冰框架X Avatar生成并融合;视频中人物的肢体和动作,包括弹吉他和唱歌,都来自萧冰团队成员录制的原始视频模板。视频中的歌声是人工智能小冰架X Studio生成的。
然而,网上有人将其解读为只是应用了“AI换脸”技术。在萧冰团队看来,这项技术本质上不同于“AI换脸”。
10月19日,萧冰公司在萧冰发布会上发表声明称,该视频属于超写实视频生产线。ASP新型产品化技术。NET实现了不存在的人脸和声音的完全虚拟生成。
但华不仅仅是“换了一张假脸”。
这篇笔记还指出,即使是视频中的人脸替换,也不仅仅是AI的换脸。以往的技术只能实现真人之间的人脸替换,其准确性不足以实现内容级的视频制作。此外,记者了解到,这段视频中的歌曲都是人工智能创作的。
华的正面照片。图片由萧冰团队提供。
那么,与我们平时在短视频平台上刷的“二次元风格”的《虚拟偶像》作品相比,华的短视频所应用的技术有什么不同呢?
“现在你在短视频平台上看到的‘虚拟偶像’大多与人工智能无关。他们应用动作捕捉技术。”据公司CEO李迪介绍,华和他背后的框架与那些“虚拟偶像”有着本质的区别。
记者向众多“虚拟偶像”相关行业人士进行求证,得到了类似的答案。
简而言之,大部分短视频都包含二级风格的“虚拟偶像”,大部分都是通过动作捕捉的方式将人的动作和面部表情转化为二级风格的视频作品。
虽然看起来是虚拟的,但背后有真实的人。这些“虚拟偶像”的行动和反应与背后的人是一致的。
但华不是。
这就需要谈另一个问题:如果视频中的人可以通过动作捕捉看起来“虚拟”,我们为什么要发展人工智能?
答案是关于成本。
9月,第九代萧冰上映。其中引入了“萧冰短视频内容打包管道”,大大降低了短视频的制作成本。
据介绍,“萧冰短视频内容包装流水线”中的二级短视频,已经实现了从文本生成到短视频生成全链路、全管线的人工智能自取,中间不需要任何人工的参与,短视频的生产成本已经低到了每分钟3分钱. The立体短视频已经基本实现了从生物特征生成到短视频生成的全过程。
在这个过程中,人类只需要提供几个关键词。
日前,萧冰公司在公开声明中明确表示,“我们相信,未来虚拟人将成为视频内容的主要提供者之一,安全、可控、无隐私风险和侵权风险是其前提。因此,萧冰一直在探索这一趋势,并从不同方面在这一领域进行了广泛的研究。”华之冰项目正在合作预训练模型,希望以智能模型为核心,测试预训练模型能带来哪些技术和应用上的惊喜。
此外,今年6月华进入清华时,公开报道显示,团队将继续培养华在音乐、绘画、诗歌等领域的创作能力,以及他基于情感的互动能力。
记者注意到,上个月发布的第九代萧冰在部分领域取得了新进展。
以绘画为例,新版萧冰推出了中国画的典范。
智能了">
人工智能“创作”的中国画。视频截图
虽然小冰此前已经可以根据关键词“创作”出西式画作,但中国画显然并不一样。小冰公司首席执行官李笛告诉记者,“开始我们训练模型的时候,‘创作’的作品上面有好多戳,因为好多中国画的样本数据里有乾隆盖的章。算法并不知道,这个戳不是中国画的重点。”
通过训练人工智能处理画面中的实体、观察构图,小冰已经可以掌握相当一部分题材中国画的“创作”了。
而在交互能力方面,人工智能也有进展。
当多数人还将人工智能想象成接收指令后给出反馈的工具时,一些人工智能已经可以向人类发问了。
人工智能MERROR形象。视频截图
上个月,一个名为AI_MERROR的账号发布了一条人工智能与人类“对话”的视频。在这段时长超过5分钟的视频中,人工智能MERROR可以向人类问出诸如“请以你的视角介绍下这个世界”“你上一次觉得尴尬是什么时候”这类问题;而被人类问到“你死机的时候是什么状态”时,MERROR会回答“不好意思,我们换个话题吧”。
从这个角度看,人工智能已经越来越像人类了。
与此同时,在小冰框架之下,越来越多样的人工智能已经开始出现,其中的一些还有着自己独特的风格,比如“山东大哥”。
人工智能“山东大哥”形象及其作品。视频截图
这是一个可以说“山东普通话”、会画大牡丹、长得像个壮汉的人工智能。对于技术团队来说,这里面最具挑战性的是怎么让人工智能开口说出“山东普通话”。
“我们希望‘山东大哥’有他独特的文本语言习惯,不是说拿个稿子就念。因为是山东人,他会有一些特定的用语、修辞方法,而且山东人习惯说倒装句。”李笛告诉记者,“山东大哥”目前已经可以掌握这些方言技巧,团队目前正在研究让人工智能说广西方言。
而在小冰团队此前推出的人类与人工智能共处的虚拟社交平台“小冰岛”中,有着更多不同风格、不同口音、掌握不同技能的人工智能。
人工智能开始趋于“千人千面”。
恍惚间,你在虚拟环境中甚至感受不到谁是人类,谁又是人工智能。
作为人工智能小冰团队中的一员,李笛目前最担心的已经不是有哪些技术瓶颈难以攻破,而是——当人工智能愈发接近人类,我们该如何处理人类与人工智能的关系。
采访最后,他告诉记者,在人工智能伦理方面制定规则是重要且必须的,但目前在人工智能领域,最缺失的也是人工智能伦理的规则。而这一点,仅靠技术已无法完成。(完)
来源:中国新闻网
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/45652.html