演讲之所以迷人,核心在于其传递的那份无可替代的真实情感。但试想一下,若有一天,一个虚构的数字化分身出现,它不只是长得跟你惊人相似,甚至能够复制你那独一无二的声音。在某些特别的时刻——例如制作节日祝福视频时,借助AI技术融入一丝独特的情感,这是否同样能触动人心呢?这种技术的应用,不仅仅为我们的日常生活带来了极大的方便,更是为个性化的表达打开了一扇全新的大门。

真人录制演讲视频

人类的演讲视频,通常是需要把演讲给录下来。这个录制过程不仅要关注背景、演讲者的表现状态,还需要拍摄设备等。即便是并没有很花心思的视频也需要写稿子(可能是腹稿),而后录制。

AI模拟演讲视频

AI数字人等技术可以帮助我们实现虚拟人演讲。视频是个复杂的工程,有很多种方式可以实现AI制作演讲视频

我们可以使用头像图片结合录音(演讲稿录制)的方式生成视频,典型代表是Heygen。Heygen可以使用一张头像或卡通头像生成视频,视频的画面完全由AI根据照片合成,而视频的声音可以文稿生成或者人工录制。

此外针对部分人不想要露脸的小伙伴可以使用AI换脸技术来达成以卡通或者动物头像来做演讲。不过这部分要注意不侵犯他人的肖像权。

AI语音合成

目前AI可以合成语音,而且可以根据个人音色进行合成。也就是说,我们可以让AI发出我们自己的声音。在这个基础上,我们只需要把讲稿给到AI,AI就可以生成我们的演讲。第一个比较有影响的是前巴基斯坦总理伊姆兰·汗利用AI语音克隆在监狱里发表演讲。

此处为语雀卡片,点击链接查看

前巴基斯坦总理伊姆兰·汗地演讲
(打开链接或者扫码观看) https://www.yuque.com/klxk/aitalk/gw8qfcsl8qsliexm?inner=XT7dC

AI直接做演讲 - 图1

AI驱动的人演讲

单纯语音合成可能和真正的演讲还有些差距,为此还有人会为我们的语音进行配画面。我们可以使用和讲者无关的画面来配置画面,也可以使用讲者来配画面。目前有两种技术:

  1. AI驱动照片根据语音简单活动

AI驱动照片主要是让嘴和语音同步,代表的AI如HeyGEN。Heygen能够根据文本,将一张图像生成一份口播视频。这个头像可以是卡通的也可以是真人。

  1. AI驱动个人形象活动

AI驱动个人形象我们可以类比是数字人。数字人目前已经被广泛地应用在直播上,而数字人还有个非常好的领域就是做短视频。数字人可以帮助老师讲课、导游导览等。

我们用AI虚拟人和文稿直接生成视频,典型代表是硅基智能等技术,他们能够让虚拟人做直播带货而人类感知不到它是假的。

这里也向大家提醒的是目前AI制作的视频也被用于诈骗,大家需要注意。请大家自己注意、告知父母注意。

无限可能的AI演讲

AI目前已经可以合成非常逼真的演讲音频,而演讲画面也在快速完善中。我们相信未来会有更多的AI演讲诞生。

参考资料

  1. https://m.huanqiu.com/article/4FpP51prgVf