副标题:关于 AIGC 的 7 个问题

一、AIGC 是啥?

AIGC,即指人工智能生成内容(Artificial Intelligence Generated Content)。介绍之前,先说两个相对应的概念:

  • 专业机构生产内容(Professionally Generated Content,PGC),典型的 PGC 产品可以参考爱奇艺的自制剧。
  • 用户生产内容(User Generated Content,UGC),对应产品可参考知乎、Bilibili、抖音等等。

与 PGC 和 UGC 不同的是,AIGC 的内容生成主体是「人工智能」,更直白的说,是机器和算法模型。生成内容多种多样,包括但不限于文本、语音、图像、视频、3D 模型……
早期的内容自动生成技术主要依据既定的模板或规则,进行简单的内容输出,与灵活且真实的内容生成还有很大的差距。近年来,深度学习快速发展,深度神经网络技术在大模型和多模态两个方面的不断突破,让世界看到了AIGC 的真正魔力。
举个例子,之前我们所谓的人工智能客服都是按照事先设计好的话术进行交流,一旦超出规定场景和语境,智能客服就变得很尴尬。而 ChatGPT 引爆的这一轮 AIGC 技术与其本质区别在于开始有自己的「思想」了,并且可以通过学习不断进化,当然我们说的这种「思想」是人为引导的,并不是真正的「自我意识」。
以 ChatGPT 为代表的新一轮的 AIGC 技术最牛逼的地方在于它的「学习」能力,不再是以前的死记硬背,它已经进化出了某种程度的学习能力。它可以对你的输入(通用任务)进行逻辑分解,然后去「理解」你的输入,最终以人类的智力水平执行完成。而且,它还能结合使用者的反馈对内容生成进行优化,来完成自我的「进化」。
现在,AIGC 的概念已经得到了认可,而且已经有很多的个人或组织将 AIGC 融合到了他们的工作流程当中。比如 AIGC 帮助科研人员读论文、AIGC 帮助团队做会议总结、AIGC 帮助新媒体运营团队写文案和脚本、AIGC 帮助设计师「出图」……
从 PGC 到 UGC,再到 AIGC,这个历程意味着内容生产主体从「内容集中式」的机构转移到象征着「内容民主化」的个人,然后继续转移到善于使用 AI 辅助创作的「超级个体」——甚至可以是独立工作的 AI 本身。

二、AIGC 怎么突然就火了?

任何技术都不是一蹴而就,新的技术在落地应用之前,大众是无太大感知的。
AI 在跨入「生成式」之前,它能「施展魔法」的领域还比较局限,主要的商用场景在「判别式领域」。
AI 技术从判别式到生成式的发展
举一个日常生活中的例子——人脸识别。
2015 年,基于深度学习的计算机视觉算法在 ImageNet 数据库里的识别准确率首次超过人类。此后,人脸识别系统迅速取代了数字密码(可以回顾一下 2017 年 iPhone X 的发布),可识别商品的自助结算系统也很快进入了各类线下门店,自动驾驶也用上了 AI 的视觉判断来帮助汽车完成环境感知。
2017 年,Google在「Attention is all you need」一文中提出 Transformer 模型,预示着 AI 能施展魔法的疆域来到了从「判别式」到「生成式」的分界点。
2022 年 4 月,DALL·E 2(OpenAI 推出的基于 Transformer 的文生图模型)发布;2022 年 7 月,基于 Diffusion Model 的 Midjourney 发布。
DALL·E 2 和 Midjourney 这两款文生图产品改变了人们对于 AI 能力的偏见,图片生成的效果让人们看到了 AIGC 在文生图领域商用的可能。这个时候,走在文生图应用前沿的人群已经嗅到了 AI 背后孕育着更为强大魔法的气息。
然而,DALL·E 2 和 Midjourney 只是 AI 2.0 时代来临的「报幕员」,第一位真正的主角是「ChatGPT」,准确地说,应该是 ChatGPT-3.5。
2022 年 11 月,ChatGPT-3.5 一经推出,持续引爆互联网——上线 5 天就收获了 100 万用户。根据瑞银集团研究报告显示,其在 2023 年 1 月末月活用户已经突破了1亿,成为史上用户增长速度最快的消费级应用程序。
接下来的事情,大家应该都知道了。GPT 差不多是将人类社会的变化带入了以「天」为计算单位来衡量。

三、GPT 很牛逼吗?

很牛逼。
GPT(基于转换器的生成式预训练模型,Generative pre-trained transformer)解决了语言问题(至少看起来如此),通过了图灵测试,意味着新的交互革命。
业界对其评价可谓是毫不吝啬溢美之词:

  • 英伟达创始人黄仁勋称其开启了「AI 的 iPhone 时刻」
  • 比尔·盖茨认为 AI 革命的重要性不亚于互联网的诞生
  • 微软 CEO 纳德拉则表示这种技术扩散堪比工业革命

从其他大佬和互联网巨头的行动也可以窥见上面的形容不只是一句「彩虹屁」,而是货真价实的蓝海机会。
对面的 MicroSoft、Google、Amazon、Meta 等巨头已经开打了。国内这边,美团王慧文带资组团再创业;李开复撸起袖子下场;百度、阿里巴巴、字节等国内互联网大厂也纷纷入局。目前来看,除了 MicroSoft 在 2019 年就投资了 OpenAI,其他玩家都是追赶者。
如果说云计算是互联网行业的上一个技术高地,那以大语言模型(Large Language Model,简写为 LLM)为代表的 AI 技术将是互联网行业的下一个技术高地。
如果说深度学习引领了上一个十年,那么 GPT 将大概率会引领接下来的十年。

四、AIGC 大致是什么原理?

现有的 AI 模型并不是完全的「无中生有」。
不管是文本还是图像,都需要基于互联网上已有的海量数据进行再次的生成。这种生成是基于统计学上的关联在进行推理和预测。
换句话说,人下一个会说出口的词,往往就是统计学上下一个最可能出现的词。而机器要做的,就是通过对大量数据的学习来用推理和预测得更加准确。
将词与词的关系类比到像素与像素的关系,其实就对应上了图像的生成。

五、AIGC 能干点啥?

按照内容形式(行业里面叫「模态」)来分:

1、文本

  • 聊天:比如客服、口语练习(对话角色扮演)、心理咨询等专业领域的咨询
  • 写作:比如总结文章、写文章提纲、编写或改写文案内容,语法检查等
  • 代码:代码生成、补全和解释等

    2、图像(视频)

    主要说图像。当前 AI 模型的视频生成能力还不够「惊艳」,但我们可以脑补一下由 AI 生成的虚拟形象,用着 AI 生成的脚本,说着 AI 生成声音,来带货直播是个什么场景。

  • 对于普通人群:艺术设计变得人人都可触及

  • 对于插画师、设计师等专业人士:插画、设计稿方案生成、草图转渲染图,将 AIGC 加入现有的工作流可以显著提效率。

    3、音频

  • AI 语音的识别、合成其实早已经被商业化了,但是用 AI 来生成音乐就会更加有意思,也更加有挑战。

  • AIGC 完成声画同步也是一个蛮难的点,可以保持一下期待

其他的形式还有 3D 模型、游戏等等。
目前 AIGC 的应用还比较初阶,主要是体现为各种各样的 AI 辅助工具。然而。仅仅是一个辅助工具,就具备了将互联网时代诞生的所有东西都加持一遍的潜力。
未来,AI 与个人数据和更多终端设备的结合将会诞生更定制化的私人助手,不管是工作上的事情,还是生活上的事情,它都能给你提供贴心、合理的建议,辅助你进行决策。

六、AIGC 会抢我饭碗嘛?

会抢一部分的。
从教育到咨询,从传媒到游戏,从广告到建筑,从金融到法律……AIGC 正在重塑职场。
一部分打工人已经开始调侃自己「Prompt 工程师」了,部分老板也开始在岗位描述上加上要求「熟练使用 AI工具提高工作效率」了。
过去,我们认为只有体力劳动或是一些重复性事务会被机器替代。但如今 AIGC 的出现,让人们看到机器已经在一定程度上胜任了之前一度被认为是只有人类才能完成的知识性、创造性工作,这很难不让人「如坐针毡」。
举个例子,大部分设计师的工作流程可以分为三个阶段:草图发散、方案收敛和设计图完稿、交付前修改,其中设计图完稿通常要占到差不多 60% 的时间。在 AIGC 的辅助下,只需要将草图「喂」给模型,加上一些提示语,就能大幅缩短设计图完稿的流程。这基本上重新定义了设计师的创作流程。
如果说文生图 AI 带来的影响还局限在特定行业和领域,那么,基于强大的语言理解和生成能力,GPT 带来的影响就广泛多了。我们会发现只要与字符相关的事情,它都能「插上一脚」。毫无疑问,这一脚会先落在办公场景,尤其是数字化程度高、信息知识密集的行业(比如互联网)。
OpenAI 与宾夕法尼亚大学共同探索大型语言模型如何影响美国劳动力市场,研究估计,对于 19% 的岗位,至少50%的工作内容会被影响。这部分岗位的影响大致有两种形式:

  • 同样的人,能干更多的活了,那还有一部分人就可以「毕业」了
  • 同样的时间,能干更多的活了,那多出来的时间就可以放假了

会是哪种情况,我想应该也不需要猜了。
不过,搞预训练模型、对话机器人、AIGC 应用这些与 AI 本身强相关的打工人大可放心,这部分岗位都是「香饽饽」,且工资在未来十年差不多都是独领风骚的。
当然,不在这个行业的人们也不必过于悲观。AIGC 一定会是人类社会生产力前进的助推器,如果国内的头部玩家能抓住机会握住这把利刃,一定会产生一轮新的技术红利。所以不妨换一个角度,我们可以想想,AIGC 还能催生哪些新岗位。这里先抛一个,创作者经济应该会迎来进一步发展,脱离传统职场叙事的「超级个体」会越来越多。

7、我该做点啥?

还是用《Read me》中的一段话回答这个问题:

第三次科技革命,信息与通信技术(ICT,information and communications technology)带领人类进入了数字化时代,给人类生产、生活造成了深刻影响。我们每个人每天都会通过终端设备产生和接受大量信息,这些信息无时无刻不在「信息高速公路」上穿梭。 当下,以 GPT-3.5 引爆互联网为标志点, AIGC 正在为我们打开下一个时代的大门。在这个新的时代,AIGC 将会带来生产力的变革,AIGC 将协同它的「指令下达者」一起完成内容的生产与消费。 就像移动互联网时代绝大部分人们都会使用智能手机一样。面对这个新的时代,我们要开始去了解、适应、学习和使用 AIGC。

所以,你好,AIGC!