—————— / BEGIN / —————
在过去的几年里,人工智能(AI)取得了极快的发展。 ChatGPT和GPT-4对话上的智能程度在不断刷新常人的认知,给大众带来了惊人的体验与惊叹。 同期发展的AI技术,还有基于机器学习和深度学习的「图像生成技术」。 该技术能够让计算机在一定程度上模拟人类进行绘画,用户只需输入文本语句(prompt提示)就可输出具有独特风格和想象力的图像。 文本->图像,AI绘画,指的就是这个过程。 随着大众对于AI绘画关注度的升温,相关的争议不断,有人开始提出「AI取代画师」的观点。 面对AI绘画这个势不可挡的趋势,设计从业者们,是否做好了准备?AI绘画,高效无情的出图机器
2022年8月,在美国科罗拉多州艺术博览会上一幅名为《太空歌剧院》的画作在数字艺术类别比赛中获得了第一。1. 国外知名的AI绘画工具
下面先介绍几个国外具有代表性的AI绘画工具:1)DALL·E2
DALL·E2 是一个由 OpenAI 公司开发的模型,也是一个在线服务。它通过输入一个文本描述(prompt提示)生成多个精准匹配文本的图像。2)Stable Diffusion
3)Midjourney
Midjourney由同名实验室开发,和大部分市面上的AI绘画应用采用的是同一个模型,但是模型使用了大量图像数据来训练。 Midjourney在生成图片的一致性和连贯性上做了很多努力,它生成的图像风格十分独特。 Midjourney几乎所有的生成和交互都发生在Discord社区里,使用其Discord机器人来接收请求和发送生成结果。①Stable Diffusion
Dream Studio:https://beta.dreamstudio.ai/dream Hugging Face(免费): https://huggingface.co/spaces/stabilityai/stable-diffusion②DALL·E2
https://openai.com/dall-e-2/ CLIP:https://openai.com/blog/clip/③Midjourney
https://www.midjourney.com/home/ (注:某些服务只对部分国家开放) Midjourney的效果更具艺术感: 对比生成效果可以明显看出,Midjourney生成的图像不太像照片,似乎更像一幅艺术画作。 在Discord社区里运作的Midjourney社区 ,因为其具有艺术感且画面注重细节的生成效果,收获了全球近千万用户,在线用户也是百万等级。2. 国内的AI绘画产品
国内也相继出现了类似的AI绘画产品,几乎都有免费尝试的额度,通常支持多种风格/艺术家/模型。 以下是国内提供AI绘画服务的一些产品:设计行业 X AIGC
1. 游戏制作× AIGC
很多游戏项目,开始利用AIGC生产游戏相关素材。1)国外游戏工作室 Lost Lore《Bearverse》游戏
国外游戏工作室 Lost Lore 出品的主打 NFT 集换概念的F2P游戏《Bearverse》包含了大量的角色设计。 游戏工作室直言:采用AI画图节省了80%美术成本!①17名角色的调整:
开发成本:从5万美元压缩至1万美元; 工时耗费:从6个月大幅减少至1个月。②创作一张场景概念图:
工时耗费:从1-2周压缩至1天以内。2. 商业设计 ×AIGC
大厂团队已经不甘观望,开始了AIGC在商业设计工作流中的实践。1)腾讯-ISUX团队
腾讯的ISUX团队2023年3月1日刚刚发表在其官网的文章《运用AIGC人工智能生产内容》。2)百度-AIGC营销赋能业务
百度也在试图利用AIGC满足商业设计上的需求。 百度发布了AIGC方向的产品负责人岗位,负责比如”商业广告平台部的内容生产相关工具的规划和落地”。3. 个人头像设计× AIGC
1)国外的AI美图软件Lensa「魔法头像」功能
「魔法头像」是Lensa基于Stable Diffusion技术开发的头像生成功能,用户上传10-20张自拍照,能生成50~200张不同风格的AI自画像/头像。2)美图秀秀「百变 AI 头像 」功能
同样是美图软件的国内团队——美图秀秀,也随机发布了相似的功能。 从产品定位来看,也是输入真人头像就能批量地获得多种风格的头像。3)抖音「AI绘画」特效
继2021年的「漫画脸」特效(基于GAN技术)后,2022年抖音又上线了特效玩法「AI绘画」(基于Stable Diffusion技术)。 用户只要输入一张图片,AI就会根据图片生成一张动漫风格的图片。4)QQ小世界AI画匠
腾讯QQ上线了”QQ小世界AI画匠”活动,主题为”异次元的我”。 用户上传1张个人照片,即可一键生成专属异次元形象。4. 动画背景× AIGC
1)国产志怪类动画《神弦曲:猫儿与时光铃铛》
由十九号动漫出品的国产志怪类动画《神弦曲:猫儿与时光铃铛》将于明年上映。官方在2022年12月发布了预告片。 主创团队称,预告片三分之二的背景都是结合AI制作完成的。 制作预告片中的30多个背景,工时耗费从3个月降到2个月,效率上提升了至少30%。5. 视频制作× AIGC
除了绘画领域外,AIGC也在动态的视频生成上有了很多突破。1)Runway 新功能:视频转风格生成器 GEN 1
Runway AI 是一家图片和视频AI编辑软件提供商,为设计师、艺术家和开发人员提供一系列工具的平台,帮助他们利用人工智能技术创建作品。 Runway 平台推出了新功能 —— 把视频转换成任意风格的生成器 GEN 1。 GEN 1 这个能力和图生图功能(image-to-image)类似,只是变成了从视频到视频(video-to-video)的生成。2)Wonder Studio:一键替换真人为CG角色
这款由一家人工智能初创公司Wonder Dynamics推出的AI工具Wonder Studio,声称可以实现「一键把视频中的真人替换为CG角色」,简化电影制作流程。AI绘画的争议
在设计行业中,很多人的对于AI绘画的态度,都是不怎么正面的,主要集中在几点: 从业者的担忧 版权 学习信心的打击争议1:从业者的担忧
在AIGC生成绘画能力效率和质量皆可的前提下,中底层画师好像确实慢慢就不需要那么多了…… 论出图速度:人赶不上机器的出图速度; 论出图创意:AI 可以生成出关键元素外的细节,似乎更为惊喜; 论风格效果:AI 能训练出不同的绘画模型,对应不同画风; 输入相同的一段prompt文本后,不同的模型可以生成出不同风格的图片,且速度极快,通常是几秒~20秒内不等:一个戴着黑框眼镜的美女,抱着一只小兔子 A beautiful girl in black-rimmed glasses, holding a bunny in her arms |
|
---|---|
Midjourney 模型 画面注重细节 |
![]() |
Niji 模型 Midjourney 模型的二次元版 |
![]() |
Novel AI 模型 更偏日漫的二次元风格 | ![]() |
LoRA 模型 真人写实照片风格 |
![]() |
争议2:版权
我们在AI绘画出的作品中能看到很多有明显风格的影子。 也可以直白地说,一些AI绘画模型的训练数据中,有着很多未经明确授权的画师作品。 AI绘画侵犯了画师的版权,也开始遭到画师们的集体抵制。 2022年8月29日,一个名叫mimic的AI绘画网站上线了测试版,主攻日系二次元画风头像,允许用户上传15-200张图像让AI学习并输出相同画风的AI画作。没想到刚发布便遭到大量日本画师的抵制,画师们集体发表了”禁止将我的作品用于AI作画”的声明。有的画师为了防范于未然,甚至删除了发在推特上的画作,怕有心之人盗用上传至平台使用。争议3:打击小白学绘画的信心
AI 绘画的强势碾压的能力,似乎也打击到了不少绘画小白从零开始学绘画的信心。 有的人会感叹: 既然AI几天就能学到做到那么好的效果了,自己再花费数年去学习,还有没有必要…AI 绘画的短板
AI绘画当然不是全能的,也永远不会是。至今的AI绘画也还存在着众多短板。短板1:AI 无法准确还原想象中的创意
AI绘画的确具有非常强大的创造力和想象力。但这样的创造力和想象力,其实是一种「快速随机」的结果。 效果既受限于算法、数据的质量和数量,也受限于用户对于prompt的运用。 人类的创造力和想象力仍然具有独特的价值,想要AI生成还原出来十分贴合人脑想象中的创意,是很有难度的。 不少尝试了MidJourney进行AI绘画的人表示: AI生成的图片效果确实是不错,但都并不是我脑海中想象的那个样子。 甚至,AI会理解失误,生成”离谱图片”: 输入的文本是:一个小女孩,一手拿着冰淇淋,一手牵着气球,走在公园里。 AI生成出的却是——“冰淇淋气球”。短板2:AI 绘图还不足够满足个性化需求
AI 绘图是很强,但是还不足以满足个性化需求。比如: 针对不同场景类型进行统一且又独具个性的设计; 稳定一个主体使之在每一次生成结果中都保持成套效果;AI绘画的未来
尽管很多设计从业者对于AI绘画表示焦虑,但作者判断:未来很长一段时间内,大部分行业可能只会把AI绘画当成一个「辅助工具」来用。 前期,大家在拼AI的效率;后期,则是拼人工优化AI的能力。 人工优化AI能力,可以从以下3个方向出发。优化AI方向1:AI 模型的定制
想要模型更稳定地产出特定风格的绘画图片,可以定制出一个AI模型。 但AI模型的定制的门槛比较高,通常至少需要一个设计师搭配一个算法工程师来实现,而涉及到模型训练的过程,则需要工程部署能力、硬件显卡的支持。 模型训练出的效果也取决于多个因素,比如:训练素材、模型选型、参数设置、训练方法等。优化AI方向2:会用 prompt “咒语”
我们可以把”prompt”理解为”送给AI模型的文本指令”。 输入高质量有效的prompt,可以大幅度提升AI绘图的稳定度,让成图更加接近我们的描述。 prompt输入的格式通常可以是以下内容的一个组合: prompt文本输入=[形容词+主语 / 主语+状语],[背景],[画面类型],[风格/艺术家],[灯光/色调],[视角/修饰词],[细节],[画面质量] 因为这一体验过于神奇,很多人不禁将prompt形容为”咒语”。 在市场上,还出现了买卖prompt词的平台:一家初创公司PromptBase,允许用户在该平台买卖提示词(Prompt),售价约为1.99美元~9.99美元不等。PromptBase将向卖家抽成20%。 平台上目前已上架不少提示词,适合不同模型、不同种类。 而在学术上,也有所谓”prompt engineering” 即” prompt 工程”的说法。 提示工程(prompt engineering):如何同人工智能交流,并得到你要的结果。优化AI方向3:灵活组合模型,优化工作流
因为AI绘画工具的介入,现有设计的工作流程将随之而改变,整合诞生了全新的工作流: AI绘画先进行生成-> 再从AI生成的十几张结果中挑选用作局部素材->再利用PS或其他工具精修处理画师的命运
等着被取代,还是转型?
我们经常看到一些新的AI技术应用的效果出现后,很多人立马开始感叹:AI抢饭碗了、AI取代设计师、失业倒计时+1…… AI绘画的能力不容忽视,但它也不是万能的。 AI解决了生成效率,能在一定流程上减少一部分工作量。但又因为AI绘画引入了新的工作流,同时会创造新的工作量。 相应地,一些新的就业岗位也会增加,比如现在就有俗称为”AI调教师”的一种存在。 在某些绘画领域中,也已经有了”AI插图绘制师”、”AI绘图师”的人力需求:结语
借用一段”腾讯ISUX团队”文章中的结语: 随着AI模型能力的飞速迭代升级,现有的短板能力也会不断补齐,因此我们可以相信在不远的将来,设计师利用AI模型来开脑洞并辅助出图是趋势所向,但并不是说我们需要完全依赖AI,因为设计本身是理性而浪漫的工作,仅靠随机性做设计是完全不可取且不靠谱的。更合适的思路应该是,设计师首先定义好规则与框架,从AI模型提供的成百上千个结果中寻找到最匹配我们诉求的结果,从而辅助我们更快更好的达成目标。 另外面对日新月异的的智能工具,我们应该保持终生学习的心态,做好时刻接受新事物的挑战,才能在越来越激烈的竞争中立于不败之地。 ——《运用AIGC人工智能生产内容》 AI绘画,还仅仅是AI技术应用的其中一环。 未来,AI将涉足3D模型生成、AI视频创作、AI作曲等领域。 更多AI能力也会发展,就像现在的AI绘画一样,影响和撬动相关行业的变革。 AI绘画会取代所有画师吗?不可能。 AI绘画会逐渐取代中底层画师吗?不无可能。 留给从业者的忠告,还是那句话:保持终生学习的心态,做好时刻接受新事物的挑战。 最后,送给所有打工人的心声:
上一篇:ChatGPT超强提示词指南
下一篇:无标题文档