前言
2022年底ChatGPT发布,各行业一度陷入恐慌,其中AI生图技术的效果和速度令人们惊叹,以创意为核心竞争力的设计师群体首当其冲。 然而很快我们发现,AI在模仿和融合设计方面的能力非常惊人,在灵感激发和设计过程中善用AI工具能极大提高创意效率。在广告营销领域,国内外品牌纷纷将AIGC融入营销活动,用传统创作手段与AI技术碰撞出新的视觉效果甚至新的产品。
不可能完成的任务?
网络广告投放的优势在于千人千面,这就需要持续供给大量的广告创意。过去这项工作全部由人工完成,设计师需要基于一些图片素材、用大家熟悉的PS、拍摄等方式进行创意设计。由于每周要供给几千个新物料,而耗时费力地制作精致美观的图片又未必能带来更高的收益,因此逐渐发展成数量级遇瓶颈且物料视效不优的局面。在控成本的情况下,想要把物料数量再提升一个量级、同时提高美观度,这几乎是不可能的事情。而如今的AI技术让我们看到了希望。 我们与产品和研发经过一段时间的研究,使用Stable Diffusion生产出了海量的图片物料,产能和画面质量都超越了传统人工生产模式。从新手翻车到轻车熟路
对于百度APP的广告物料来说,使用AI生成可用的图片并没有想象中那么容易,我们在尝试Stable Diffusion的初期屡屡翻车。在这个业务场景中,目标是向用户推广百度APP的搜索功能,我们需要基于搜索query(即用户搜索词)生成物料的底图,例如“家常肉丸子”、“如何给汽车加油”、“面霜推荐”、“麻辣小龙虾的做法”等等,内容类型包罗万象。 Stable Diffusion界面的上手难度略高于Midjourney,但基本原理相同,于是我们针对具体query,选择适合的大模型和Lora、扩充正反提示词并反复调参,这样可以顺利生成一些效果不错的图片。
手自一体发动量产
几十万个query,似乎又是一个不可能完成的任务。 我们重新从query的分类入手,由设计师针对一些高收益的垂类提炼相应的提示词模板,每套模板不包含画面主体提示词,仅用来稳定控制画面的色彩和视角、物体的质感、人物的情绪等等,再由研发批量添加主体提示词、接入Stable Diffusion批量生图。 设计师在撰写调试提示词模板时,需要针对不同垂类的特点做差异化定制,一方面要确保图片内容正确、另一方面要控制风格与这类query相匹配。比如,针对「生产制造」类,选用“Realistic_Vision_V5.0.safetensors”等写实画面的大模型,添加“工业”、“机械”、“光滑”等提示词,体现机械设备的特征;而针对「医美」类,选用“braBeautifulRealistic_v40”等擅长绘制亚洲美人的大模型,使用“女孩”、“青春活力”等正向词来呈现健康美丽的人像,用“变形”、“扭曲”等反向词避免人体畸形。道阻且长,行则将至
在量产投放过程中我们发现,物料数量与数据效果不一定正相关,而底图画面的精美度与数据效果也并不总是正相关,因此我们也在积极地研究提升数据的方法,设计师针对业务的关键数据指标,从视觉方面和用户视角思考更多解法。结语
一切都才刚刚开始,我们看到目前的AI能力还无法实现全自动化,现阶段需要由设计师使用专业术语跟AI对话,并通过分析实际应用场景和一次次的数据验证反推出相应的解法再操控AI,不断摸索人机协作的方式去落地应用。 当下,设计师掌握AI工具已成为一项新的基础能力,我们也要具备更强的业务思维,才能用新工具发挥出更大的商业价值。同时我们也会持续关注AI的发展,应用最新的技术能力做更多尝试,在AI的浪潮中将更多的不可能变成现实。 更多精彩作品展示,请关注「百度MEUX」小红书账号869010907 感谢阅读,以上内容均由百度MEUX团队原创设计,以及百度MEUX版权所有,转载请注明出处,违者必究,谢谢您的合作。申请转载授权后台回复【转载】。也欢迎加入MEUX,交互/视觉/用研
可投简历至meux-talent@baidu.com
(注明信息获取来源如:公众号)