DALL·E「简介」
DALL·E是OpenAI公司在2021年12月发布的一个新型语言模型。它使用了一种名为”对抗生成语言模型”(AGLM)的技术,可以生成文本、图像和其他多媒体内容。
DALL·E可以根据给定的文本描述生成图像,例如“一个有着红色头发和黄色眼睛的女孩”。它还可以生成文本描述图像,并且还可以生成其他媒体类型,例如音频。DALL·E是在GPT-3的基础上开发的,具有更高的语言理解能力和生成能力。
链接🔗:https://labs.openai.com/
原理介绍(与Midjourney不同哦!)链接🔗:DALL·E 2(内含扩散模型介绍)【论文精读】_哔哩哔哩_bilibili
在使用DALL·E前,你需要了解
💰钱
- 科学上网费用🥹
- 含50个credit免费
- 基础引擎生成花费1credit,高级引擎需要订阅
⌚️时间
- 上手≈10min
🔧语言&技术
- 支持中文输入prompt
-
⭕️DALL·E与Midjourney
使用上有什么不同
DALL·E网页无需下载与部署,而Midjourney使用的是Discord的Bot(需要下载)
- DALL·E可以上传图片,通过交互界面对改图片进行衍生补图延长图像,或者框选中部分局部修改。Midjourney只能生成特定大小的图片,用代码局部修改比较麻烦
- Midjourney 的社区生态更加优质,可以可以得到大量的Prompt参考。
出图效果上有什么不同
来源:最强人工智能DALL·E测评 | 它真的有那么强么 | 跟midjourney比较谁更厉害?_哔哩哔哩_bilibili
图片 | Midjourney | DALL·E |
---|---|---|
✅更加有质感,细节上更丰富 | ✅图片右下角有防滥用的彩虹签名。 | |
画家风格的画 |
✅更好地掌握某种风格 | ❌变体较多,不一定完全符合需求 |
蛇的戒指 |
✅形态上更为抽象(甚至失真) ✅色彩上更加华丽 |
✅形态上更为准确 ✅色彩上更加真实 |
冰雪女王 |
✅风格化较强 ✅❌在无垫图情况下,更加擅长正面人像 |
❌风格化稍弱 ✅在毫无垫图的情况下,生成多角度人物 |
带珍珠耳环的小兔子 |
❌两元素融合时,画面扭曲多 | 两元素融合时,更能理解自然语言,能够在合适的地方结合。 (因此,DALL·E更擅长智能延长画面) |