DALL·E「简介」

DALL·E是OpenAI公司在2021年12月发布的一个新型语言模型。它使用了一种名为”对抗生成语言模型”(AGLM)的技术,可以生成文本、图像和其他多媒体内容。

DALL·E可以根据给定的文本描述生成图像,例如“一个有着红色头发和黄色眼睛的女孩”。它还可以生成文本描述图像,并且还可以生成其他媒体类型,例如音频。DALL·E是在GPT-3的基础上开发的,具有更高的语言理解能力和生成能力。

链接🔗:https://labs.openai.com/
原理介绍(与Midjourney不同哦!)链接🔗:DALL·E 2(内含扩散模型介绍)【论文精读】_哔哩哔哩_bilibili

在使用DALL·E前,你需要了解

💰钱

  • 科学上网费用🥹
  • 含50个credit免费
  • 基础引擎生成花费1credit,高级引擎需要订阅

⌚️时间

  • 上手≈10min

🔧语言&技术

  • 支持中文输入prompt
  • [ ] Web网页端,无需下载。与ChatGPT共同账号

    ⭕️DALL·E与Midjourney

    使用上有什么不同

  • DALL·E网页无需下载与部署,而Midjourney使用的是Discord的Bot(需要下载)

  • DALL·E可以上传图片,通过交互界面对改图片进行衍生补图延长图像,或者框选中部分局部修改。Midjourney只能生成特定大小的图片,用代码局部修改比较麻烦
  • Midjourney 的社区生态更加优质,可以可以得到大量的Prompt参考。

    出图效果上有什么不同

    来源:最强人工智能DALL·E测评 | 它真的有那么强么 | 跟midjourney比较谁更厉害?_哔哩哔哩_bilibili
图片 Midjourney DALL·E
image.png ✅更加有质感,细节上更丰富 ✅图片右下角有防滥用的彩虹签名。image.png
画家风格的画
image.png
✅更好地掌握某种风格 ❌变体较多,不一定完全符合需求
蛇的戒指
image.png
✅形态上更为抽象(甚至失真)
✅色彩上更加华丽
✅形态上更为准确
✅色彩上更加真实
冰雪女王
image.png
✅风格化较强
✅❌在无垫图情况下,更加擅长正面人像
❌风格化稍弱
✅在毫无垫图的情况下,生成多角度人物
带珍珠耳环的小兔子
image.png
❌两元素融合时,画面扭曲多 两元素融合时,更能理解自然语言,能够在合适的地方结合。
(因此,DALL·E更擅长智能延长画面)

使用教程视频

点击查看【bilibili】