Midjourney的下一步:脱离Discord,开放Api,加入编辑功能 原创 逗砂 AIGC研修社 2023-03-28 20:52 发表于浙江
今天早上推特上一个 midjourney 的重度用户发了一条这样的推特,总结了 MJ接下来的几个发展方向,这个并不是 MJ 的官方发布的,但是这些信息在MJ discord上每周的公开会议里确实都有提及。
这些内容包括:
- Inpainting 也就是图片的修改编辑功能。
这个最是Dalle2最先推出,然后又成为了SD的基础功能。
- Outpainting (“zoom-out” feature) 就是图片扩展功能。
这个也是去年Dalle2最先推出,然后又成为了SD的基础功能。
- Image to Text using /describe 图片到文本的识别
这个有很多第三方的工具去识别图像里的提示词,但是这个功能真的可行么?MJ的私密功能其实就是为了让大家看不到提示词才设计的。反向获取目前没有哪个工具敢做,因为可能会危及到社区的一些创作者的权益。
- Higher Res Images (v6) 更高的分辨率,在v6算法
其实在此之前也有很多工具可以去拓展生成图片的分辨率,V6的分辨率是通过这种方式去扩展,还是在生成的过程就提升了这个目前不可知。其实现在的分辨率如果不是用于印刷,其实基本是够用的。
- Text Support (write words in images, v7/v8) 支持在图片中写文字
这个要到v7/v8 算法才支持了,可能类似于 Adobe firefly 里的一个功能。如何能够很好的在画面中呈现文字,以及去掉不该出现的文字,一直是一个重要的需求点,这个在 Adobe firefly 可以看到,但是做的其实很一般,希望 MJ的文字功能能够惊艳到大家,不过这个功能排在了 v7和v8 还是需要等挺长时间的。
- Mobile Experience 移动端的服务,可能有自己的APP?
MJ 一直没出APP,但是之前冒充MJ的APP倒是出过,官方这次终于打算自己做移动端了。但是也没有说明具体的时间点。
- Web UI (bye discord?) 告别discord,把功能迁移到网站。
MJ目前已经有1000w用户,这是一个非常可怕的数字。目前在Discord上的运营和生成已经有点不堪重负,MJ经常间歇性崩溃,速度也越来越慢。脱离出 Discord 是必然的事情,只不过这个时间是什么时候还未可知。
- Real-Time Drawing 实时绘图
这个不是很懂具体指的是什么。
- APIs for tool building 发布 API 用于工具的构建。
这个开放API的传言已经感觉很久了,但是MJ并没有什么动静,也没有时间表。这个必然是大家最期待的一个功能。因为目前来说单纯从模型的效果,MJ必然是最优秀的,模型网站 https://civitai.com/ 上有很多大家反向训练的 MJ 的模型,不过都是细分的风格,在效果上肯定是比不上原生的。如果 MJ 能够开放 API 那么必然会有很多第三方的应用和服务构建在 MJ 的模型上。
开源VS闭源:Midjourney 与 stable dfiffusion 的战争
MJ现在仍然是最受欢迎的AI图像生成工具,但是我们从 google trends 可以看出 SD 的发布对 MJ 产生了很大的影响,而且单独的 SD 搜索已经说明不了问题了,因为现在的 SD 已经成为了一个生态。在这个开源生态上有着类似 controlnet 和 lora 模型, 这样优秀的功能和插件,这是 MJ 再好的模型都无法替代的。
现在MJ的社群里面也出现了对此不满的声音,比如下面这个:
我自从V3版本起就成为MJ的会员了。我每个月支付40美元,以便能够无限制地访问该服务,但访问受到严格限制。我尝试在我的硬件上使用Stable Diffusion了2天,所提供的控制量是MJ遥不可及的,这让MJ提供的服务显得有些可笑。我对我所支付的价格感到不满,因为我认为运行这种技术需要更多的成本。我们为什么不能像ControlNet、in/outpainting、动态提示等等一样拥有这些东西呢?我很想听听开发人员的意见,而不是管理员的意见。 你如何证明这是合理的?我不会离开这项服务。我认为它们都有优点和缺点。但我不再觉得我需要无限制地使用它。
其实这位同学的困扰我也有,我大概是从2022年的5月就开始使用MJ了,一直以来都觉得MJ才是最优秀的AI绘画生成工具。但是 controlnet 的出现让MJ变得不那么性感了。
我在思考为什么 MJ 不提供 SD 类似的功能?
MJ是一家公司,而 SD 只是一个开源的程序,MJ在法律上的限制会比 SD 要大很多,所以哪怕类似垫图这样的功能,它都故意让生成的图片与原图不那么吻合。这并不是技术上无法实现,这存在大量的法律上的风险。但是,对于用户来说。MJ如果只在泛专业人群上做工具,这些人很可能尝鲜后就不再续费了。而真正需要长时间使用这个工具的视觉创意类的从业者,目前 MJ 的可控性方面远远不能满足他们。这些人必然会转移到 SD 或者其他工具平台。
所以,未来的路 Midjourney 将会怎么走?我们拭目以待吧。