图片来自强大的 Midjourney

周刊日期:2023.3.27 - 2023.4.09 周刊专题:强大的 AI 出图能力 周刊图片:As the AI journey unfolds, vibrant neural networks weave through a futuristic cityscape, where a diverse group of people collaborate with their intelligent assistant, bridging the gap between human imagination and technological innovation —ar 3:2

关于 AI 相关的话题,这个春天不断的涌来。最近多次看到有好友感叹,“每天睡醒之后,就会被 AI 震撼到”。震撼对于自己确有同感,ChatGpt 对自然语言的理解和反馈能力的强大,基于 ChatGpt 能力衍生生态的百花齐放,无不冲击着自己。

今天聊的这个专题,是 OpenAI 生态中的一个应用:Midjounery v5,一个 AI 图片生成工具。初识这个工具,是之前浏览的一篇新闻《当 AI 开始画画》[1] ,名为《太空歌剧院》的 AI 画作获得艺术展览比赛的第一名,尝试使用之后发现对于自己确实实用,作为一个前端工程师,对视觉是有一小点追求的,但无奈自己一塌糊涂的作画天赋,还原出自己想要的视觉效果几乎不可能。借助 AI 出图的能力,恰好满足一些视觉产出的需求,比如一个 logo或者一张插画…。

Midjounery 目前是和 Discard 结合使用的,需要科学上网环境。这里通过生成一幅“会飞的猪”,简单了解一下它的最基础的使用:

  • 首先需要一个 Discord 账号,如果没有需要到 Discard 官网[2] 进行注册
  • 进入 Midjounery 聊天,结合 Discord 聊天会话窗口、Midjounery /imagine 命令,输入提示(Prompt):a fly pig,AI 即可帮你绘制一组图片
  • 根据你的视觉感官,调参,重新生成,最终获取一张你想要的图片

一只会飞的猪

这里只是简单的看一下它的用法,有兴趣的同学可以试用一下,Midjounery 官方文档[3]给了详细的教程。有一份中文教程比较火,叫做《Midjourney 学习导航》[4],可以作为参考。

对于更好的使用 Midjounery 进行创作,prompt 的输入是需要有技巧的,近期看到一篇不错的文章《50+ Midjourney Logo Design Prompts: The Complete Logo Guide》[5],讲述了如何用 AI 创作 Logo 的很多技巧。 推特上有一位名叫 Tatiana Tsiguleva 设计师发起了一个 1000 天 Midjounery 创作活动,分享了一些比较高质量的图片,非常不错。
1000 天 AI 创造之一

使用 AI 创作图片过程,对于一个没有作画基础能力,但具备一些视觉想法的用户是比较友好的,你需要做的是描述、出图、重试、选择,这些操作对于我们这类用户都是简单可行的。但我想对于一个专业的视觉工作者,重复生成的过程无疑是低效的,最终的价值可能会弱一些,更多的是灵感来源或者创作辅助。

最后,谈一下我对 AI 工具的一些小看法:

  • 对于 AI 的认知需要保持理性,过度褒贬都是不妥的
  • AI 在当下这个阶段会对一些领域工作产生冲击,但不至于取代,正如 AI 出图细节把控和专业视觉工作者的差距,近期的一些 AI 代码生成工具难以解决工程、架构问题,ChatGpt 不具备情感输出能力
  • 我们需要更专注所在领域的深度,更注重自己的思考,能够描述自己的需求,培养 prompt 工程师的能力
  • 条件允许下,每个人都可以适当关注 AI 动态,寻找机会和应对变化

关于对 AI 应用的使用和看法,欢迎大家多多交流,碰撞出更多的灵感。

一、WEB 技术

1.1 Chrome 发布首个 WebGPU 实现

Chrome 团队非常高兴地宣布,将在 Chrome 113 默认支持 WebGPU,目前还处于 Beta 测试阶段。WebGPU 是一个新的 WEB 图形 API,它提供了显著的好处,比如大大减少了相同图形的 JavaScript 工作负载,提升了机器学习模型的处理速度 …
相关链接:谷歌开发者文档[6]

1.2 弃用 Electron,微软重新设计 Microsoft Teams

类似 React Native 、Electorn 这样的多端适配技术,逐渐回归到 Native 应用,开发效率和应用体验之间的权衡是一个永久的命题…
相关链接:InfoQ 资讯[7]

1.3 推特开源搜索算法

马斯克在推特多次宣告之后,终于将推特的算法开源出来了 …
相关链接: 官方发布[8]

1.4 Slint 1.0 正式发布

Slint 是 Rust 的 GUI 框架,1.0 发布之后,标志 Rust 图形界面开发的生态逐步成熟…
相关链接:官方文档[9]

1.5 分享一个 Eslint 规则生成工具

没有明确名称的一个工具,作用是帮你快速生成 Eslint 规则
相关链接:eslint.rustc.cloud[10]

二、行业资讯

1.1 意大利宣布禁用 ChatGpt

意大利数据保护局 Garante 在 3 月 31 日宣布暂时禁用 ChatGPT,并对其涉嫌违反隐私规则展开了调查。目前,OpenAI 已在意大利下线 ChatGPT,意大利也成为了全球首个封禁 ChatGPT 的国家(部分国家和地区在一开始就无法使用 ChatGPT。)
AI 带来的数据安全、法律合规、道德等问题在应用过程都非常中…
相关链接:InfoQ 资讯[11]

1.2 阿里自研大模型“通义千问”开始内测

阿里自研的大模型正式开放内测,可惜自己没有邀请码,期待国内的两个大模型正式的投入使用…
相关链接:机器之心推送[12]

1.3 百度针对假的文心一言对苹果发起诉讼

文心一言发布之后,应用市场出现大量假的和“文心一言”相关的 APP,百度向北京市海淀区人民法院对苹果公司及相关开发者团队发起诉讼。各位想要体验文心一言的同学记得去官网…
相关链接:百度公众号声明[13]

1.4 对于“前端已死”,一位资深前端的看法

搭建、低代码、再到现在的 AI 生成代码,前端已死的风波一直存在,看了这一篇言论,或许可以缓解那一份焦虑…
相关链接:The End of Front-End Development[14]

1.5 下一个“AI王炸”,别只盯着 OpenAI,DeepMind也在憋大招

换个脑袋,了解一下其他的 AI 动态…
相关链接:36氪资讯[15]

三、相关链接

序号 描述 链接
1 当 AI 开始画画 http://www.news.cn/globe/2022-09/19/c_1310663908.htm
2 Discard 官网 https://discord.com/
3 Midjounery 官方文档 https://docs.midjourney.com/docs/quick-start
4 Midjourney 学习导航 https://github.com/thinkingjimmy/Learning-Prompt
5 50 个 Logo 创作技巧 https://aituts.com/how-to-create-actual-ai-generated-logos/
6 Chrome 发布首个 WebGPU 实现 https://developer.chrome.com/blog/webgpu-release/
7 弃用 Electron,微软重新设计 Microsoft Teams https://www.infoq.cn/article/uHD15zM6RUaMUPWq6rlf
8 推特开源搜索算法 https://blog.twitter.com/engineering/en_us/topics/open-source/2023/twitter-recommendation-algorithm
9 Slint 1.0 正式发布 https://slint-ui.com/releases/1.0.0/docs/slint/
10 分享一个 Eslint 规则生成工具 https://eslint.rustc.cloud/en
11 意大利宣布禁用 ChatGpt https://www.infoq.cn/article/0Ajci2Edm9HHZ0O7kKRt
12 阿里自研大模型“通义千问”开始内测 https://mp.weixin.qq.com/s/95qLhDVwNUnyJuF21jzHPw
13 百度针对假的文心一言对苹果发起诉讼 https://mp.weixin.qq.com/s/vYZ5uCcAQP_4pMVrxi3ePA
14 对于“前端已死”,一位资深前端的看法 https://www.joshwcomeau.com/blog/the-end-of-frontend-development/
15 下一个“AI王炸”,别只盯着 OpenAI,DeepMind也在憋大招 https://36kr.com/p/2206539472564865?channel=system