背景

客户需求基于OpenPromptStudio开发项目二次开发,在原有的提词器基础上,增加一个图片识别成文字的功能,对接通义千问VL模型,让他们团队更高效的生成自己心中想要的图片关键词。

技术栈:Vue、TypeScript、Nodejs、Docker

负责项目的工作

  • 前端增加上传图片功能
  • 上传图片到阿里云
  • 对接通义千问VL模型,图片转换成文字
  • 对接腾讯云的中文翻译成英文服务
  • 项目部署

最终成效

【项目】AIGC 提示词可视化编辑器 - 图1

客户满意度

【项目】AIGC 提示词可视化编辑器 - 图2