专栏|未来已来:AI数字人行业调研及AI如何打破设计的边界

人工智能(AI)技术的进步不仅改变了我们生活的方方面面,还在各行各业中展现出了巨大的潜力。AI数字人,作为人工智能技术的一个重要分支,正在逐渐成为众多行业关注的焦点。这些虚拟的数字角色不仅具有逼真的外观和行为,还能够以超乎想象的方式与人类交互,从而提供全新的服务体验和业务机会。本文整理了AI数字人相关的基础概念、趋势报告、热点案例、AI数字人平台和开源项目,以及作为设计师我们能用这些AI能力产出哪些有意思的工作。

01.

AI数字人基础概念

什么是AI数字人?

“数字人”是指利用先进的计算机图形学和数字技术创造的虚拟人物。这些数字化的角色可以模拟真实人类的外观、表情和行为,广泛应用于娱乐、广告、虚拟现实和各种互动媒体。数字人代表了一种技术进步,使得虚拟角色在视觉和行为上更加逼真,增强了用户的沉浸感和互动体验。

“AI数字人”则是在数字人的基础上融入了人工智能技术。这不仅使得虚拟角色在外观上更加逼真,而且能够模拟人类的交流和行为,如对自然语言的理解、情感的识别和反馈、甚至能学习和自适应,从而能够进行更复杂的交互和响应。AI数字人被应用在智能客服、虚拟助手、在线教育等领域,和其他需要人机交互的场景,提供更加个性化和智能化的服务。

AI数字人运作原理

AI数字人的运作原理基于人工智能算法,包括机器学习、自然语言处理和计算机视觉等技术。这些技术使得AI数字人能够理解和响应人类语言、模拟情感反应,以及在虚拟环境中以逼真的方式表现出人类般的行为。数字人系统的模块构成通常包括语音识别和合成模块、文本到语音转换模块、图像和动作捕捉处理模块,以及一个用于决策和学习的核心AI处理单元。这些模块共同工作,使得数字人可以在各种场景下提供动态和自然的交互体验。

AI数字人运用场景

客服:AI数字人在客服领域被广泛应用于自动化客户服务和查询处理。例如,互联网公司或银行使用的AI导购、智能客服等,能够通过文本或语音交互解答客户的常见问题,如物流查询、账单查询、服务故障报告,从而提高响应效率并减轻人力客服的负担。

文娱:在文娱行业,AI数字人被用作虚拟角色和主持人,提供互动娱乐体验。例如,虚拟偶像在音乐会上表演,或者虚拟主播在网络平台上进行直播,吸引观众参与和互动。

教育:教育领域中,AI数字人作为虚拟教师或辅导员,协助学习和训练。例如,一些语言学习应用使用AI角色来模拟对话练习,或者在医学模拟训练中模拟患者进行诊断练习。

助手:在个人助手领域,AI数字人作为智能助理帮助用户管理日程、发送提醒、甚至控制智能家居设备。例如,智能手机中的语音助手如苹果的Siri,可以帮助用户设置闹钟、查天气、发送短信等。

医疗:在医疗领域,AI数字人被用于模拟医疗咨询、患者教育和心理健康支持。例如,虚拟健康助手可以提供初步的健康咨询和生活方式建议,或者作为虚拟心理治疗师提供情绪支持。

金融:在金融行业,AI数字人用于提供投资咨询、市场分析和个性化的财务管理服务。例如,某些银行和投资平台利用AI助手为客户提供定制的投资建议和市场趋势分析,以及协助进行交易操作等。

AI数字人的未来十大趋势

AI数字人将在多个行业中扮演越来越重要的角色,不仅能够提高效率和减少成本,还能提供更加个性化和高质量的服务。随着技术的发展,我们可以预见AI数字人将在未来的各行各业中发挥更大的作用,以下是未来AI数字人对各行各业影响的十大趋势预测:

1. 客户服务的自动化和个性化:AI数字人将在客户服务领域发挥越来越大的作用,提供24/7的服务,同时能够根据客户的个人喜好和历史互动提供个性化服务。

2. 医疗保健的革新:在医疗领域,AI数字人可以协助医生进行诊断,提供治疗建议,甚至进行远程手术协助,同时也能在患者管理和健康咨询方面发挥作用。

3. 教育的个性化和可及性提升:AI数字人能够提供个性化教学,适应不同学生的学习速度和风格,使教育更加公平和高效。

4. 零售行业的变革:在零售行业,AI数字人可以提供个性化购物体验,从推荐产品到提供虚拟试穿,改变传统的购物方式。

5. 金融服务的智能化:AI数字人将在金融领域提供更智能的资产管理、风险评估和客户服务,提高金融服务的效率和精确性。

6. 娱乐和媒体的定制化:在娱乐和媒体行业,AI数字人可以根据用户的喜好定制内容,提供更加个性化的娱乐体验。

7. 旅游和酒店业的服务升级:AI数字人可在旅游和酒店行业中提供个性化的旅游建议、预订服务以及客户服务,提升客户体验。

8. 制造业的效率提升:在制造业中,AI数字人可以协助设计、生产流程优化以及质量控制,大幅提高生产效率和减少错误率。

9. 物流和供应链管理的优化:AI数字人能够在物流和供应链管理中进行高效的资源分配、路线规划和库存管理,提高整体运作效率。

10. 法律和咨询服务的智能化:在法律和咨询领域,AI数字人可以进行案例研究、法律文档审查以及提供初步咨询,辅助专业人员进行更复杂的决策。

* 一些有价值的研究报告:

《好看的皮囊到有趣的灵魂- 数字人产业发展报告》
《AI+医疗:智医助理即将上岗- 华西计算机团队》
《2023年中国AI数字人产业研究报告》

* AI相关热点事件

俄罗斯电视台:使用AI数字人主播

俄罗斯南部斯塔夫罗波尔地区的一家电视台首播了名为“未来预测”的新节目,其中最引人注意的就是推出了一位女AI天气预报播报员。

她甚至还有雀斑!俄罗斯的AI女主播究竟有多逼真!

北京互联网法院:支持保护AI生成图片著作权

北京互联网法院针对人工智能生成图片(AI绘画图片)著作权侵权纠纷作出一审判决,据悉该案为AI生成图片相关领域著作权第一案。

AI生成图片著作权侵权第一案判决书

达摩院AI模型:实现胰腺癌早期筛查

阿里达摩院联合国内外知名医院和科研机构等,首次提出以“平扫CT+AI”进行大规模的胰腺癌早期筛查。

揭开万癌之王“隐身衣”!交手10000000次+,医疗AI首次实现胰腺癌早筛

斯坦福华人博士AIGC视频: 4人公司估值2亿美元

仅有四人的初创公司,已经融资5500万美元,融资名单几乎集齐了硅谷的半壁江山,半年用户超50万,今天,Pika 1.0闪亮登场,电影级特效震撼全网。

斯坦福华人博士文生视频Pika 1.0爆火,4人公司估值2亿,OpenAI联创参投


02.

AI数字人线上平台

接下来整理了国内外较知名的三大线上AI数字人平台,以及使用案例和介绍视频链接。

“HeyGen AI”:在线制作数字人

HeyGen 是一款人工智能驱动的视频生成器,可在几分钟内使用300 多个人工智能头像以40多种语言创建100多种语音的文本转语音视频。

AI数字人行业调研及AI如何打破设计的边界 - 图1

*官网链接https://www.heygen.com

*转换视频语言案例:火爆的AI视频翻译工具HeyGen,背后竟然是一家国内的公司

*使用方法:5分钟拥有你的AI克隆人!HeyGen AI数字人视频创作平台介绍

“万兴播爆”:AI辅助营销

万兴播爆,提供AI数字人定制服务。输入文案,即可一键生成“真人”营销宣传视频。帮助商家生成AI数字人,用于出海营销等场景。

AI数字人行业调研及AI如何打破设计的边界 - 图2

*官网链接:https://virbo.wondershare.cn

*介绍视频:AI工具万兴播爆Wondershare Virbo数字人短视频出海营销神器

“小冰AI数字人”:前微软小冰团队研发

小冰数字人脱胎于微软公司,其核心技术和团队源于微软亚洲互联网工程院。

AI数字人行业调研及AI如何打破设计的边界 - 图3

*官网链接:https://business.xiaoice.com

*介绍视频:小冰数字人简介


03.

AI数字人开源项目

现有的AI数字人开源项目能完成上述AI数字人的线上平台80%的能力,如果您想训练属于自己的AI数字人,通过下列开源实现流程和推荐的开源项目即可实现如下图所示解决流程。

AI数字人行业调研及AI如何打破设计的边界 - 图4

AI数字人开源项目可以分为声音克隆项目(MockingBird、VITS-fast-fine-tuning)和视频口型匹配项目(RAD-NeRF、Video-Retalking、DINet、wav2lip和SadTalker)两大类。接下来推荐了多个AI数字人的开源项目并提供了对应项目的官网链接和相关介绍、使用教程视频链接等。

声音克隆开源项目:

Mocking Bird

推荐指数:

AI数字人行业调研及AI如何打破设计的边界 - 图5

*项目链接https://github.com/babysor/MockingBird

*使用教程:MockingBird快速克隆声音,实现文本转语音,本地安装使用教程

VITS Fast Fine-tuning

推荐指数:⭐⭐

AI数字人行业调研及AI如何打破设计的边界 - 图6

*项目链接https://github.com/Plachtaa/VITS-fast-fine-tuning

*使用教程:VITS-fast-fine-tuning声音克隆从头开始安装难点解答不求人自己制作整合版手把手安装

视频口型匹配开源项目:

RAD-NeRF:

推荐指数:

AI数字人行业调研及AI如何打破设计的边界 - 图7

*项目链接https://github.com/ashawkey/RAD-NeRF

*中科大利用该开源项目案例:中科大等研究:和NeRF结合,语音驱动的高保真说话人脸合成

Video-Retalking:

推荐指数:️️

AI数字人行业调研及AI如何打破设计的边界 - 图8

*项目链接https://github.com/OpenTalker/video-retalking

*使用教程:Video Retalking数字人开源项目 10秒视频驱动声音生成逼真视频

DINet:

推荐指数:

AI数字人行业调研及AI如何打破设计的边界 - 图9

*项目链接https://github.com/MRzzm/DINet

*教程视频:基于DINet+openface自训练AI数字人

Wav2Lip:

推荐指数:⭐⭐

AI数字人行业调研及AI如何打破设计的边界 - 图10

*项目链接:https://github.com/numz/sd-wav2lip-uhq

*教程视频:保姆级手摸手教程:数字人插件sd-wav2lip-uhq的安装和使用

SadTalker:

推荐指数:

AI数字人行业调研及AI如何打破设计的边界 - 图11

*项目链接:https://github.com/OpenTalker/SadTalker

*教程视频:SadTalker 插件安装与使用详细步骤 : 照片开口说话


04.

AI将打破设计师的边界

AI不能简单的作为“高级的PS”工具,而是能扩展设计师的能力边界,借助AI完成一整个影视工作室的工作?设计师可以是炼丹师?AI工程师?剪辑师?模型训练师?音乐制作人?接下来的几个工作案例让我们看看AI是如何帮助设计师打破能力边界的。

AI数字人行业调研及AI如何打破设计的边界 - 图12*此图由AI生成

设计师可以是“炼丹师”?

AIGC共享平台:云端部署“Stable Diffusion”

在UED设计团队中云端部署“Stable Diffusion”,共享使用AI生图工具,帮助团队降本增效。如在阿里健康设计团队中部署的SDWebUI,服务于各个业务线设计师,已经产出1000+ AI图片,应用于各种营销场景中。

AI数字人行业调研及AI如何打破设计的边界 - 图13

AI模型训练平台:云端部署“Koya_SS”

利用AI模型训练平台Koya_SS,训练出各业务专属的IP人物形象。小鹿、小羊、欢猩等多个LoRA模型已可以在团队中共享使用。同时部署在云端,制定标准的训练流程,让团队里每个设计师都能借助训练平台完成定制化的AI模型训练,利用AI产出更多意想不到的创意工作。

AI数字人行业调研及AI如何打破设计的边界 - 图14

*模型训练超详细教程:仅用10张图片,还你一个百变小鹿IP形象!(搜索往期文章即可查看教程)

设计师也可以是配音师?

AI声音模拟平台:“Azure”云端搭建

Azure云端搭建声音模拟器,实现多语言旁白生成能力,已实现中文、英文、日文等多国语言,制作对外宣发、奖项申报等视频旁白音。每条旁白音可为团队节省数万至数十万元不等,同时AI音色不会受环境的影响而改变,即使对视频内容更改AI也能及时适配,大大降降低了视频制作的成本。

AI数字人行业调研及AI如何打破设计的边界 - 图15

设计师还可以是音乐创作人?

利用AI创作音乐,生成BGM等背景音,这样生成出来的音乐是有版权和可商用的。设计师也可以是音乐制作人。避免视频音乐侵权,同时为团队节省大量的音频采购版权费用。

AI数字人行业调研及AI如何打破设计的边界 - 图16

设计师可以是前端工程师?

前端代码生成模型:“GPTs- IceCoder”

利用GPT4.0的GPTs模型编译器,经过二次训练的前端代码生成AI模型“IceCoder”,通过自然语言对话即可生成前端片段。已实现阿里健康设计官网“阿里健康体2.0”发布页的前端搭建和服务器部署。(已发布在GPTs商店搜索即可体验)。用同样的方法可以学习使用AI数字人开源项目的代码。

AI数字人行业调研及AI如何打破设计的边界 - 图17

AI数字人行业调研及AI如何打破设计的边界 - 图18

*阿里健康设计官网:https://www.alibabahealthdesign.com/

设计师还能搭AI算法工作流?

AI实时渲染一键出图:“ComfyUI”工作流

“ComfyUI + Designdol”l利用3D人偶和“SDXL-Turbo”优化算法模型实现1步迭代即可AI生图,将大大提升AI工作效率。

AI数字人行业调研及AI如何打破设计的边界 - 图19

*建设中,图片仅用于示意

AI应用四步化指南:“SOP”标准化流程

在团队内部署上述这些AI能力和平台,如何让团队内成员快速上手使用呢?即可通过制定四步化使用指南,帮助团队成员快速上手AI能力,提升AI的使用效率和质量,创造出更多创意工作。

AI数字人行业调研及AI如何打破设计的边界 - 图20

05.

结语

AI数字人技术的迅猛发展不仅为各行各业带来了前所未有的创新和变革,我们见证了AI数字人在各行各业的运用以及未来的十大趋势,从艺术创作到客户服务,再到教育和医疗等领域的职业角色和工作方式在未来可能彻底转变。AI的高度适应性和灵活性使其能够不断学习和优化,从而在各种场景中提供高效、创新的解决方案。 对于设计师而言,这意味着能够利用AI来拓展创意的边界,实现更加个性化、更具创意的设计。通过AIGC技术,设计师和创作者能够探索新的表达形式和互动方式,从而不断推动行业的进步和发展。因此,AIGC的涌现不仅是技术的跨越,更是对职业边界的一次重塑,它预示着一个更加智能、互联的未来和对设计和创意的革新。