摄像头、扫码、相机调用 - 淘宝摄像头大解密：智能识别体验设计 - 《C端UI》

击上方蓝字，+ 关注三分设

全文共 2472 字 17 图，阅读大约需要 7 分钟

手淘的两个摄像头识别入口——「扫一扫」和「拍立淘」，很多小伙伴大概都使用过吧？这两个属于强调智能体感、自带神秘色彩的技术流派产品，如今都已跨入千万用户俱乐部的行列。

实际上，许多较大的平台型 APP 上都能见到扫一扫的身影，而通过「以图搜图」，帮助用户找到相似同款商品的「拍立淘」，则从诞生开始就打上了电商平台的特殊印记。

作为设计师，又该如何在两个技术为王的产品中推进体验升级的设计与落地？本文就将为大家一一道来😎。

淘宝摄像头大解密：智能识别体验设计 - 图3

▲ 手淘首页的两个摄像头智能入口

机遇和挑战的博弈

扫一扫和拍立淘在近期都经历了一次较为彻底的体验升级，这次升级恰逢应用场景拓宽、产品转型以及技术提升的关键节点，既得益于产品快速扩张时期的试错积累，又需要系统解决智能感不足、新旧场景交替等棘手问题。

淘宝摄像头大解密：智能识别体验设计 - 图4

▲ 扫一扫和拍立淘改版前后对比

用户诉求不同了

首要的一个变化是，产品的服务对象不再只是 C 端的普通用户，也包含了行业运营、品牌商、零售商和内外合作方。从满足用户识别二维码、寻找相似同款商品的基础诉求到尝试激发用户参与互动的扩展诉求，发现性变得尤为重要。

技术是万能的吗？

识别精准度依赖于算法优化，而图像算法的核心是视觉相似性，通过不断训练可以获得持续提升，但时至今日仍需面临识别结果不是用户想要的窘境。

淘宝摄像头大解密：智能识别体验设计 - 图5

▲ 视觉相似性高不代表识别结果符合预期

究其根本，用户并不在意图像的绝对相似，而是需要找到图片背后对应的商品或物品，这两者永远存在一个无法自动连接的间隙，而我们需要不断探寻缩短这个间隙的可行性方案。

淘宝摄像头大解密：智能识别体验设计 - 图6

▲ 机会点洞察

机会点洞察到设计策略成型

从用户、技术、商业三个维度，我们梳理了可切入的机会点：智能感塑造无法单纯依赖图像识别技术的提升；现有产品框架无法承载新场景和发现性诉求的扩展。

围绕切入点结合设计思考进行进一步的推演，从而得出了具体的设计策略：基于摄像头识别特性打造多元场景体验，突显智能体感；定制统一分层框架，支撑新旧场景更迭和沉淀。

淘宝摄像头大解密：智能识别体验设计 - 图7

▲ 设计策略推导

智能识别的新尝试

极致的智能识别体验应如同科幻电影一般，对准想要识别的目标，无需多余操作就能立即获得预期结果。但理想和现实无法一步转换到位，因此在实际项目推动过程中，我们采用了场景分级策略，实现智能感的逐步升级。

打通不同识别方式的应用场景

识别方式和应用场景是一对密不可分的好基友，用户不知道什么场景用「扫描识别」，什么场景又该用「拍照识别」，识别花草和识别普通商品对他们来说也没有什么本质区别。

我们尝试重新梳理了两者的匹配关系，将识别方式的场景边界逐渐模糊化，让一种识别方式尽可能兼容多种场景。

淘宝摄像头大解密：智能识别体验设计 - 图8

▲ 扫描和拍照两种识别方式的场景逐步打通

找到场景划分的金字塔规则

我们将分散的应用场景聚拢成了 2 大类：确定性的精准场景和非确定性的通用场景（泛场景）。

如下图的金字塔分布所示，塔尖部分属于少量的精准场景，率先提供实时、自动、准确的智能识别服务；

淘宝摄像头大解密：智能识别体验设计 - 图9

▲ 场景分级的识别体验示例

基底的通用场景则适用范围广，可以通过设计实时识别标签引导用户手动确认目标物，通过大量训练，逐步向塔尖体验靠拢。

淘宝摄像头大解密：智能识别体验设计 - 图10

▲ 通过微动效体现动态识别

「识别不准」怎么办？

「识别不准」，无论对用户还是对产品设计师而言，都是最头疼的问题。结合后台日志和上传图片比对，我们发现，除算法模型精准度因素外，误操作问题也会影响识别结果的准确性。

拍摄主体模糊、摄像头距离过远或过近、视角受到遮档、多个识别目标…… 分分钟带着用户掉入识别不准的神坑。更理想的情况下，需要经历「镜头识别目标→得到不良结果→返回调整取图或重新识别」等多步反复，才可能获得想要的结果。

为降低误操作诱发非精准结果的出现概率，我们采用了实时动态辅助的方案，帮助用户获得更好的搜索质量。在识别过程中，后台通过客户端模型做置信度打分，前台关联分值通过镜头提示来引导用户操作，为整个识别体验过程保驾护航。

淘宝摄像头大解密：智能识别体验设计 - 图11

▲ 辅助用户正向操作，降低识别不准概率

淘宝摄像头大解密：智能识别体验设计 - 图12

▲ 多个目标物的识别引导过程

创造新场景的体验环境

随着扫一扫和拍立淘的产品体验升级，应用场景也由淘宝优势的商品类目进一步扩展到了汽车、花草、宠物等新领域。作为设计师，不仅需要吸引用户注意场景的更新，还要帮助用户快速上手进行体验。

通过以往的实践发现，简单的引导提示容易被用户忽略，即使受到吸引也会由于缺乏体验的环境而放弃尝试。所以我们一直在思考，如何能将功能引导和实际使用串联起来，通过模拟真实场景的 “体验式教育” 起到上新提示和直接体验试用的双重作用。

淘宝摄像头大解密：智能识别体验设计 - 图13

▲ 新场景的体验式教育

框架统一升级路漫漫

扫一扫和拍立淘是两个入口不同却有着相同的功能模式，但同一模式下的识别体验又不一致，用户认知与产品迭代成本都很高。

受用户固有心智和产品流量双重因素制约，两个入口合并具有长期不确定性。因此统一产品内部体验成为更可行的改造目标，从而更好地为未来彻底融合做足铺垫。

定义新的框架结构

新框架从横纵两个方向进行了结构分层，横向支撑不同模式的差异化体验，满足基础识别诉求；纵向控制同一模式内的识别和互动分区，激发潜在的发现性诉求。

淘宝摄像头大解密：智能识别体验设计 - 图14

▲ 新框架的分层结构

功能模式横向延展

功能模式可按照识别方式、互动技术、应用场景做不同维度的组合或拆分。

淘宝摄像头大解密：智能识别体验设计 - 图15

▲ 实际应用的三种模式：AR、扫描、拍照

识别与互动纵向分区

识别区用于不同场景识别的直接体验，互动区承载场景上新、品牌活动、黑科技玩法的推荐和引导，两者从纵向进行分离。根据场景要求，可以动态调配两个区域比例和互动区坑位数量。

淘宝摄像头大解密：智能识别体验设计 - 图16

▲ 识别与互动区域比例调配

淘宝摄像头大解密：智能识别体验设计 - 图17

▲ 互动区坑位数量和氛围调配

写在最后

如果把平台比作一座宝藏，设计、产品、技术都在从不同角度去挖掘这座宝藏，在相同位置挖掘久了难免会产生「好像没什么可以再挖」的错觉，又可能感叹挖出的东西不够有完整价值。此时不妨转换下角度，蒙尘的原石可能就在原地等候有心人的发现，经过仔细打磨，最后仍有机会串联成珍宝。

扫一扫和拍立淘早已度过初创时期，设计师需要在产品成熟进程中不断挖掘体验进化的新机会。智能互动是个很有趣的研究课题，以上分享的体验升级是感知层强化和框架层改造的初步尝试，后续会结合细分场景差异化设计和互动玩法做更多探索。

作者：木尹

公众号：淘宝设计

https://mp.weixin.qq.com/s/ygtw9G6_y_GB2MUtN2KYBQ