01 什么是可用性测试？
- 可用性测试的概念
- 什么是「可用性」？
02 可用性测试的作用
03 可用性测试的分类
04 可用性测试的标准化问卷
- 4.1 SUS 系统可用性量表
  - SUS 的优点
  - SUS 的计算方法
- 4.2 ASQ 任务场景后问卷
05 可用性测试流程

简介：在实际企业体验设计过程中，利用简单有效且信度可靠的标准化流程和问卷，快速验证设计方案的可用性，前置发现设计方案中的问题，避免上线后踩坑～

01 什么是可用性测试？

可用性测试的概念

让一群具有代表性的用户对产品进行典型操作，同时观察员和开发人员在一旁观察，聆听，做记录。该产品可能是一个网站，软件，或者其他任何产品，它可能尚未成型。测试可以是早期的纸上原型测试，也可以是后期成品的测试。

什么是「可用性」？

国际标准 ISO 9241-11 将可用性定义为 “特定的用户在特定的使用情景下，有效、有效率、满意的使用产品达到特定的目标”。

有效性（effectiveness）：用户使用系统完成各种任务所达到的精度（accuracy）和完整性（completeness）；
效率（efficiency）：用户按照精度和完整度完成任务所耗费的资源，资源包括智力、体力、时间、材料或经济资源；
满意度（satisfaction）：用户使用该系统的主观反应，描述了使用产品的舒适度和认可程度。

引用：可用性最早来源于人因工程（human factors）。人因工程又称工效学（ergonomics），起源于二战时期，设计人员研发新式武器时研究如何使用机器、人的能力限度和特性，从而诞生了工效学，这是一门涉及多个领域的学科，包括心理学、人体测量学、环境医学、工程学、统计学、工业设计、计算机等。

02 可用性测试的作用

当我们在实际生产研发过程中，设计产品，需要让它质量过关，除过流程体验、功能完整以外，可用性是很重要的，需要用 “以用户为中心” 的价值观去设计和测试。可用性测试在实际工作中能够发挥哪些作用：

了解真实用户如何与产品进行交互 -「避免产品和设计 YY」
了解真实用户是否能够完成指定任务 -「避免方案 “逻辑自洽”」
了解真实用户完成指定任务需要多久 -「避免简单任务花太长时间」
了解真实用户对产品与竞品的满意度 -「拉出来 “赛赛马”」
确定改进产品可用性问题所需的修改 -「有问题还有救」
定性分析可用性并查看是否符合目标 -「避免路跑偏了」
让设计和开发团队在开发前发现问题 -「提前发现 “锅” 并甩掉它」

03 可用性测试的分类

探索性可用性测试：在发布新产品之前，探索性可用性测试可以确定新产品应包含哪些内容和功能，以满足用户的需求。在产品开发早期，探索性可用性测试可以评估初步设计或原型的有效性和可用性。
评估性可用性测试：在发布前或发布后对最新版本的测试，通过评估性可用性测试向用户介绍新设计，以确保其直观使用并提供良好的用户体验。评估性可用性测试的目的是——确保在产品推出之前突出并修复任何潜在问题。
比较性可用性测试：比较两种或更多种产品或设计的可用性，并区分各自的优缺点，以确定哪种设计能提供最佳的用户操作体验。

04 可用性测试的标准化问卷

我们在做产品或系统的可用性测试中，除了定性的研究结果之外，还有定量的可用性问卷，这些可用性问卷是标准化的，不仅可以科学地量化用户体验，也方便相关方之间有效沟通。常见的标准化可用性问卷有整体评估问卷、任务评估问卷和网站感知可用性评估问卷：

【交互干货】方案可用性测试方法 - 图1

在实际工作中，对于设计侧进行可用性测试，SUS 量表和 ASQ 量表是比较常用的两种标准化问卷帮助我们进行相对客观的可用性测试。

4.1 SUS 系统可用性量表

系统可用性量表（SUS，System Usability Scale）最初发表于 1986 年，总共包括 10 个项目，包括 5 积极描述和 5 个消极描述。其中 8 个项目归类于 “可用性（Usable）”，另外 2 个项目为 “可学性（Learnable）”。SUS 的总体信度为 0.92，其中可用性项目的信度为 0.91，易学性项目的信度为 0.7。量表的全部项目采用从‘强烈不同意’到‘强烈同意’的 5 点评分。用户的最终作答将被转化为一个百分制的分数。

【交互干货】方案可用性测试方法 - 图2

翻译成中文：

【交互干货】方案可用性测试方法 - 图3

SUS 的优点

SUS 量表是通过大量实验为基础的量表设计，也是现在全球使用最多的整体性可行性评价量表。

正反语气间隔，使答案客观。SUS 问卷中大家可以发现奇数问题是正面语气，偶数问题是负面语气，这样减少了被测试者的依从性，从而 使结果更加客观。
SUS 是最快达到想要结论的量表。通常来讲，一个量表所测量出的结果与用户真实的意向具有一定的偏差，经研究 SUS 量表能够在不超过 15 个样本得到该系统的真实评价，所以该量表具有相当的灵敏性。
SUS 量表包含易学性与可用性。其中 4 和 9 是易学性，其余的表示可用性。这个两个方面代表了整体评价的 2 个主体方面。具体的题设数量设计，是通过大量的样本研究发现后得出的。

SUS 的计算方法

得分计算：范围在 0-4，每题进行转化分值；奇数题（正面）：原始分减去 1（x-1）；偶数题（负面）：5 减去原始分（5-x）

SUS 总分 = 所有转化过的分值相加*2.5, 多样本算 SUS 总分均值
可用性总分 = 所有转化过的可用性分数相加*3.125
易用性总分 = 所有转化过的易用性分数相加*12.5

当得到分数后，我们评估产品或者方案的可用性呢？如某个界面的 SUS 分数为 76，这代表着什么？AT&T Labs 的 Bangor 等人在 2009 年发了一篇文章来解决这个问题，通过以下参照来衡量对照自身产品的可用性程度。

【交互干货】方案可用性测试方法 - 图4

4.2 ASQ 任务场景后问卷

场景后问卷（After-Scenario Questionnaire，ASQ）由 PSSUQ 和 CSUQ 的作者 Lewis（1993）发表。总共包括三个项目，分别测量用户在三个方面的满意度：任务难度、完成效率和帮助信息。场景化问卷探测整体上完成任务的难易度、完成时间和支持信息的满意度。ASQ 的项目采用从 1（强烈同意）到 7（强烈不同意）的 7 点计分。ASQ 分数即是 3 个项目得分的平均分。据相关研究指出 ASQ 分数与场景任务的成功率也存在 r=-0.4 的显著相关。该问卷一般用于单一任务场景后，用户评估该任务的可用性。

【交互干货】方案可用性测试方法 - 图5

【交互干货】方案可用性测试方法 - 图6

05 可用性测试流程

5.1 准备阶段（Step1-Step5）

明确当前项目中主要需求目标，业务流程或用户流程，并从中筛选凝练出核心指标流程，如用户下单抽奖活动中核心流程、分享流程、转化流程、加购下单流程等。并根据对应的流程撰写测试任务脚本；
准备测试所需原型，原型可使用交互线框图 / 流程图、交互原型 Demo、真实产品原型等；
依据测试目标设计可用性测试记录表和任务脚本，举例如下：

【交互干货】方案可用性测试方法 - 图7

招募测试者注意事项：

【交互干货】方案可用性测试方法 - 图8

准备测试环境

准备测试原型：原型可使用纸片原型、交互原型 Demo、真实产品原型等
准备测试设备：录像、录屏、录音、测试环境等；
准备测试所需材料：【用户测试记录表】，便于测试时用户填写记录；
预测试：将整个测试流程提前预演一遍，并检查测试原型的相关流程；

5.2 测试阶段（Step6）

一般情况下由一名主持人和一名记录员组成，在条件有限的情况下，可有一人担任两个角色；
首先与参与者进行沟通交流（测试前预热），通过沟通和交流，了解于项目相关的用户背景，如平时购买习惯，经常使用的 APP，平时会通过哪些途径购买商品，这些】预热问题需要提前准备好；
之后向参与者发放测试记录表，介绍当前测试项目的基本情况，并简要介绍相关任务；（注：在介绍和交流过程中不要引导用户的思路和操作路径，让用户在最自然的状况下进行测试）；
让用户在无干扰的情况下自主完成任务，并填写相关记录，中途可适当与参与者沟通，确认当前状态，观察参与者表情，回应用户疑问点（注：切忌在流程和操作上引导用户，除非用户主动询问）；
测试完成后，可简单与参与者交流沟通相关问题，收集用户主观反馈；

5.3 总结阶段（Step7-8）

汇总可用性测试记录表，并计算相应分值；
根据可用性测试记录表汇总结果，输出可用性测试报告，参考示例如下：

【交互干货】方案可用性测试方法 - 图9

更多用户研究方法可查看：https://www.nngroup.com/