在日常生活中,人们在对某项任务的用时进行预估时,往往会给出一个乐观的、低于实际的估计,甚至在拥有相关的经验时也是如此。这种现象在心理学上被称为规划谬误(Planning Fallacy)。本文提出了一种混合的方法,通过结合已有的去除预估偏差的方法和适合的可视化工具,以帮助人们减轻规划谬误,给出更准确的时间预估。
图一 分位数点图:反映了任务时长的概率分布
首先,作者对用户对任务时长的感知进行建模。这里借鉴了两种已有的去除规划谬误带来的偏差的方法:任务分解和意外列表。任务分解即将整个任务分解成几个独立的子任务,通过对每个子任务进行时间估计,从而得到整个任务的估计。已有的研究表明,对子任务的估计时间之和通常会大于对整个任务的直接估计,这可以抵消由规划谬误带来的低估。意外列表则需要列出所有可能影响任务时长的意外事件,并给出这种意外事件发生的可能性。通过列出意外事件可以帮助用户给出一个更加客观的时间预估。
之后,根据上述两种去偏方法的结果计算出用户对任务用时的信念的概率分布(如图二)。首先用户给出每个子任务和意外事件的预估时长的上下界,然后这里假设时长分布符合对数正态分布,用户预估的上下界对应于95%置信区间,由此可以画出每个子任务和意外事件的时长分布。然后考虑n个意外事件中每一个是否发生,可以分成2^n种情况,每种情况求出时长总和的概率分布,最后根据每种情况发生的概率进行加权求和,得到整个任务的时长概率分布。
由于这个分布随着意外事件的增多会变得十分复杂,而复杂的分布并不能很好地辅助用户做出决策,反而会给用户带来困惑。因此,这里采用蒙特卡洛方法对最终分布进行采样。
图二 计算用户对任务用时的信念的概率分布的过程
接下来则是为任务时长的概率分布选择合适的可视化方法。作者采用了分位数点图(Quantile Dot Plot,图一)。为了保证采样结果趋近于原始分布,采样数通常会很大,为了减少点图中点的数量,这里采用分箱的方法,让点图中每个点表示一个采样点的分箱。有相关的工作表面50点图可以帮助做出最好的决策,而20点图则可以最小化不好的表现。因此在用户研究中,作者分别探索了20和50点图。另外,在日常生活中,除了关心任务的时长之外,人们还经常会关注要用合适开始才能保证任务在截止时间之前完成,为了探究这一方面,作者又给出了一个文本反馈视图,并在文本下方加上可以交互调整时间的滑块或者折线图。在后续的研究中,作者对两种交互调整时间的方式进行了比较。
图三 文本反馈视图
用户实验主要分为两个部分。第一部分是对时长的估计。具体来说,用户需要结合自己的实际情况回答去杂货店买三件聚会用品需要多长时间。第二部分是做决策,用户需要在第一部分的基础上回答应该什么时候去杂货铺,以便赶上之后的火车。具体流程如下:
在第一部分中,用户在看到问题之后需要给出一个对整体时长的估计。在应用前面提到的两种去偏方法后,用户需要第二次给出整体时长的估计。随后,用户需要观察20点图或50点图(取决于用户被分配了哪个),然后给出自己的第三次估计。在第二部分中,用户在读题之后给出一个初始决策。之后用户可以交互尝试不同的触发时间并从文本反馈中得到平均需要等火车的时间和错过火车的概率,随后,作者需要做出最终的决策。最后,考虑到不同的用户会在等待时间和错过火车概率之间有不同的权衡,用户需要报告自己平时是否经常迟到或者早到。
图四 用户实验流程
用户实验主要结果如下:在提高预估时间方面(如图五),预估结果分为两方面,一是点估计结果(即预估上下界的中心点),二是不确定性(即预估区间的大小)。预估时间的平均提升值由黑色图元显示。可以看到用户在看到可视化视图后普遍对时间预估有一个提升,这可以变相表明用户初始预估普遍过于乐观,这也符合规划谬误的定义。另外,用户在经过去偏方法后的预估提升比使用可视化视图后的预估提升要小。由于我们认为预估的提升可以抵消规划谬误的影响,因此可以认为可视化的对规划谬误的纠正效果比去偏方法要好一些。同样的,在去除一些极端值之后(其相应的提升平均值由黄色图元显示),可以推断出在提升估计的不确定性上,去偏方法比可视化有效,而在点估计上则恰恰相反。
图五 预估时间提升情况
在估计准确性上(如图六),在使用可视化之后,估计区间对采样点的覆盖度明显提升,这也是符合预期的。但有趣的是,20点图和50点图并没有明显的差异。这可能是因为在该例子中20点图已经足够描述整体分布情况。
图六 估计准确性情况
在出发时间决策上,可以看到使用文本反馈后决策有了一个明显的改善(即错过火车的概率显著降低,而平均等待时间只是稍微增加)。另外,较为有趣的是,滑块和折线图也没有表现出差异。这里作者认为文本反馈已经提供了足够多的信息,相比之下折线图提供的概览效果对结果的影响并不大,反而对于没有可视化背景的用户来说,探索折线图的用法会占据更多的时间。
图七 决策情况
此外还有一些其他的有趣发现。这里同时使用任务分解和意外列表可以改善时间估计,但之前的研究表明两种方法单独都没有带来明显的改善。此外,用户倾向于给出5的倍数的时间估计,例如15分钟,20分钟,而很少估计17分钟。另外,用户的决策权衡和他们自己平时是否经常迟到或者早到并没有什么太大的联系。
本文提出了一种预测可视化的方法,将传统的去偏方法和可视化结合起来,用户实验表明这种方法可以减轻用户在时间估计中的乐观性,同时提升用户对时间估计的不确定性。但一个很重要的问题在于,这种方法的效果依赖于用户对子任务和意外事件的划分和评估。如果在对子任务和意外事件的评估已然出现偏差,会导致后面的结果也出问题,最好的方案还是采用真实的任务时间代替这种计算出来的分布,但这样实践起来可能会有难度。另外,该工作在对用户认知的建模上采用了很多假设,这可能难以反映用户的实际认知,之后可能需要探索更加复杂的用户接口。
参考文献:
[1] Morgane Koval and Yvonne Jansen. Do You See What You Mean? Using Predictive Visualizations to Reduce Optimism in Duration Estimates. In Proceedings of CHI Conference on Human Factors in Computing Systems, Article No. 30, pp. 1–19, 2022.