一、前言
当你能够量化你谈论的事物,并且能够用数字描述它时,你对他就确实有了深入了解。但是如果你不能用数字描述,那么 你头脑就没有跃升到科学思考的状态。
如果能找到观测事物的方式,并找到某种方法,无论这种方法多么”模糊”,它能让你知道得比以前更多,那么它就是一种 量化方法。
二、背景
在推进EP过程中,有遇到猫头鹰类型的Leader,他们只认数据,用数据说话;有遇到老虎类型的Leader,他们需要你证明 为什么你做的事情是对Goal有帮助的。开始的时候会限于去找论据找案例,而后发现,当一切你关注的东西本身就没有可视化的 时候,你无法做到真切的用数据、或者用改进的效果、产生的价值来充分的说服。
正好,看到同事推荐《How to measure anything》这本书,此文是对该书重点观点的记录。很多时候,等你事情想清楚了, 决定做好了,方向确定了,就能很大程度的避免低效的投资与管理决策。管理者和决策者不缺乏数据、不缺乏信息,缺乏的是依靠量化 做出决策的态度和方法。
三、量化天下
1. 反对声音
- 量化的概念:量化的定义被广泛误解,人们如果理解”量化”的真实意义,很多事情都会变得可量化
- 量化的目标:并非被量化的事物隐藏得很好,只是模棱两可、含糊不清的语言挡在我们量化之路上。
-
量化的方法:很多人不了解实证观察者的量化过程。
- 量化的经济成本,即任何量化工作花费都很巨大
- 对统计学的用处和意义的普遍反对意见
- 伦理道德的反对意见
2. 量化是什么
量化是减少不确定性、优化问题的有效手段,而不是完全消除不确定性。
- 真正的量化过程不需要无线精确
- 量化是用数量描述的
- 量化是对被量化事物和数字的映射
- 量化方法就隐藏在量化目标中
3. 量化的关键点
一旦管理者弄清楚要量化什么以及被量化的事物为什么重要,就会发现事物显现出更多可量化的方面。
首先,如果X是我们关心的某种事物,那么根据定义,X必须可通过某种方法来感知。如果质量、风险、安全、龚总形象等 事物完全不可感知,那么该用何种直接或间接的方法关注它们呢?我们关心某些未知数据,是因为我们觉得它和希望或 不希望的结果有某种关联。
其次,如果这个事物可以感知,那必然能估计到某些数值。如果你可以观测一个事物,就多少能多出一些东西。 最后,这一步或许是最容易的了:如果可以通过观测得到某些量,那它就一定是可量化的。
确定真正要量化什么,是几乎所有科学研究的起点。商业领域的管理者需要认识到,某些事物看起来完全无形无影,只是 因为还没给所谈论的事物下定义。搞清楚你的意思到底是什么,就已经完成了量化工作的一半。
看起来完全没有踪迹可寻的无形之物,是可以量化的,这种量化可以用比较经济的方法来实现。
4. 5人法则
只需很小的样本就可以减少不确定性。
5. 不值得量化
- 如果量化产生的结果不是当初想要达到的目标,甚至会产生负面影响,那么就没必要开展量化工作。实际上, 这种方式是把量化的东西和激励混淆了。
- 如果量化的花费超过了它带来的收益,那就不值得去量化。
四、量化什么
不确定性、风险、信息价值
- 不确定性:缺乏完全的确定性,也就是说,存在超过一种可能,例如人们不知道的真实的输出/结果/状态/价值
- 不确定的量化:为结果集合中的各种可能附上相应的概率。比如,未来5年内,这个市场有60%可能至少增加1倍, 有30%可能以较低速度增长,市场猥琐可能性是10%。
- 风险:不确定性的一种状态,该状态包括亏损、崩溃或者其他不希望结果的可能性。
- 风险的量化:可能性的一个集合,每种可能性都有相应的发生概率和损失量。
不确定的变量 | 有90%确定性的范围 |
---|---|
(未来5年)每年部门级病毒攻击的次数 | 2 - 4 |
平均影响人数 | 25000 - 65000 |
人均降低的生产率 | 15% - 60% |
宕机时间 | 4小时 - 12小时 |
每个人一年的人力成本 | 50000美元 - 100000美元 |
1. 校准训练
如何确定有90%的确定性范围呢?
在统计学上,以特定的概率表示一个正确答案的范围,被称为置信区间。一个90%的置信区间表示包含正确答案的可能性有90%。
比如,在开发需求的估时中,你觉得这个需求不会少于5天,也不会多于10天完成,如果你有90%的把握认为实际的时间将在5-10之间, 我们就可以说你的90%置信区间是5-10。这些值你也许是用各种复杂的统计推理方法计算出来的,但也可能仅仅是基于经验得出, 无论哪种方法,这个置信区间应该是对你不确定性的一个反应。
过于自信、过于不自信的对于评估是有偏差的,因此需要进行校准练习,让”估计”变得更准确。
方法 | 描述 |
---|---|
重复和反馈 | 连续做几个测验,每做完一个就看看你做的如何,然后在下一个测验中尽量提高水平 |
等价赌博 | 对每一个评估,设置等价赌博测试,看看你设置的范围或概率是否真的反映了你的不确定程度 |
考虑赞成和反对两方面的意见 | 你为什么对你的评估有信心?找出至少两点原因,还要找出你可能出错的两点原因 |
避免锚定 | 在考虑范文问题时,将上下限分成两个独立的是非题:”真实值超过上下限或低于下限,对此你有95%的把握吗?” |
逆向锚定 | 先设置极大的范围,然后用荒谬测试逐渐缩小范围 |
2. 蒙特卡洛模型
蒙特卡洛模型用计算机产生大量基于概览的情境座位输入,对于每个情境来说,它的每一个未知变量会随机产生一个特定值,然后 将这些值用在一个公式里计算该情境的输出值。
比如:
年节省费用 = (MS + LS + RMS ) * PL
MS(节约维护成本):每单位10~20美元
LS(节约人工成本):每单位2~8美元
RMS(节约原料成本):每单位3~9美元
PL(年产量):每年15000~35000单位
年租金:400 000美元(盈亏平衡点)
如果我们用中值带入,(15 + 3 + 6) * 25 000 = 600 000(美元),似乎比要求的收支平衡好,但这里存在不确定性。
如果,我们创建很多个情境,每一个情境都是随机产生的MS、LS、RMS等的一个集合,通过几千次情境的计算,我们可以确定 这个行为有多大可能产生净收益了。
任何项目的投资风险最终可用一个方法表达,那就是风险和收益的范围以及可能对他们产生影响的其他事件的发生概率。 计算风险的基础就是计算这些范围,蒙特卡洛模型就是用来计算这些范围的。
3. 量化的价值
- OL,机会损失,Opportunity Loss,比如如果我们选择了某一方案,而事后证明它是错误的。
- EOL,预期机会损失,Expected Opportunity Loss,就是出错的概率乘以出错的成本。
所有有价值的量化,都必须减少不确定性,从而影响决策,带来不同的经济结果。EOL减少的越多,量化的价值就越大。 量化前和量化后EOL的差别,叫做”信息的期望值”(Expected Value Of Information,EVI)
人们可能认为如果不确定性很高时,就需要很多数据来减少不确定性,然而事实是,如果不确定性高时,并不需要很多数据来 大幅减少不确定性;当你已经有很多确定的信息时,你才需要很多数据来减少不确定性。
量化倒置:花费大量时间、金钱和精力,量化并无高价值信息的变量,同时却忽略了能显著影响真正决策的变量。即在商业案例中, 一个被量化的事物的经济价值,和它所受到的关注常常成反比。
|序号|典型的低价值测量|典型的高价值测量| |:—:|:—|:—| |1|培训的出勤率|销售培训效果所具有的价值| |2|项目的短期成本|项目的长期收益| |3|安全检查中的违规数量|减少灾难性事件发生的风险|
五、量化方法
1. 选择和设计量化方法
- 对问题进行分解,进而可以通过其他量化方法来估计
- 通过二次研究,重新考虑你的问题
- 将分解后的变量用一种多多种方法量化
- 始终牢记”够用就好”的理念
- 考虑如何减少量化误差
- 工作到有结果未知
- 逐步量化
- 考虑多种方法
- 不必继续量化下去的判断依据是什么
2. 随机抽样
少量的随机抽样好于大量的特殊抽样。
3. 贝叶斯方法
贝叶斯方法,是利用已知个估算未知,处理的是概率和条件概率的关系问题。
六、量化抽象事物
1. 量化人们的偏好和态度
认为诸如”质量”、”形象”、”价值”等概念是不可量化的并不在少数,在某些具体情况下,是因为找不到对这些量的”客观” 估计方法,从这个意义上说,人类的偏好是量化的唯一来源。
广义地说,有两种途径可用来观测人们的偏好:第1种是他们说什么了第二次中是他们做什么。陈述偏好(Stated Preferences) 是人们口头上说的,显示偏好(Revealed Preferences)是人们挺高实际行为展示出来的。显示偏好和陈述偏好不一定会一致, 比如如果人们说他们更愿意花20美元照顾孤儿,而不是看电影,但是在现实中经常去看电影,却一次都没有给孤儿钱。
时间和金钱,是显示偏好的两个很好的”指示器”。实际上,我们可以把主观反应和客观量化建立起来联系,比如问为了xxx你愿意 支付多少钱?那么你就可以用金钱来进行一定程度的衡量了。
2. 通用的量化方法
-
定义量化难题,确定决策模型相关变量。对专家进行校准训练,并对决策模型的变量估计置信区间。
-
计算信息价值,得到决策中每一个变量的信息价值和阈值。
-
设计量化方法,成本要小于完全信息的期望值,并且能减少不确定性。具体的方法可以用前面提到的分解,随机抽样,贝叶斯,透镜模型等等。
-
根据量化的结果更新决策模型变量的范围
-
用蒙特卡洛模型计算可能结果的概率,比较风险和收益。