09-测量:如何定量地把握一个事物?

你好,我是悦创。
上一讲,我们学习了两个重要的预备知识:
- 一:数据、变量和表格是三个不同层级的概念;
- 二:数据一共有四种类型,分别是类别、次序、间隔和比例。
预备知识准备好,我们就可以用它来工作了。做什么工作呢?
我们先讲一个盲人摸象的故事。故事的内容你肯定很熟悉。几个盲人被要求摸一头大象,告诉大家大象是什么。
- 摸到大象牙齿的说,大象像大萝卜;
- 摸到了耳朵的说,大象像大蒲扇;
- 摸到腿的说像柱子;
- 摸到尾巴的说像草绳。
这是一个非常好的隐喻,说明对事物的了解不能以偏概全。但是要我说,故事里的盲人比我们运气好多了。因为这些盲人是被确定地告知,有一头大象,就在这里,你要做的就是触摸它,然后告诉大家它像什么。这个前提太重要了。
反过来,现实生活中的我们,可比故事里的盲人差太多了。你摸过量子吗?看得见员工敬业度吗?抓得住现代化吗?这些东西看不见摸不着,甚至就是人们创造出来的观念,怎么定量地去把握它们呢?——这就需要我们去测量。
注意:这一讲我们讨论的是测量一个完整的事物,甚至是一个抽象的概念,而不是测量事物的某一个指标。换句话说,我们是要测量大象、描述大象这种动物,而不是测量大象的身高、体重这样单一的指标。
现在问题来了,怎么才能做好测量呢?有哪些要注意的地方呢?这一讲,我们就说说这个问题。
1. 测量的目标是什么?
在展开测量前,我们要明白的第一点就是——测量的目标是什么?答案很清楚,是必须得到一组指标。
举个例子:
- 营商环境。我们都有感觉,在这个国家,干企业干买卖挺好干;
- 在那个国家,就不好干。
但是请注意,这叫感觉,如果你要做跨国投资,光凭感觉可不行,怎么确切地知道一个国家的营商环境究竟怎么样呢?
2019 年 10 月,国务院发布了《优化营商环境条例》,自 2020 年 1 月 1 日起施行。其中对营商环境是怎么说的呢?条例是这样说的:营商环境是指市场主体在准入、生产经营、退出等过程中,涉及的政务环境、市场环境、法治环境、人文环境等有关外部因素和条件的总和。
这样的定义很准确,但它只是描述性的,拿着它,还是很难准确地把握一个地方的营商环境到底怎么样。所以,我们需要测量。
世界银行就是通过 8 个指标来衡量一个国家的营商环境的。我念一下这 8 个指标:
- 创建一家企业的难易程度;
- 取得营业执照的难易程度;
- 雇佣工人的难易程度;
- 解雇工人的难易程度;
- 产权登记的难易程度;
- 缴税的难易程度;
- 跨境贸易的难易程度;
- 关停企业的难易程度。
难易程度是能打分的,能拿数据准确表示。这样一来,一组 8 个指标合起来,就能迅速比较出全球不同国家的营商环境。所以说,测量就是一个得到指标体系的过程。
2. 测量该怎么做?
现在我们知道了,测量的目标就是一组指标,可问题又来了——我们怎么找到这些合适的指标呢?换句话说,怎么确定测量什么指标,不测量什么指标呢?
比如,我们总说职场优势,怎么科学地评价一个人的职场优势在哪里?劣势在哪里?需要做哪些方面的测量呢?
方法当然有很多。这里介绍一种常用的,就是借助维度,对认知对象的各个属性进行拆分。
比如刚才的问题,怎么评价一个人的职场优势呢?
北森公司就提供了一个测评方法,分了 5 个维度,分别是:
- 动机能量;
- 思维决策;
- 情感成熟度;
- 人际互动;
- 任务执行。
你说,动机能量也很复杂啊,指标还有很多,那就再分维度。北森公司继续分拆动机能量,具体来说,就是成功愿望、权力动机、亲和动机和活力四个维度。这样,找合适的指标的难度就降低了。
不知道你注意到没有,前面国务院的条例里其实也分解了营商环境不同的维度,分别是政务环境、市场环境、法治环境、人文环境,一共4 个。
人文环境,说的就是文化传统、宗教信仰等对经济活动的影响。你看,国内有的地方,非要喝一顿大酒才能签单,也有的不是一个县的就被排斥,这就是人文环境的不同。这方面,世界银行的版本就没有考虑。没有考虑也挺好,毕竟世界银行是一个联合国经济组织,还是少涉及文化比较好。
听完这些例子,可能你会觉得,这些维度都确定好了,似乎就是唯一的答案。其实不是这样的。很多事物,人的认识不一致、角度不一致、目的不一致,维度的选取也就不一致。
举个例子,同情心,这个事物怎么分解成维度呢?有很多种方案。比如可以分解为:
- 感情方面的同情心和行动方面的同情心;
- 也可以分解为,对人类的同情心和对动物的同情心;
- 还可以分解为,宽恕他人的同情心和怜悯他人的同情心。
这就有三种方案了,还可以有更多。
所以,如何分解维度反映了你如何理解事物。确定了维度,也就确定了要测量的指标。
不过要提醒你的是,虽然划分维度的方案有很多种,但并不是说维度和指标可以随意选择。在划分维度、选择指标时,我们至少要遵循两个原则——
2.1 第一:边际效应最大化原则
意思是,多增加一个指标是不是更好的说明了认知对象。如果是,那就增加;如果没有更好的说明认知对象,那就不需要增加。
比如对营商环境,8 个指标是多了还是少了?那要看少一个会有什么损失,多一个会有什么好处。如果少了不能全面说明营商环境,那就不能少;多了没有什么意义,那就不需要增加。
2.2 第二:可靠性原则,也叫“信度”
意思是,保证每次测量都能得到稳定的结果。前几年,国内有一家主流电视媒体做了一个报道,记者在田间街头随意拦截一些人,问对方:“你幸福吗?”有的人就误会了,回答说:“我姓曾。”这说明,不是每次测量都保证测量的就是幸福。这样做调查,就是可靠性不达标,或者说信度不达标。
真实的情况是,对于一个认知对象,大家会各自提出自己的指标体系,相互竞争,最后迭代出一个共识的方案。
3. 怎么保证测量的就是你想测量的?
现在我们学会了找合适的指标,也得到了一组测量的结果。可问题又来了,怎么保证你测量的就是你想测量的呢?
这不是绕口令,而是一个非常重要的问题。这方面的学问也很庞大,术语叫“效度”,就是评价测量的有效性。那么,具体怎么做呢?怎么保证我们想测量 A 时测量到的确实是 A,而不是 B 呢?
这里,简单介绍三种思路。
3.1 第一:考虑关联性
比如,当初清华大学的国学大师们出考题,考题是对子的上联——“孙行者”,让学生对下联。这些大师认为,对联的水平与国学水平有关,测量对联水平就是在测量国学水平。
3.2 第二:考虑结构性
很多变量在理论上是有联系的,如果有证据证明了这种联系,我们就可以说自己的测量是有效的。
比如,我们用某种方式测量了“婚姻满意度”,是不是有效呢?我们知道,如果婚姻不忠诚,对婚姻的满意度就不会高,这两个变量应该是密切相关的。所以,我们就可以看看测量的结果与婚姻忠诚度这个变量之间的关系。如果确实是相关的,我们对婚姻满意度的测量很可能是有效的;如果不相关,那就很可能无效。
3.3 第三:考虑完备性
也就是看,测量的内容是不是全面包含了要认知的对象。比如测量数学能力,但是出的都是代数方面的题目,没有几何方面的,就很难说服大家这个测量全面考察了数学能力。
其实,之所以有这么多方法,就是因为没有什么办法可以确保测量的有效性。这正是我们这些真正的盲人面对的困境。
不过虽然如此,我们还是不能耍小聪明。小聪明就是“打哪指哪”,明明不知道测量出了什么,偏要强行解释我们完美地测量出了什么。这是自己骗自己。
有了上一讲和这一讲的铺垫,接下来我们就可以学习各种收集数据的方法了。下一讲,我们先说一个最经典的方法——抽样。
我是悦创,我们下一讲再见。
划重点:
- 测量的目标就是为了得到一组指标。这样一来,我们就可以用这组指标描述一个事物了。
- 为了全面把握一个事物,测量时可以用维度拆分的方法,具体要遵循两个原则——一边际效应最大化原则和可靠性原则。
- 为了保证测量的就是我们想测量的,我们需要用各种方法进行确认,考虑关联、结构和完备性是三个常用的方法。
公众号:AI悦创【二维码】

AI悦创·编程一对一
AI悦创·推出辅导班啦,包括「Python 语言辅导班、C++ 辅导班、java 辅导班、算法/数据结构辅导班、少儿编程、pygame 游戏开发、Web、Linux」,招收学员面向国内外,国外占 80%。全部都是一对一教学:一对一辅导 + 一对一答疑 + 布置作业 + 项目实践等。当然,还有线下线上摄影课程、Photoshop、Premiere 一对一教学、QQ、微信在线,随时响应!微信:Jiabcdefh
C++ 信息奥赛题解,长期更新!长期招收一对一中小学信息奥赛集训,莆田、厦门地区有机会线下上门,其他地区线上。微信:Jiabcdefh
方法一:QQ
方法二:微信:Jiabcdefh

更新日志
e4647-于d62c8-于78027-于e456a-于a44f6-于70353-于ae8a4-于9bfdc-于4d098-于1c35a-于cbb3a-于76989-于86c50-于027da-于