01-你有没有数据时代的通行证
你好,我是悦创。
即使你不是一个直接跟数字打交道的人,那么我猜,这几年你也会有数据焦虑。
我们现在妥妥的已经进入了数据时代。所有一流的互联网公司,无一例外的都强调自己的数据能力;而所有一流的传统企业,无一例外,现在最重要的战略就是数字化转型。
各种刷屏文章里,跟数据有关的新词层出不穷,最新一波开始说数字原生、通用 AI、机器认知等等了,统统不明觉厉。这种焦虑之下,我听说很多家庭主妇都报名去上 Python 培训班了。
其实,对于普通人来说,大可不必,比学习数据知识和技能更重要的,是拥有数据思维。
我为什么敢这么说呢?给你讲个故事:
如果你的文学品味到了一定的级别,你看《红楼梦》后 40 回,即使不像张爱玲那样完全读不下去,也能知道和前 80 回不是一个人写的,水平完全不在一个档次。
但是,上世纪八十年代,有一个美国研究者发表了一篇论文,用统计学的方法得出结论,120 回的《红楼梦》就是一个人写的。听上去很厉害是不是?
但当时,中国国内有个数学系的大学生叫陈大康,读了论文原文,“发现有几个要害处难以令人信服,其中包括母体与样本的设定,以及统计时只从《红楼梦》中抽取了 6 万字,检验的指标也只有 14 个。”因此,他对结论非常不服。他并不是质疑计算机,而是对论文的研究设想和操作程序有不同看法 [1] 。
接下来,陈大康就手工做统计。那时候是八十年代,做数据远远没有今天这样方便。72 万字的红楼梦,他数了上百遍,获得了约 2 万个数据。最终得到的结论是,前 80 回和后 40 回语言风格有明显差异,作者肯定是两个人,而不是一个人。
这下,我们这些有品味的红楼迷可以长舒一口气了。张爱玲九泉之下有知,也会发来贺电。
从这个故事里,我得到了什么启发呢?有两点。
第一,数据不会被观点打败,数据只能被数据打败。 人家拿数据得出的结论,跟你的直觉再对不上,你心里再不服气,想反驳,也必须拿数据说话。
第二,比数据技术更重要的是拥有数据思维。 要知道,大学生陈大康做研究,数据采集和处理全靠手动,那时候别说 Python,连 Excel 都没发明出来呢,人家照样提出问题、解决问题。这才是一个真正懂数据的人。
如果说陈大康手动研究《红楼梦》,还只是数据驱动学术研究的个案,相信今天你能感觉得到,数据在我们的工作和生活中,已经成了空气和水一样的存在。
你是不是感觉到,手机地图估计你的行程时间越来越准;(实时计算,再不准你也跑不掉的)今年“双十一”,宝贝的送达时间越来越快;结婚登记之类要亲自到场的事项,越来越多地要通过 App 预约;提取公积金之类不需要亲自到场的事项,越来越多地可以线上自助……所有的业务都越来越有套路,所有的平台都越来越比你更懂你,所有的甲方都越来越要求你提供数据服务,而所有的老板也都要求你提供数据洞察。
这样的时代,有数据思维,一切都是资源;没有数据思维,到处都是陷阱。
身处数据时代,自由行走江湖的本领,必须包括数据思维。有了数据思维,就能提出问题,形成解决问题的思路,然后利用数据服务或者与数据专家合作,最终解决问题。
但是,数据科学的知识非常庞大,很多技术非常前沿,普通人短期之内学不全,也学不会。所以,对于普通人来说,更重要的是你要有跟数据专家对话的能力。
说到此处,我必须再讲一个故事。这个故事可是亲历者告诉我的:
故事的主人公是一个中国小女生,我们就叫她 Helen 吧。Helen入职了一家全球著名的互联网企业的中国办事处,岗位是人事招聘助理。工作了一段时间之后,Helen 非常沮丧。她有 KPI 压力,要提供足够数量的合格应聘者,但是任务总完不成。
难点在于,评价应聘者没有什么标准,这个面试官是这么认为,那个面试官是那么认为,把 Helen 夹在当中,到底听谁的呢?于是,Helen 就找到人力主管抱怨。
主管反问,你有什么解决方案吗?没想到 Helen 说,咱们公司每年有一万多人的招聘,每个应聘者平均有 7 个面试官面试,因此,每年就有 7 万条面试评价记录。这些年也积累了几十万条记录了。从这些记录当中不能做点什么,把评价标准化吗?主管说,好啊,我们找程序员哥哥去说一下吧。
程序员哥哥真的就把问题给解决了,从此,Helen 就过上了幸福的生活。
Helen 使用了什么数据挖掘的术语了吗?没有。Helen 提出了什么模式识别之类的方法了吗?也没有。但是 Helen 生动地说明了我们这里的主题,普通人数据思维的精彩应用——提出问题,挖掘资源,开展协作,推动闭环。
这就是数据思维。这才是数据时代最重要的能力。这才是在数据时代自由行走四方的通行证。
虽然数据思维如此重要,但市面上却没有称心满意的解决方案。绝大部分讲数据思维的课程都是给专门干数据的人的,讲的都是具体的数据技能,很少讲相关的认知。咱们普通人,反而被挡在了通往数据世界的门外。
于是我主动请缨,来开发这门数据思维的通识课。
做个自我介绍。我是 AI悦创,AI悦创·1v1 项目的负责人。为什么我敢开发这门课呢?有这么几个理由:
首先,我有数据相关的基本训练。我好朋友毕业于北京大学社会学系,而我经常和他沟通这些相关的知识「学习」。如果你了解一点社会学就会知道,定量研究是这门学科最重要的研究方法,调查、抽样、概率、统计是我早在 5 年前就学习使用的工作方法。
之后,在网易遇到了一位前辈,他在 1992 年,去美国学习了一年社会人口学,包括当时最前沿的统计分析技术。那时候,前辈天天泡在实验室,用 SAS 程序让大型机跑数据。数据量都是超亿级规模的,放在今天,也算大数据吧。不一样的是,当时计算结果都不能在实验室打印出来,要跑到挺远的学校主机房去取。「当时有段时间是前辈带我适用工作的,离职后就接触少了,这或许就是人生吧~」
另外,我姑姑的第一份长达 8 年的工作是在国家计生委做政策和法规研究。人口工作嘛,整天都会跟数据打交道。「而以前每天吃饭的时候,都会跟我们几个孩子分享」
后来我有幸得到我舅舅指点,他早期去了中央电视台,他做了很多年的电视节目。再后来,离开一线,去做管理工作。电视台的管理,最重要的就是收视率。这样,我从小到大跟数据的接触不胜枚举。现在带学生、写代码又重新跟数据打起了交道。“阅历”上的积累,让我更深刻地理解了真实世界和数据世界的互动关系。
许多年的学习和工作经验,让我有基础,有实践,还有“阅历”。你要是有了解事实,有可能还会知道那时有一个叫做“驯化抖音”的人。当然,那只是普通人与算法互动的游戏而已。对新事物,我保持着旺盛的学习热情。
应该说,我不是专业干数据的,我以前最多的位置是站在决策者和数据分析师之间,所以,我天然就是站在你这一边的。我知道咱们普通人面对数据世界的困惑和难点,我也学习了数据分析师那一头的工作思路。
所以,说句不吹牛的话,我给自己订了个目标:不用公式和图表,在不讲具体的数据技能的前提下,帮更多人提高数据思维。
课程里,我会从感知数据、收集数据、理解数据、操纵数据几个方面带你入门。以后人家再说变量、问卷、元数据、可视化之类的专业名词,相信你也完全能理解。
如果你的工作会跟数据打交道,那这门课程能帮助你获得跟数据工作者对话的能力,下次看报表、提需求就心明眼亮了。
当然,如果你是直接做数据工作的,我也建议你看看学学这门课。如何把你的数据技能跟真实世界的工作需求对接上,怎么跟数据小白解释你的工作原理和思路,这门课也能帮到你。
还记得商业评论家吴伯凡老师的棒喝吗——“在这个时代,你是要当算法,还是要当数据?”
如果你的答案是前者,那来吧,加入这门课程的学习,拿走一张进入数据世界的通行证。
参考资料
[1] 案例来源于《荣国府里的经济帐》序,作者陈大康。
欢迎关注我公众号:AI悦创,有更多更好玩的等你发现!
公众号:AI悦创【二维码】
AI悦创·编程一对一
AI悦创·推出辅导班啦,包括「Python 语言辅导班、C++ 辅导班、java 辅导班、算法/数据结构辅导班、少儿编程、pygame 游戏开发、Linux、Web全栈」,全部都是一对一教学:一对一辅导 + 一对一答疑 + 布置作业 + 项目实践等。当然,还有线下线上摄影课程、Photoshop、Premiere 一对一教学、QQ、微信在线,随时响应!微信:Jiabcdefh
C++ 信息奥赛题解,长期更新!长期招收一对一中小学信息奥赛集训,莆田、厦门地区有机会线下上门,其他地区线上。微信:Jiabcdefh
方法一:QQ
方法二:微信:Jiabcdefh
- 0
- 0
- 0
- 0
- 0
- 0