年轻人喜欢听故事,成年人只看数据

制药人

什么叫做故事?故事需要有情节、要用感情来打动人;而数据是枯燥的,数据是生硬的,数据是冰冷的,数据是没有温度的。去年有一个流行的电影叫做《后会无期》,里面有一句话,年轻人喜欢分对错,成年人只看利弊。我讲的是“年轻人喜欢听故事,成年人只看数据”。

现代的故事

有一件事是世界各个地方出现了很多月全食现象,当月全食出现的时候,无数台手机对着月亮,世界各地的人都拍下了照片。而且这些照片同时奔涌到云上面,可能是苹果云,可能是阿里云。现在的天文学家已经意识到这些照片加总起来,比任何一台天文望远镜都要强大。因为他们记录了月亮在不同的地点,不同的角度的形态,他们提供了巨大的研究价值。

第二个故事,还是去年,旧金山附近发生了一场地震。那时候我还在旧金山,晚上3点多发生的地震。地震的第二天一个可穿戴设备的制造商发布了一组大数据,他们发现通过他们的可穿戴式设备可以知道地震的一刹那有多少人醒了,多少人翻身,你能够看到随着离震源的距离不断变远,醒的人越来越少。这给我们什么启示?这是人类历史上第一次能够掌握说有一天晚上我们知道这个地方有多少人睡着了、有多少人醒着、他们什么时候醒的。这些数据可以解释很多问题,例如为什么第二天交通事故会增多,心理学家、社会学家还可以用这些数据解释更多的问题,这是我们以前不能想像的。

这两个故事给我们什么启发呢?我想提出的概念是“数据外部性”。

给月亮拍照是为了娱乐,为了分享,最后照片汇总到一起的时候却带来了研究的价值,没有任何一台天文望远镜如此强大。为什么你要戴可穿戴式设备?你是要收集监控你的个人健康情况,这就是数据的外部性——数据的作用能够超脱它最初收集的目的,你收集数据是为了这个目的,但是事实上可以用到另外的纬度,通过不同纬度的应用,数据作用和价值能够层层放大、不断繁衍、扩大。

最近嘉兴一个年轻人回到家里,发现父母两个人都已经在家中去世多日了,父亲因为身体不健康,洗澡出来摔倒在地死亡了,母亲因为瘫痪在床上无人照顾,饿死了。类似的惨状,未来会不会发生改变?当可穿戴式设备普及的时候,最早发现人死亡的可能不是你的亲人,是大数据,是云。

古老的故事

最早的大数据是人口普查的数据,人口普查要为全国每一个人去建一个档案,建一个数据记录。美国人在建国的时候就把人口普查的制度写进了《宪法》。这帮建国之父,为什么要这样做?他们面临的问题是国家怎么治理,权力怎么分配,他们要实行代议制,这是按照人口的基数来选举代表。这就要首先把全国的人口算清楚,才能实行民主代议、选举代表。大家知道在200年前要把一个国家的人口要算清楚是非常不容易的,美国当时一次人口普查要做几年才能把全国的人算清楚。

但是,随着历史的车轮不断地向前推进,人口普查数据起到了很多很微妙的作用。比如说南北战争的时候,南方跟北方打仗是因为奴隶制。南方想保留,北方不同意,双方开火了,最后南方被北方击败。事实上回到历史仔细审视,南北开始交战,就是人口普查带来的结果。刚才讲到美国的政治制度,是按照人口来选举议员的,最早的时候南方跟北方在议会里面是人数相当的,但后来越来越多的移民跑到了北方,北方的人口大幅增长,他们的代表也越来越多。开战前,北方人口的基数已经远远超过南方,国会一投票,奴隶制肯定被费除,南方没有选择,只有试图分裂出去。所以说南方最大的敌人,不是北方,而是人口普查的大数据。

继续往前看,美国的人口普查,虽然开始只是仅仅为了分配权力,但数据却在以后的日子里为社会治理提供了方方面面的参考。每10年的人口普查,国会都要辩论,辩论到什么要普查,什么不普查,到1860年、1870年的时候,一次普查要用7到9年的时间,才能处理完全部的数据,才能做一个报告出来。

大家可以想像,每十年调查一次,九年才能出报告,报告出来新的调查又开始,所以国会争论过,这个调查还有没有价值,要不要做?数据统计带来的压力,最后推动了美国的技术创新。1890年,美国人发明了打孔制表机,用卡片来处理这些数据,把所有的数据都转换成0和1,这是未来计算机最早的雏形。

第一台计算机在1946年产生,沿袭了打孔制表机的二进制。另外,这台机器的产生源于一个军方项目,其中的两个工程师,都没有拿到任何的专利,他们愤而下海,下海之后找的第一个客户是美国的人口普查局。全世界第一台商业电脑就是用来处理人口普查数据的。美国人口普查最早是为了权力的分配,最后催生和推动了技术的创新,直接引领人类进入计算机时代。

历史与现实都证明了数据的外部性有多么重要。数据绝对不是一个维度的,今天的大数据之所以这么有用,是因为它能够在多个维度激发新的作用。