美国物理学会院士巴拉巴西的新著《爆发》,是讨论大数据问题的最新一部商业论著,可以被视为大数据的商业哲学。
作为复杂网络研究的权威,巴拉巴西在大数据兴起的背景下,得出一个结论性的判断,认为数据、科学以及技术的合力,会使得人类变得比预期中更容易预测得多。这无疑会增强人们对Facebook所做的时间轴(Timeline)这类商业创新的信心。
故事讲的是匈牙利十字军的一段历史,主人公赛克勒受主教之命,征召农民组成十字军。在出征半路上,与同为十字军的贵族军发生一场至今也没搞清原因的“误会”。结果大水冲了龙王庙,十字军内部草根与精英打了起来,贵族军杀了两千农民军。这一事变,将赛克勒激反,走上领导草根起义之路。国王身边的泰勒格迪事先曾准确预言事情的走向,他认为,主教发动农民军充当十字军过于冒险,因为这些农民从军主要并非为了信仰,而是为了摆脱贵族劳役,他们手中有了武器,一旦遇到突发事件就有掉头将矛头直指国王和贵族的危险。这样的事情结果还真发生了。可惜农民军在造反打下大半个匈牙利后,最终被贵族军镇压,赛克勒兵败被擒,坐上“燃烧的御座”,带上烧红的铁制王冠,被当众处死。
这本书虽然可以当历史小说来看,但它的重心在每章的前半部分,即讨论科学的部分。历史故事只是为了证明作者的观点:人类行为90%是可以预测的,就象泰勒格迪做到的那样。
在日趋精密的数字技术条件下,有了从四处搜集来的信息,我们不会再把人类的行为视为互不相关、随意偶然的独立事件。相反,它们应该是相互依存的奇妙大网的一部分,是相互串联的故事集中的一个片段。它们会在不经意时显示次序,在意想不到之处偶然出现。人类行为遵循着一套简单并可重复的模型,而这些模型受制于更加广泛的规律。
巴拉巴西这里讲的实际是语义网络的道理。根据语义网络理论,一个词最初有许多歧义,但一旦被放在由它的上下文编织的语境网络中,它的微言大义就会被精确锁定。
爆发的规律,被作者视为宇宙运行的科学。人类行为并不象自然界那样多是随机运动,而可能在意向作用下表现出非常规的突变的行为。例如,赛克勒出兵时压根就没想过起义,但当手下两千人被“自己人”残杀时,一怒之下导致了爆发,结果目标从对外转成了对内。
爆发是那种脱离自然常规,但符合人的规律的行为。对农民军来说,爆发具有内因,这个内因就是泰勒格迪看到的那个基本面上的原因,即农民因受压迫而产生对贵族的仇视。作者认为,当我们将生活数字化、公式化以及模型化的时候,我们会发现其实大家都非常相似。我们都具有爆发式,而且非常规律。看上去很随意、很偶然,但却极其容易被预测。
如果我们把泰勒格迪不是当作一个人,而是当作一种大数据机制,泰勒格迪无非就是通过经验数据的搜索、分析、挖掘,最终猜测赛克勒们的爆发行为的一套人工智能机理的象征。从这个意义上说,Facebook的时间轴就是个泰勒格迪。
就此谈谈我个人的判断。书中说到的技术事实的部分是可信的。例如谈及手机运营商掌握着我们的实时通信信息和行踪等。其实网络实践比书中说的更为丰富。目前,这种可供分析人类行为的“泰勒格迪”系统主要有几大类,一类是采集分析个人的地球上的全部运动轨迹(通过LBS采集);一类是采集分析个人的全部支付记录(通过在线支付采集);一类是采集分析个人的全部交往记录(通过SNS采集);一类是采集分析个人的全部言行记录(通过邮件、文档、Timeline、视频监控等采集)。
商家通过这些数据,确实可以预测客户的行为,从而提供有别于他人的个性化服务。从这个意义上来说,巴拉巴西的预言是有道理的。
但是,这些事实是否足以改变“决定论-非决定论”这个水平上的哲学结论,每个人可能都会有自己的判断。人具有自由意志,这是不同于分子随机运动之处。如果泰勒格迪成了国王,所有的人是不是都应变为宿命论者?我们有可能成功预测到一个沉默的人在某个时刻突然爆发,但要猜透这个人的斯芬克斯之谜,光有科学和技术可能还是不够的。物理学家也许希望发现历史的宿命,但人通过知识获得解放,不仅是为了排除不可能的自由,更是为了增加可能的选择。
我宁愿赌大数据不会使人类陷于宿命,大数据只是把人性中可预测的部分外包给机器,让人将自由更聚焦于只属于自己的独一无二的部分。
金融工程, 数学算法