本文由Yurii原创,转载请注明来源: Life Sailor

本文链接 信息化的畅想


《信息简史》是去年我读过的印象最深的书。

这本书的开头讲了一个小故事:当年香农面对着飞快发展的电话网络,他忽然想到,这些电话线上每天传递的到底是什么东西?这些东西应该如何衡量?结果大家都知道,香农提出了三大定理,奠定了信息论的基础。而《信息简史》所描绘的,正是人类历史中信息的出现和发展,以及人类对信息的认识和运用:从最早的语言和文字的出现,到印刷术的发展、计算机的出现,一直到信息科技的最新进展。到最后我们才发现,很多时候人类所需要的只是信息本身,实物不过是载体——比如,贝多芬的交响曲到底存在在什么地方呢?显然它既不在乐谱上,也不在演奏现场。可是,在漫长的历史里,信息都必须而且也只能依附实物存在,真正独立开来不过是最近才出现的事情——倒回去二三十年,很难想象我们能用“字节”为单位,统一衡量音乐、图像、视频、文字等等各种信息。《信息简史》的书末还提到了一种让人震惊的假设:信息(尤其是DNA信息)是力争永恒存在的主体,我们无非是信息传递的工具而已。

虽然我之前也做过很多与“信息化”有关的工作,但从没有像《信息简史》那样,单纯从“信息”的角度来看待这个世界。可以说,这本书在很多方面重塑了我关于信息和世界的观点。

最近几个月我读过印象比较深的书也有一本与信息有关,那就是《知识的边界》。这本书讲的是,在互联网的时代,在海量信息唾手可得的今天,我们的知识结构会发生怎样的剧变:比如人类应当重视的是知识的过滤而不再是知识的收集,书籍的“沉浸式阅读”会被随时展开的链接式阅读所打断,我们随时随地都会遇到相冲突的观点……但是我感触最深的却是知识结构的变化,我们的知识不再呈现出“数据-信息-知识-智慧”那种严谨的、不断提纯的金字塔结构,我们可以不再费力去摸索和复原“本质”或者“大自然的规律”,知识的结构已经改变为复杂并且不断演化的网络,我们更重视的是如何在网络中定位和获取我们需要的知识,而忽略了它“本质上”的地位。

不妨以植物分类学为例。自从林奈发明动植物命名的双名法以来,科学家们长久都会遵循这套命名体系,不断发展和巩固动植物分类学。很多人甚至觉得,动植物分类学所反映的,正是“大自然的规律”,这种植物和那种植物既然“有联系”,它们的名字就应该体现出这种联系。但是在信息化的时代,“命名”和“结构”却是可以分离的。在无数的信息系统里,名字只不过是用来区分实体的标识而已(甚至可以是毫无意义的数字ID),实体的结构则表现为一组关系,结构的复杂化不过是新增几组关系而已。传统的动植物分类学完全可以视为一套“命名空间”(namespace),它确实很有用,但要研究动植物,却无需严格遵循这套唯一的命名空间,因为命名空间是可以随意添加、无穷扩展的,而且这种添加和扩展并不会破坏原有的分类结构。

摸索大自然的规律,建立“动植物分类学”的思想,在很长的时间里深深影响了我们。大学里曾经有一门课程叫“图书馆学”,讲的是如何严谨规范地组织信息;雅虎当年所做的“黄页”,也是将各种网站分门别类,放到最合适的类目里。但是在搜索引擎横空出世之后,我们发现一切都改变了:人类不再关心信息的分类,转而关心如何抵达想要的信息——信息甚至不必被科学严谨地分类,也丝毫不影响对它的访问;即便新的命名空间(语法、习俗、亚文化)不断出现,我们仍然不感到混乱失控,唯一关心的是如何在新的命名空间中获取到想要的信息。

从这个角度来看,就能理解为什么有人说“Google对eBay的超越是模式的超越”。eBay贩卖的实物,Google贩卖的是信息。与实物比起来,信息天然就有很多优势:不需要物流派送、没有严格数量限制等等。但我认为最重要的一点是:信息的贩卖途径远远多于实物,所以Google的商业机会远远大于eBay。信息的网状结构可以永恒发展,新增一套命名空间几乎是没有成本的。或者换句话说,关键词和关键词的玩法都是无穷无尽的,相比之下,实物商品的贩卖空间实在是太有限太有限了。所以Google对eBay的超越,技术或许起了重要作用,但不是决定性的因素,贩卖信息的商业模式才是。

这个道理讲起来不难,做起来却不容易。原因大概在于,我们的思维还严重受到实物时代的影响,无法施展想象力,也总觉得信息应该与实体对应起来,信息太多容易造成混乱。以我的亲身经验为例:一件商品通常需要经过设计、生产、质检、运输、仓储、销售、结算、售后等众多环节,每个环节对商品的处理通常是不一样的,但前后环节又需要信息的沟通和对应。现在很多企业的做法仍然是希望“一套编码打遍天下”,也就是把各个环节对商品的处理和定位的需求归拢起来,综合成“最科学”的识别码。无奈各环节需求的规格和粒度总有差别,最终只能权衡取舍,得到折衷的方案,结果总是会出现问题。我曾经历过这样的事情:产品编码的设计中包含了仓储信息。初期运行来没有问题,也确实方便,后期要从不同仓库调货却束手无策,只能把标签全部重新贴过。表面上看,问题在于产品编码设计不合理,缺乏前瞻性;实际上,业务在未来的发展变化是很难在产品出厂时就全部决定的(也不应该全部决定),“一套编码打遍天下”的做法必然会遇到问题。

针对这个问题,我曾了解研究过行业领先的企业,发现对同一件商品存在若干编码乃是常态,不同的编码各司其职,有些用来协助生产,有些用来定位销售,有些用来标识认证……生产的时候用这个码,销售的时候用那个码,认证的时候又是另外一套码……换句话说,同一件产品可以在若干命名空间中交叉定位,以达到针对每个环节、每项工作,都有粒度恰好的专属标识。

看到这里肯定有人要问:搞那么多套编码看起来确实好,但不会混乱吗?是的,如果以人类大脑有限的处理能力来应付,当然会发生混乱。如果我们把“信息分拣和筛选”的职能独立出去,交给专门的机器来处理,只在适当的场合暴露给操作人适当的信息,就不会出现这种问题——很多企业的“信息化”只是把原有的单套编码录入系统而已,其实这不过是最最初级的“信息化”。真正的“信息化”,应当像亚马逊那样实现“员工傻瓜化”,让员工在智能设备的帮助下,游刃有余地畅游于高度复杂化的信息海洋。

顺着这种思路往下看,目前大家所说的“信息化”,仍然太过受制于信息依附于实物和信息处理能力低下的惯性,或者说,信息化的大潮才刚刚开始。未来,会有更多的信息从实物独立出来,或者按照自身规律来勾联演化(比如不断派生出新的命名空间),或者将实物时代的概念肢解再重新组合(比如我在上篇文章提到的,将大家理解的“永久产权”切分为一段段的权利)。最终的结果是怎样,我们能做的不是预测,而是思考、观望、迎接、适应。

P.S. 《信息简史》是我在盛大创新院的同事高博翻译的,《知识的边界》是北大的胡泳老师翻译的,两本书内容都相当好,难得的是翻译也相当准确通畅,很值得阅读。