前沿 | 数据垄断的伪命题和真问题
● 山东大学经济学院教授 曲创
“数据垄断”这4个字最近很常见,大意是指处于反垄断风口浪尖上的那些互联网大公司,垄断了用户的数据,据说这样会导致很严重的后果。最近,脸书、亚马逊等巨头都因涉嫌“数据垄断”,被监管机构调查,有的甚至还被开巨额罚单。
从“数据垄断”这4个字本身我们能解读出两层意思:首先,数据是很有用的东西,要不人家垄断它干嘛?其次,数据是能被垄断起来的,这里的垄断意为独占,数据被某些公司独占了,别人用不到。
“数据垄断”是否真是如此呢?我们一个一个来看。
● 数据有什么用?
其实单纯的数据本身什么用也没有。“40”只是个数字,单从表面我们获取不到任何信息。
“40岁”,这是个年龄;“40元”,这可能是一个价格;“40度”,如果指的是体温,此人在发烧;如果指的是一杯水的温度,水就有点烫。
数据本身什么信息也不包含,必须和其他产品、服务、活动结合起来才能提供有用的信息。当我们把大量的数据集中在一起,奇妙的事情就发生了。
比如,每天上下班时,我们会打开地图APP看看交通拥堵情况,那些红色、黄色、绿色的线条能让我们避开拥堵路段,快点回家。这是基于成千上万车辆的位置、速度等数据计算出来的结果。这便是数据的第一个作用:揭示出个体信息无法体现的整体规律。
数据的第二个作用我们也天天见:匹配供需,提高既有市场交易效率。搜索引擎、电商平台、外卖平台,做的其实都是这个事。交易双方的数据越多,匹配的效率就越高。不过这只是理论上的结论,匹配效率最高的状态不见得就是平台利润最大化的状态。对于平台而言,匹配效率显然没有利润那么重要。
很快,掌握了大量数据的科技平台不满足于仅匹配现有的信息,他们还要基于用户的个体信息提供“个性化服务”,这就是数据的第三种作用。
亚马逊在这一点上做得比较好,它的“预先发货”系统体现得最为明显。亚马逊通过用户之前的消费数据,推断出用户未来几天会买什么东西,然后安排发货。在用户下单的那一刻,包裹就可能已在路上了。至于“个性化定价”“个性化推荐”之类的服务,和亚马逊的“预先发货”相比,只能算小儿科级的应用。
数据的以上3种作用还都是辅助性的,下面这个才是数据的“杀手级应用”:基于数据推出全新产品和服务。
苹果智能手表上有个很冷门的功能“跌倒报警”:如果你意外跌倒,会提示你是否需要报警,简单确认后会拨通事先设置好的急救电话。该功能可判断出你是自己趴下的,还是意外跌倒的,这依据的是智能手表上十几个传感器的数据计算结果。这就是数据创新的价值:关键时刻能救命。
按照生产要素的使用情况,我们可区分两种生产方式:劳动密集型和资本技术密集型,现在有必要加上第三种了:数据密集型。
● 数据能被垄断吗?
基于上述分析,我们可以得出结论,数据确实是很有用的东西,那它是否能被垄断呢?
数据大致可被分成两类,第一类是像城市里的道路分布、某个区域内有多少幢楼、某个路口一天有多少人来车往这样的数据,它可被称为“公共领域的数据”。这类数据谁都可以获得,无法被垄断。第二类是公司自己在生产经营过程中产生的数据,例如平台每天的成交数量、一家餐馆每天卖出多少份菜、平均每桌的消费金额等。这类数据本来就是公司自己的,也就无所谓垄断与否。
所以,“数据垄断”本身是道不成立的伪命题。
更重要的是,从无用的数据到有用的信息之间,需要经过数据的收集、处理、存储、分析过程,这是一个不折不扣的生产过程。数据的生产有3个特性:数据量越大,平均成本越低;数据种类越多,平均成本越低;采用的数据种类越多,收益越大。
因此,对于数据密集型行业而言,提升数据集中度可提升数据生产效率。企业竞争会在数据的总量、类型、处理分析能力、应用开发等层面展开,数据的集中将是行业发展的必然趋势。
大家忧心忡忡的“数据垄断”多数情况下指的是“基于数据的垄断”,并不是对数据本身的垄断。就在今年8月,欧盟正式对亚马逊发起了反垄断调查,核心问题正是数据。亚马逊身兼二职,既有自营业务,也有第三方业务。在亚马逊上开店的第三方商家数据显然要对亚马逊开放,欧盟发现亚马逊很可能利用这些第三方商家的数据,对他们实施了不正当竞争行为。
此案刚开始调查,让我们拭目以待,其结果很可能对国内的电商行业具有很强的借鉴意义。
数据本身是无法被垄断的,但在一个数字化和大数据时代,数据却可能成为垄断和不正当竞争行为的“帮凶”,使得这些违法行为更加隐蔽,对市场竞争和消费者权益的损害也就越大,这才是需要我们关注的。
(来源:科技日报)