【金子凼】eBay旧事,大数据的价值

英文版
2021-07-10, 周六,阴天
读到一个关于网络销售好势头的评论:“二十年前售书,十年前售服装,现在售家具。” 我不禁想起我二十年前的一段工作经历,一段eBay和Paypal鏖战时期的鲜为人知的历史故事。

2001年,老板Jim给了我好多机会让我和当时熟知eBay整个大系统的Vicki一起做开发项目,借以在实践中了解领会eBay大系统的精华。那时,Vicki主要负责eBay的SYI系统(SellYourItem,通俗地说是卖家在eBay网站上卖货物的系统),所以我开发的多是SYI系统的功能。

2001年春天,Jim让我跟着Vicki一起开发eBay的第一个支付系统升级尝试项目:试图在SYI流程中,给予卖家使用BillPoint,eBay内部支付系统,的选择,由此买家在付款时就可以用BillPoint来进行支付了。这个项目需要改动现有的SYI系统的前端页面和后端数据处理方式,让BillPoint的支付形式成为eBay用户的一个永存属性。

这是一个计划在五周左右完成的大项目,Vicki和我一起开发了两周之后,却突然被叫停了。

Jim在告诉我们这个消息时,好像为了安慰我们,特意说过:“两个开发人员开发了两周的大项目被叫停,损失很大。这不会是因为开发的问题。”

项目叫停之后,Vicki和我去参加了一个有好多人的项目讨论会,我惊讶地看到eBay的一位律师是主讲人,因为我参加过的项目讨论会的主讲人都是产品经理。

律师首先给我们解释了我们的项目的实质性:“这个项目试图帮助eBay的卖家把他们的钱包放到BillPoint系统里去。”

我立刻觉得这律师一句话到位。因为这个开发项目将为eBay的用户在后端新增一个“接受BillPoint的支付形式的永存属性”,但具体的支付信息都会去BillPoint的系统上完成并储存在BillPoint而不是eBay系统里。

律师接着说:“这项目类似于把自己的钱包放进别人的包里,很不安全很不明智。所以我们叫停了这个项目。”

这个经历让我知道技术之上的意识很重要!半年之后的2001年秋天,我做为开发领队设计开发了eBay第一版买家结账功能,试图让买家在下单时选择BillPoint。这是SYI系统之外的一个崭新流程,也是eBay大系统首次全程记录和储存买家结账的流程。

记得在开发进程中的每次项目讨论会上,温文尔雅的Jeff,买家结账功能的产品经理,总会提醒我们:“eBay大系统引入这个结账功能的目的是要用Billpoint挤走Paypal。我们要让Billpoint牢牢地粘在结账流程上。”

买家结账功能上线后几天,项目经理Lilian突然问我:“商务分析师从数据库里提出来的买家结账流程的数据太少了,你觉得会是哪里出问题了。”

我马上很自信地回答:“这么大一个新项目,开发人员和测试人员都反复测试过,不可能漏掉储存任何一种买家结账流程!”

我想了想又说:“我们推出的买家结账功能是分布式储存在十个不同的数据库机里,就像eBay用户和eBay货物都分布在十个不同的数据库机上。如果商务分析师按常规只去一个数据库机提取数据,那他只会拿到十分之一的数据,当然会太少。”

后来Lilian告诉我:“你是对的,商务分析师刚开始只去一个数据库机拿数据,现在从十个数据库机里拿到的买家结账数据量很大了。”

买家结账流程的大数据显示使用BillPoint的买家一直很少,进一步分析发现卖家在货物的描述页面上提供了使用PayPal的链接,所以买家还是有机会选用Paypal结账付款。

随后,SYI(卖家在eBay网站上卖货物的系统)专门增添了一个除去Paypal链接和按钮(strip JS)的功能,试图不让卖家在eBay网站上的货物介绍中提供Paypal链接或按钮。记得一个周五的傍晚,我被叫去分析“SYI系统除去JS的功能”最近失效的严重网站问题,这要求来自当时eBay开发部门的少壮派Jeremy,我拿着这个尚方宝剑到另一个办公楼去找当时网页动态语言的高手Justin一起分析问题,我们俩都认为最近几周内的变动不会带来“除去JS功能失效”,所以功能失效不是eBay开发人员造成的。

后来又听说PayPal的网页动态语言的高手“魔高一丈”,eBay的高手斗不过;因为Paypal总能设法把它的链接或按钮动态地加到eBay的货物网页上(网络早期的安全漏洞和竞争机会一样的多!),所以买家总有可能选择用Paypal支付。

在eBay第一版买家结账功能推出后不到一年,eBay在2002年10月3日买下了PayPal。我当时觉得辛辛苦苦开发的买家结账功能惨败了。

几年后,我和一位产品部门的人聊到我曾是eBay第一版买家结账功能的开发领队时听到:“买家结账功能的贡献就是让eBay高层根据大数据做出了放弃BillPoint和买下Paypal的重大决定。”

大数据可能有的放矢帮助引导决策。

小插曲

1. 2001年eBay的分散式数据库:
eBay货物类别有一个很核心的技术应用,就是SYI根据货物所属的大类别把货物信息分别储存在不同的数据库,而不是同一个数据库。我记得当年储存货物信息的数据库有11个,取名CatHost0到CatHost9(类别库机0到类别库机9和1个默认库机)。11个数据库机不可能同时死,eBay的网络系统也就不会由于数据库死机而瘫痪,因为总有数据库可以为买家提供部分货物的展示信息,让卖家储存部分新货物信息等等。

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>