MongoDB的首席技术官表示声称,我们需要一个平台来“实时处理、存储、保护和分析所有的相关数据集”,而不是数据仓库,也不是数据湖。
Mark Porter的背景饶有意思。他曾经运行过AWS的关系数据库服务(RDS)和Aurora,在此之前曾在Oracle待了十多年。现在他是MongoDB的首席技术官。鉴于这样的出身背景,Porter完全有资格对不断发展的数据库领域指点江山,毕竟他在数据库领域的三家先驱公司效力过。想听听他在说什么吗?
“昔日前台与后台之间的分界在消失。”也就是说,在Porter看来,曾经一度泾渭分明的记录型系统和交互型系统正趋于融合。
如果真是这样,这对千方百计地实现数据战略现代化的企业意味着什么?据Porter声称,企业现在应该“思考数据库之外的东西,还要设计一种实际的‘数据平台’,该平台可以针对所有的相关数据集,实时处理、存储、保护和分析数据。”但这不是一种试图重新构思数据仓库和数据湖的新颖方法吗?
机器有问题
长期以来,数据其实已不一样了。后台系统依赖结构化数据,很适合行和列。这种关系数据库在当时是一项了不起的创新,时至今日继续为企业发挥功用。
关系数据库舒坦的结构化世界正日益受到海量非结构化数据或半结构化数据的挑战。这些新数据大部分是由美国组织理论家、管理顾问和作家Geoffrey Moore所谓的交互型系统生成的,即使最近几十年建立在记录型系统(比如ERP和CRM系统)的基础上。
几十年来,企业一直维护着记录型系统和交互型系统。记录型系统是基础型的、关键型的事实来源,主要由内部程序和用户访问。交互型系统则是客户和员工与之互动的数字化接口。最近,我们看到了新的洞察型系统,这种系统结合来自各个来源的数据,为整个企业的决策提供信息依据。长期以来,每个系统都驻留在不同的计算机上,有不同的数据管理要求,并且由不同部门提供所需资金。
随着模型训练和推理大行其道,另一种类型的分析方法应运而生;在这种方法中,向洞察型系统提出问题,并实时做出反应的是程序,而不是由人提出问题,然后编写程序以落实解决方法。这是一种根本性转变,这种转变太重大了,就好比是从驱动SABRE的IBM 7090s向驱动SKYNET的系统转变。
一统天下的单个数据平台
这种多种系统的融合出现在这样一个时代,即大多数公司正在进行彻底的数字化转型项目,目的是为了变成创新推动、软件驱动和基于云的公司。换句话说,即使每个人都已经很忙碌,但没有比现在更好的时机来思考数据库之外的东西,并设计一种实际的‘数据平台’,该平台可以针对所有的相关数据集,实时处理、存储、保护和分析数据——不用拷贝数据,也不用让这种拷贝成为隐形操作。
本文来自 云头条 引领科技变革,连接技术与商业
评论前必须登录!
注册