分布式数据库的核心权衡是:“以质换量”,牺牲功能、性能、复杂度、可靠性,换取更大的数据容量与请求吞吐量。但分久必合,硬件变革让集中式数据库的容量与吞吐达到一个全新高度,使分布式(TP)数据库失去了存在意义。
(资料图片仅供参考)
以 NVMe SSD 为代表的硬件遵循摩尔定律以指数速度演进,十年间性能翻了几十倍,价格降了几十倍,性价比提高了三个数量级。单卡 32TB+, 4K随机读写 IOPS 可达 1600K/600K,延时 70µs/10µs,价格不到 200 ¥/TB·年。跑集中式数据库单机能有一两百万的点写/点查 QPS。
真正需要分布式数据库的场景屈指可数,典型的中型互联网公司/银行请求数量级在几万到几十万QPS,不重复TP数据在百TB上下量级。真实世界中 99% 以上的场景用不上分布式数据库,剩下1%也大概率可以通过经典的水平/垂直拆分等工程手段解决。
头部互联网公司可能有极少数真正的适用场景,然而此类公司没有任何付费意愿。市场根本无法养活如此之多的分布式数据库内核,能够成活的产品靠的也不见得是分布式这个卖点。HATP 、分布式单机一体化是迷茫分布式TP数据库厂商寻求转型的挣扎,但离 PMF 仍有不小距离。
互联网的牵引“分布式数据库” 并不是一个严格定义的术语。狭义上它与 NewSQL:cockroachdb / yugabytesdb / tidb / oceanbase / TDSQL 等数据库高度重合;广义上 Oracle / PostgreSQL / MySQL / SQL Server / PolarDB / Aurora 这种跨多个物理节点,使用主从复制或者共享存储的经典数据库也能归入其中。在本文语境中,分布式数据库指前者,且只涉及核心定位为事务处理型(OLTP)的分布式关系型数据库。
分布式数据库的兴起源于互联网应用的快速发展和数据量的爆炸式增长。在那个时代,传统的关系型数据库在面对海量数据和高并发访问时,往往会出现性能瓶颈和可伸缩性问题。即使用 Oracle 与 Exadata,在面对海量 CRUD 时也有些无力,更别提每年以百千万计的高昂软硬件费用。
互联网公司走上了另一条路,用诸如 MySQL 这样免费的开源数据库自建。老研发/DBA可能还会记得那条 MySQL 经验规约:单表记录不要超过 2100万,否则性能会迅速劣化;与之对应的是,数据库分库分表开始成为大厂显学。
这里的基本想法是“三个臭皮匠,顶个诸葛亮”,用一堆便宜的 x86 服务器 + 大量分库分表开源数据库实例弄出一个海量 CRUD 简单数据存储。故而,分布式数据库往往诞生于互联网公司的场景,并沿着手工分库分表 → 分库分表中间件 → 分布式数据库这条路径发展进步。
作为一个行业解决方案,分布式数据库成功满足了互联网公司的场景需求。但是如果想把它抽象沉淀成一个产品对外输出,还需要想清楚几个问题:
十年前的利弊权衡,在今天是否依然成立?
互联网公司的场景,对其他行业是否适用?
分布式事务数据库,会不会是一个伪需求?
分布式的权衡“分布式”同“HTAP”、 “存算分离”、“Serverless”、“湖仓一体” 这样的Buzzword一样,对企业用户来说没有意义。务实的甲方关注的是实打实的属性与能力:功能性能、安全可靠、投入产出、成本效益。真正重要的是利弊权衡:分布式数据库相比经典集中式数据库,牺牲了什么换取了什么?
数据库需求层次金字塔[1]
分布式数据库的核心Trade Off 可以概括为:“以质换量”:牺牲功能、性能、复杂度、可靠性,换取更大的数据容量与请求吞吐量。
NewSQL 通常主打“分布式”的概念,通过“分布式”解决水平伸缩性问题。在架构上通常拥有多个对等数据节点以及协调者,使用分布式共识协议 Paxos/Raft 进行复制,可以通过添加数据节点的方式进行水平伸缩。
首先,分布式数据库因其内在局限性,会牺牲许多功能,只能提供较为简单有限的 CRUD 查询支持。其次,分布式数据库因为需要通过多次网络 RPC 完成请求,所以性能相比集中式数据库通常有70%以上的折损。再者,分布式数据库通常由DN/CN以及TSO等多个组件构成,运维管理复杂,引入大量非本质复杂度。最后,分布式数据库在高可用容灾方面相较于经典集中式主从并没有质变,反而因为复数组件引入大量额外失效点。
SYSBENCH吞吐对比[2]
在以前,分布式数据库的利弊权衡是成立的:互联网需要更大的数据存储容量与更高的访问吞吐量:这个问题是必须解决的,而这些缺点是可以克服的。但今日,硬件的发展废问了量的问题,那么分布式数据库的存在意义就连同着它想解决的问题本身被一并抹除了。
新硬件的冲击摩尔定律指出,每18~24个月,处理器性能翻倍,成本减半。这个规律也基本适用于存储。从2013年开始到2023年是5~6个周期,性能和成本和10年前比应该有几十倍的差距,是不是这样呢?
让我们看一下 2013 年典型 SSD 的性能指标,并与 2022 年 PCI-e Gen4 NVMe SSD 的典型产品进行对比。不难发现:硬盘4K随机读写 IOPS从60K/40K到了1600K/600K,价格从2220$/TB40$/TB。性能翻了15 ~ 26倍,价格便宜了56 倍[3,4,5],作为经验法则在数量级上肯定是成立了。
十年前,机械硬盘还是绝对主流。1TB 的硬盘价格大概七八百元,64GB 的SSD 还要再贵点。十年后,主流 3.2TB 的企业级 NVMe SSD 也不过三千块钱。按五年质保折算,1TB每月成本只要16块钱,每年成本不到200块。作为参考,云厂商号称物美价廉的 S3对象存储都要1800¥/TB·年。
典型的第四代本地 NVMe 磁盘单卡最大容量可达32TB~ 64TB,提供70µs/10µs4K随机读/写延迟,1600K/600K的读写IOPS,第五代更是有着单卡十几GB/s的惊人带宽。
这样的卡配上一台经典 Dell 64C / 512G服务器,IDC代维5年折旧,总共十万块不到。而这样一台服务器跑 PostgreSQL 或者 MySQL ,sysbench单机点写入可以接近百万QPS,点查询干到两百万 QPS 不成问题。
这是什么概念呢?对于一个典型的中型互联网公司/银行,数据库请求数量级通常在几万/几十万 QPS这个范围;不重复的TP数据量级在百TB上下浮动。考虑到使用硬件存储压缩卡还能有个几倍压缩比,这类场景在现代硬件条件下,有可能集中式数据库单机单卡就直接搞定了[6]。
在以前,用户可能需要先砸个几百万搞 exadata 高端存储,再花天价购买 Oracle 商业数据库授权与原厂服务。而现在做到这些,硬件上只需一块几千块的企业级 SSD 卡即可起步;像 PostgreSQL 这样的开源 Oracle 替代,最大单表32TB照样跑得飞快,不再有当年MySQL非要分表不可的桎梏。原本高性能的数据库服务从情报/银行领域的奢侈品,变成各行各业都能轻松负担得起的平价服务[7]。
性价比是第一产品力,高性能大容量的存储在十年间性价比提高了三个数量级,分布式数据库曾经的价值亮点,在这种大力出奇迹的硬件变革下显得软弱无力。
伪需求的困境在当下,牺牲功能性能复杂度换取伸缩性有极大概率是伪需求。
在现代硬件的加持下,真实世界中 99%+ 的场景超不出单机集中式数据库的支持范围,剩下1%也大概率可以通过经典的水平/垂直拆分等工程手段解决。这一点对于互联网公司也能成立:即使是全球头部大厂,不可拆分的TP单表超过几十TB的场景依然罕见。
NewSQL的祖师爷 Google Spanner 是为了解决海量数据伸缩性的问题,但又有多少企业能有Google的业务数据量?从数据量上来讲,绝大多数企业终其生命周期的TP数据量,都超不过集中式数据库的单机瓶颈,而且这个瓶颈仍然在以摩尔定律的速度指数增长中。从请求吞吐量上来讲,很多企业的数据库性能余量足够让他们把业务逻辑全部用存储过程实现并丝滑地跑在数据库中。
“过早优化是万恶之源”,为了不需要的规模去设计是白费功夫。如果量不再成为问题,那么为了不需要的量去牺牲其他属性就成了一件毫无意义的事情。
在数据库的许多细分领域中,分布式并不是伪需求:如果你需要一个高度可靠容灾的简单低频KV 存储元数据,那么分布式的 etcd 就是合适的选择;如果你需要一张全球地理分布的表可以在各地任意读写,并愿意承受巨大的性能衰减作为代价,那么分布式的 YugabyteDB 也许是一个不错的选择。如果你需要进行信息公示并防止篡改与抵赖,区块链在本质上也是一种 Leaderless 的分布式账本数据库;
对于大规模数据分析OLAP来说,分布式可以说是必不可少(不过这种一般称为数据仓库,MPP);但是在事务处理OLTP领域,分布式可以说是大可不必:OTLP数据库属于工作性记忆,而工作记忆的特点就是小、快、功能丰富。即使是非常庞大的业务系统,同一时刻活跃的工作集也不会特别大。OLTP系统设计的一个基本经验法则就是:如果你的问题规模可以在单机内解决,就不要去折腾分布式数据库。
OLTP数据库已经有几十年的历史,现有内核已经发展到了相当成熟的地步。TP 领域标准正在逐渐收敛至 PostgreSQL,MySQL,Oracle 三种 Wire Protocol。如果只是折腾数据库自动分库分表再加个全局事务这种“分布式”,那一定是没有出路的。如果真能有“分布式”数据库杀出一条血路,那大概率也不是因为“分布式”这个“伪需求”,而应当归功于新功能、开源生态、兼容性、易用性、国产信创、自主可控这些因素。
迷茫下的挣扎分布式数据库最大的挑战来自于市场结构:最有可能会使用分布式TP数据库的互联网公司,反而是最不可能为此付费的一个群体。互联网公司可以作为很好的高质量用户甚至贡献者,提供案例、反馈与PR,但唯独在为软件掏钱买单这件事上与其模因本能相抵触。即使头部分布式数据库厂商,也面临着叫好不叫座的难题。
近日与某分布式数据库厂工程师闲聊时获悉,在客户那儿做 POC 时,Oracle 10秒跑完的查询,他们的分布式数据库用上各种资源和 Dirty Hack 都有一个数量级上的差距。即使是从10年前PostgreSQL 9.2 分叉出来的 openGauss,都能在一些场景下干翻不少分布式数据库,更别提10年后的 PostgreSQL 15 与 Oracle 23c 了。这种差距甚至会让原厂都感到迷茫,分布式数据库的出路在哪里?
所以一些分布式数据库开始自救转型,HTAP是一个典型例子:分布式搞事务鸡肋,但是做分析很好呀。那么为什么不能捏在一起凑一凑?一套系统,同时可以做事务处理与分析哟!但真实世界的工程师都明白:AP系统和TP系统各有各的模式,强行把两个需求南辕北辙的系统硬捏合在一块,只会让两件事都难以成功。不论是使用经典 ETL/CDC推拉到专用ClickHouse/Greenplum/Doris 去处理,还是逻辑复制到In-Mem列存的专用从库,哪一种都要比用一个奇美拉杂交HTAP数据库要更靠谱。
另一种思路是单机分布式一体化:打不过就加入:添加一个单机模式以规避代价高昂的网络RPC开销,起码在那些用不上分布式的99%场景中,不至于在硬指标上被集中式数据库碾压得一塌糊涂——用不上分布式没关系,先拽上车别被其他人截胡!但这里的问题本质与 HTAP 是一样的:强行整合异质数据系统没有意义,如果这样做有价值,那么为什么没人去把所有异构数据库整合一个什么都能做的巨无霸二进制 ——数据库全能王?因为这样违背了KISS原则:KeepItSimple,Stupid!
分布式数据库和数据中台的处境类似[8]:起源于互联网大厂内部的场景,也解决过领域特定的问题。曾几何时乘着互联网行业的东风,数据库言必谈分布式,火热风光好不得意。却因为过度的包装吹捧,承诺了太多不切实际的东西,又无法达到用户预期 —— 最终一地鸡毛,成为皇帝的新衣。
TP数据库领域还有很多地方值得投入精力:Leveraging new hardwares,积极拥抱 CXL,RDMA,NVMe 等底层体系结构变革;或者提供简单易用的声明式接口,让数据库的使用与管理更加便利;提供更为智能的自动驾驶监控管控,尽可能消除运维性的杂活儿;开发类似 Babelfish 的 MySQL / Oracle 兼容插件,实现关系数据库 WireProtocol 统一。哪怕砸钱堆人提供更好的支持服务,都比一个 “分布式” 的伪需求噱头要更有意义。
因时而动,君子不器。愿分布式数据库厂商们找到自己的PMF,做一些用户真正需要的东西。
References[1]数据库需求层次金字塔:https://mp.weixin.qq.com/s/1xR92Z67kvvj2_NpUMie1Q
[2]PostgreSQL到底有多强?:https://mp.weixin.qq.com/s/651zXDKGwFy8i0Owrmm-Xg
[3]2013年SSD性能 :https://www.snia.org/sites/default/files/SNIASSSI.SSDPerformance-APrimer2013.pdf
[4]2022年镁光9400 NVMe SSD 规格说明 :https://media-www.micron.com/-/media/client/global/documents/products/product-flyer/9400_nvme_ssd_product_brief.pdf
[5]2013-2030 SSD价格走势与预测 :https://blocksandfiles.com/2021/01/25/wikibon-ssds-vs-hard-drives-wrights-law/
[6]单实例100TB使用压缩卡到20TB:https://mp.weixin.qq.com/s/JSQPzep09rDYbM-x5ptsZA
[7]公有云是不是杀猪盘?:https://mp.weixin.qq.com/s/UxjiUBTpb1pRUfGtR9V3ag
[8]中台:一场彻头彻尾的自欺欺人:https://mp.weixin.qq.com/s/VgTU7NcOwmrX-nbrBBeH_w
标签:
上一篇 : 方萍萍:2023年04月26日黄金交易策略_观焦点
下一篇 : 最后一页
随着硬件技术的进步,单机数据库的容量和性能已达到了前所未有的高度。而分布式(TP)数据库在这种变革面前极
非法加冯 04-26 09:23:56
通过对黄金小时图解析得知,昨日行情继续先涨后跌再上涨形成宽幅震荡走势,目前上方依然是受制于1,2,3号的
中金在线财经号 04-26 09:08:33
中国石化新闻网讯4月21日,胜利东部探区传来好消息,多口探井应用全过程油层保护技术,见油率100%,平均
中国石化新闻网 04-26 08:32:26
1、广角镜头是一种焦距短于标准镜头、视角大于标准镜头、焦距长于鱼眼镜头、视角小于鱼眼镜头的摄影镜。2、
互联网 04-26 08:06:29
做好托育服务工作是实现“幼有所育”“幼有善育”的关键。国家卫生健康委副主任于学军25日在京表示,截...
新华社 04-26 06:54:41
鞭牛士4月25日消息,胡润百富发布了《胡润世界500强》,榜单上榜门槛280亿美元,相当于2030亿元。上榜企业
鞭牛士 04-26 06:18:34
证券时报评论称,生成式AI或引发新一轮技术革新,未来生成式AI可能成为新的入口或是一个新的操作系统,...
同花顺财经 04-26 04:56:34
报告网监测数据统计:2022年5月全国布产量为31 6亿米,同比降低-6 2%;1-5月份累计产量为147 6亿米,同比
报告网 04-26 03:26:40
1、楼主好,数字键盘的循环开关是Fn+NumLk。2、你找一下NumLK键一般在F11附近。3、注意是循环开关,同时按下
互联网 04-26 02:04:49
1、《秋夕》是晚唐著名诗人杜牧所作的一首脍炙人口的七言绝句,这首诗写一个失意宫女的孤独生活和凄凉心情
互联网 04-26 00:04:24
1、免职一般有三种情况,一种是平级调动-如 "免去XX同志A所所长职务,任B所所长 "第二
互联网 04-25 23:04:50
极目新闻记者叶文波通讯员邓洲陈苏琴实习生宋珍妮闫世超这个“大超市”顺利开张,却不卖商品,企业家们...
极目新闻 04-25 21:53:14
4月25日,中国船舶集团旗下江南造船(集团)有限责任公司(下称“江南造船”)为PETREDEC公司建造93000立方
上海证券报 04-25 21:32:51
长实集团(01113)公布,于2023年4月25日,该公司回购28 9万股,斥资1
指股网 04-25 20:57:16
中新网4月25日电据西班牙埃菲通讯社报道,巴拉圭总统选举候选人库巴斯当地时间23日表示,支持巴拉圭同中国
中国新闻网 04-25 20:16:12
最新!星巴克缔造者霍华德·舒尔茨的万字分享,投资者眼里,星巴克是好股票;员工心中,星巴克是好雇主;...
引领外汇网 04-25 19:37:02
养老金计算方法分享:2023养老金计算公式,看完你也可以计算!社保网小编整理了最新资讯。对于养老金的计算
律法网 04-25 19:14:04
23嘉兴现代SCP001发布发行公告
东方财富Choice数据 04-25 18:35:43
4月25日,据《科创板日报》讯,在网易数帆在低代码业务战略发布会,网易公司CEO丁磊表示,人工智能的价值已
财华网 04-25 18:01:42
近日金诚信披露,截至2023年3月31日公司股东户数为1 17万户,较12月31日减少1361 0户,减幅为10 43%。户均
证券之星 04-25 17:56:07
近日,新疆若羌县若羌镇文化社区“访惠聚”工作队和社区“两委”在祁曼花园小区开展以“滋养民族心灵培...
央广网 04-25 17:11:55
老龄化社会加速到来的背景下,养老问题热度不减。越来越多的人对未来的退休生活,开始提前规划。如何才能过
中国基金报 04-25 16:52:51
北京时间4月25日,雄鹿热火G4开打。全场战罢,热火119-114逆转雄鹿。全场比赛,雄鹿前锋扬尼斯-安特托昆博
北青网 04-25 16:20:26
欢迎观看本篇文章,小勉来为大家解答以上问题。日月之行中的行是什麽意思,日月之行中的行解释很多人还不知
互联网 04-25 15:57:31
受去年汛期来水不足影响,导致2023年初水力发电不足,水力发电依旧尚未好转,根据统计局1-3月数据,水电累
我的钢铁网 04-25 15:30:01
韩国女明星金泫雅在自己的个人社交账号中上传了一组照片,随着照片的流出,有关金泫雅着装到底算不算打擦边
新浪娱乐 04-25 15:04:33
移远通信(603236):1Q23净利承压研发投入加码
华泰证券股份有限公司 04-25 14:36:14
分析认为,从过去二三月份的数据来看,新发产品中封闭式产品占到90%以上,从比例上来看,封闭式理财产品是
第一财经 04-25 14:12:03
据连连国际联席CEO吕蔚嬿介绍,“数智出海”项目由连连数字旗下连连国际发起,将聚焦构建“商机互推、资...
北京商报网 04-25 14:02:16
1、缴费灵活:该保单可以任意选择缴费期,中途变更缴费期也是可以的,缴费很灵活,可以满足更多消费者的保
马蜂保 04-25 13:51:30
1、歌曲:沧海一声笑歌手:罗文专辑:留给这世上我最爱的词曲:黄沾编沧海一声笑滔滔两岸潮浮沉随浪只记今朝
互联网 04-25 13:24:47
1、童话,是高尔基自传体三部曲中的第一部。2、它写的是高尔基幼年时期从三岁至十岁这段时间生活断面。3、
互联网 04-25 12:49:59
4月21日,省教育厅派出由青岛理工大学人事处(教师工作部)处长(部长)王雄任组长的高校教师队伍建设绩效评
山东工业职业学院 04-25 12:34:16
苏州银行(002966)于2023年4月25日发布年报,报告期内,公司实现营业收入117 63亿元,同比增长8 62%,实现
全景网 04-25 12:23:44
玩手机影响孩子心肺健康-近期,日本神户大学和国立健康与营养研究所的研究小组在国际《儿童》杂志发表的一
中国妇女报 04-25 12:09:58
豪尔赛主营照明工程业务,2022年豪尔赛营收为4 07亿元,同比下滑48 34%;归母净利润由盈转亏。2022年,阳光
阿拉丁照明网 04-25 12:01:57
西安石油大学2022年天津综合改革招生计划年份类别科类批次专业名称计划人数选考科目2022普通类综合改革本科
西安石油大学 04-25 12:11:19
在实际开发中,我们通常需要对API的返回结果进行过滤、排序和分页等操作。在DjangoRESTFramework中,我们可
腾讯云 04-25 12:03:44
迷你世界4月25日福利激活码已经更新了,但是还有很多的小伙伴还不知道迷你世界4月25日福利激活码是什么,于
游戏窝 04-25 12:00:16
为贯彻“四个最严”要求,压实压紧地方食品安全属地管理责任和企业食品安全主体责任的落实,近日,汕头...
汕头市场监管微信号 04-25 11:34:43
从大连大学获悉,大连大学2023年硕士研究生招生调剂公告已公布。点击查看:http: yjs dlu edu cn info 1023 2747 htm
大连大学 04-25 11:33:48
外交部:中国有关部门依据法律法规对美光进行网络安全审查是一种正常的监管措施
飞笛资讯 04-25 11:18:19
智通财经获悉,新特能源(01799)早盘跌超9%,截止发稿,跌9 79%,报19 62港元,成交额2 05亿港元。消息
智通财经 04-25 11:26:02
4月24日,法国科技品牌WIKO举办5G鸿蒙生态手机新品发布会,正式发布全新的5G手机系列Hi畅享及新品手机Hi畅
安兔兔 04-25 11:08:00
大型科技股中,阿里巴巴-SW跌2 01%,腾讯控股跌1 74%,京东集团-SW跌2 38%,小米集团-W跌2 11%,网易-S
金融界 04-25 11:13:20
400亿大市场!隆基、阳光、康明斯“亮剑”绿氢设备端!,氢是宇宙中分布最为广泛的物质,具有能量密度高...
国际能源网/氢能汇 04-25 10:55:53
广州:发挥政府等各方作用,举办家电“以旧换新”活动
广州市人民政府网 04-25 10:58:46
开播冲第一!这部悬疑剧热度超《灌篮高手》,年度王炸,仅12集,秦昊,范伟,王炸,伊能静,悬疑剧,灌篮高手,校
头号电影院 04-25 10:34:57
金晟富:4 25黄金震荡拉锯多空之争!日内黄金行情分析策略换资共勉:一直坚持写分析,也尽量写的通俗易懂
汇通财经 04-25 10:52:10
股指逻辑:周一,三大股指延续弱势,沪深两市成交额约1 08万亿元,北向资金净卖额约38亿元。IF2305合约收盘
华创期货 04-25 10:27:45
随着硬件技术的进步,单机数据库的容量和性能已达到了前所未有的高度。而分布式(TP)数据库在这种变革面前极
非法加冯 2023-04-26
通过对黄金小时图解析得知,昨日行情继续先涨后跌再上涨形成宽幅震荡走势,目前上方依然是受制于1,2,3号的
中金在线财经号 2023-04-26
中国石化新闻网讯4月21日,胜利东部探区传来好消息,多口探井应用全过程油层保护技术,见油率100%,平均
中国石化新闻网 2023-04-26
1、广角镜头是一种焦距短于标准镜头、视角大于标准镜头、焦距长于鱼眼镜头、视角小于鱼眼镜头的摄影镜。2、
互联网 2023-04-26
做好托育服务工作是实现“幼有所育”“幼有善育”的关键。国家卫生健康委副主任于学军25日在京表示,截...
新华社 2023-04-26
Copyright © 2015-2022 太平洋纤维网版权所有 备案号:豫ICP备2022016495号-17 联系邮箱:93 96 74 66 9@qq.com