演讲高朋简介:赵殿奎,阿里巴巴高等数据库专家,从事OLTP数据库和OLAP数据库产品的研发事情10余年,现为阿里云PolarDB数据库内核北京研发卖力人。
以下内容根据演讲视频以及PPT整理而成。
本次分享紧张环绕以下四个方面:一、PolarDB架构二、PolarDB兼容性三、PolarDB增强四、PolarDB迁移
一、PolarDB架构PolarDB架构组件 —— CM
PolarDB架构是基于共享存储的架构,下图是PolarDB整体架构视图,个中CM紧张卖力的事情包括全体Polar集群的管理,Top管理,高层管理、备份管理及审计管理。CM是一个管控链路的核心组件,这意味着CM组件本身对付PolarDB的全体数据的可用性没有任何影响,PolarDB的可用性完备独立于全体数据链路。由于PolarDB会面向大量的用户来利用,因此对全体架构的设计中须要把可用性放在第一位,因此每一个组件的设计也都要知足PolarDB高可用性哀求。
PolarDB架构组件 —— Agent下图中另一个比较主要的组件是Agent,Agent紧张做什么?很多常见数据库会将部分功能都集成到数据库内核里面。但PolarDB是将很多功能放在Agent中,例如审计、数据采集、监控、备份数据发送等等。相称于将一部分赞助性功能独立出来,做成一个核心的组件,同时放在数据管控链路里面。
别的的还有Proxy,是读写路由的组件。PFSD是阿里云的分布式文件系统。
PolarDB既可以运行在裸机上面,便是传统的物理机,还可以跑在国产的芯片,国产的操作系统,以及原生的 k8s上。此外阿里云基于 k8s做了很多的增强,PolarDB同样可以运行。这几种形态上PolarDB都是支持的。
二、PolarDB兼容性
下图列出了在阿里巴巴很多业务场景中,用户的用例中利用较多的功能上的兼容性,目前PolarDB的研发上也是在重点支持这些功能的兼容性。
PolarDB兼容性 —— 接口兼容
驱动接口中利用比较多的是OIC,JDBC以及ProC,基本上可以霸占99%以上。Java的是JDBC,但是可能很少碰到ProC,尤其在公共云上的用户可能比较少见。但线下的传统的客户中,如金融类的客户会大量的利用ProC进行开拓的业务程序。PolarDB基本上都可以兼容OCI里面的接口。ECPG里面包含Oracle的ProC代码的兼容。ECPG兼容最主要的并不是在于对ProC的支持,而在于C的代码的兼容。为什么?由于Oracle里面ProC所支持的各种C措辞的标准是无法获取到的。大量的SQL92,SQL2008的标准,以及目前还在一直的更新的标准都在增加对C代码语法的支持。PolarDB投入了很多人力做这件事情。XA C接口与ECPG中的Proc接口是结合起来利用的。目前很多PolarDB线下的客户大量利用了基于XA C、ProC、Oracle Tuxedo结合的办法。下图罗列了XA C接口的一些功能,目前PolarDB基本上都可以支持。个中最难的是tpsuspend,目前已经办理了。
PolarDB兼容性 —— 语法兼容性
语法的兼容性中包括数据类型、系统函数、伪列、PL/SQL、系统图以及系统包是比较常用的。但用户最常用的是空串,每一个利用Oracle数据库的业务运用都会用到这个特点,但是这个特点每每是很多的数据库产品并没有支持到的,导致这些数据库产品每每可能会在业务的运行的过程中涌现很多数据性的问题。到目前为止,Oracle里面的 PL/SQL,PolarDB大概已经接入了80%多。在Oracle全体的迁移的过程中,大量的业务对 PL/SQL的代码险些是一行都不须要变动。这意味着是PolarDB对付 Oracle PL/SQ的兼容性已经非常精准,可以知足大多数的业务场景。系统函数、视图和系统包,PolarDB大概可以支持30多个,这基本上足够了,下图中还列出来比较常用的伪列。
PolarDB兼容性 —— 功能兼容性
功能兼容性等分区非常常用。紧张的一些分区功能PolarDB都是支持的。对付大规模用户来说,较为常用的是多层次查询,大家可能以为层次查询支持起来比较大略,但后来创造这每每是用户非常关心的特性,因此对性能哀求非常高。很多数据库产品层次查询的实践方法基本同等,通过WITH语句的迭代,递归来实现,但这种方法的性能每每比较差。因此PolarDB在层次查询功能的实现上从算子层面做了大量的事情。表函数也是用户利用的特殊多的功能,类似于一个pipeline,一个表的输出作为另一个表的输入。用户在DBLINK功能上的利用特殊多。公有云产品和线下打通之后,创造反而在安全性的保障上难度难道非常大。线上和线下,公有云和稠浊云之间能够做到数据相互访问,最大的一个困难就在于安全。资源管理,Oracle里面有一个Resource Manager,PolarDB也在逐步的完善这个功能,PolarDB现在能够做到CPU和内存的隔离,同时可以做到数据库级别、乃至到用户级别的资源的隔离和限定。DBLINK方面,现在可以支持与Oracle DBLINK, 与PG的DBLINK,与阿里云 PolarDB DBLINK,以及公云上的PolarDB和PolarDB之间的DBLINK,可以支持线上的PolarDB与线下的Oracle之间的DBLINK。
PolarDB兼容性 —— 生态兼容性生态兼容性 —— AWR
2020年上半年阿里云花了很多人力在PolarDB生态兼容性上。目前公有云的性能监控已经可以做到秒级,为什么还须要做AWR?AWR实在相称于是两次状态之间的快照,用户可以查看中间的Workload是什么样子的。阿里云在拜访了很多的客户之后创造用户在进行大量业务迁移的时候,很多的运维同学和DBA同学对AWR需求非常强烈。由于线下用户对业务以及全体的迁移运行过程中稳定性哀求非常高,因此他们很少会开细粒度的监控。而且也不许可监控的数据能够对外展示。这时就须要利用AWR将两个韶光差之间负载数据拿到,根据整体负载情形判断系统的康健情形。如果客户的生产系统之前利用的是Oracle,那么也会在Oracle上跑AWR上,与PolarDB上的AWR进行比拟,剖析数据库性能在迁移之前和之后的差异。AWR中可以看到内存、CPU、IO的负载情形,乃至还有IO的吞吐、磁盘占用、IOPS、网络等资源数据。数据网络上来之后进行剖析,哪些负载较高,剖析负载高的缘故原由。基于负载情形剖析SQL状态,是否有慢查询,连接状态中是否有空载。目前大多数数据库性能数据都可以通过AWR展示出来。之后,基于AWR数据,比如慢查询,会给用户供应优化的建议。目前这部分功能还在迭代,通过全体运行的过程中所发生的事宜,展示到AWR,剖析是否有HA切换,或者涌现硬件故障,以及网络延迟。同时在AWR中展示硬件、主机的信息。
生态兼容 —— DataMax(ADG)
生态兼容DataMax类似于Oracle的ADG。这个功能已经在线下的大量的公共云上都发布完成。目前公有云的主备已经做得很好了,那PolarDB为什么还要做DataMax?而且是类似于Oracle的ADG?事实上PolarDB关注的Oracle的ADG中的Far Sync能力,它可以极大地降落对主库的读写负载。Far Sync可以首先将数据同步到 DataMax。因此可用性可以比原来的主备模式更高。DataMax这个节点变成了一个非常分外的节点,DataMax节点只有日志没有数据,而且日志只卖力转发。DataMax打算非常大略,只须要将日志进行解析,然后转发出去,因此可以做到更高的可用性,DataMax事情非常轻量,因此延迟较低,可以做到更高的RTO,同时又可以提高性能。DataMax可以同时挂很多Replication节点。可以创造,目前PolarDB很多事情一贯在环绕几件事情,一个是提高兼容性,第二个是可用性,提高PolarDB全体系统的可用性,使得RPO靠近零。
生态兼容 —— DTS(OGG)
DTS是数据同步工具,DTS支持数据数据全量迁移、数据增量同步、数据订阅SDK以及多种主流异构数据库,如MySQL,SQL Server、云上、云下、自建数据库。目前数据同步也支持双向的数据同步。用户生产系统同步的时候,并不是一次性同步过来的,而是一部分一次,一点一点同步。因此数据同步也是双向的,可以将一部分业务数据写到PolarDB,一部分业务写到Oracle。用户从Oracle数据同步到PolarDB,还有PolarDB的数据同步到Oracle上面,这类用户非常多。他们的数据同步可以通过DTS来完成。
生态兼容 —— DBS(RMAN)
DBS类似于Oracle RMAN,备份管理工具。DBS支持全量备份,增量备份,差异备份。基于DBS能力可以做到源端重删、本地缓存、存储驱动。DBS具备自己的指纹库,从而提升数据备份的安全性。备份的数据可以存到DBS支持的源端,包括NAS、磁带库,OSS。很多线下大b和大g的客户常常利用磁带库,这是在做大量的线下客户的支持的过程中创造的。
生态兼容 —— PolarPlus(SQLPlus)
PolarPlus与SQL Plus非常相似。感兴趣的同学可以参考PolarDB的官方文档。
生态兼容 —— 开拓工具(DBNavigator)
开拓工具紧张是通过DBNavigator做的。目前开拓工具用户利用的比较多,尤其是PG生态同学。当然还有很多其它的工具,但是DBNavigator好处在于集成了驱动之后,可以与DBMS_Debug的包连起来,支持 PL/SQL的Debug,利用起来非常方便。
上面总体上先容了PolarDB在兼容性方面做的事情,包括接口、语法、功能以及生态方面。尤其在生态兼容方面PolarDB做了支持数据库康健状态监控的AWR工具、DataMax数据节点、DTS数据同步工具、DBS备份管理工具、DBNavigator开拓工具等。那么在Oracle的兼容性之上,PolarDB还做了哪些增强?
三、PolarDB增强1. PolarDB增强 —— 性能优化CSN性能优化方面PolarDB做了CSN快照,对PG社区关注的比较多的话,会看到在2012年的时候,PG社区就提出要做CSN快照。什么是快照?PolarDB快照获取办法是比较分外。与MySQL相似,叫做XID快照,既获取当前系统的生动事务链表,加上XMIN、XMAX,布局成一个快照,判断哪些数据是可见的,哪些是不可见的。PolarDB CSN快照同理,CSN快照是在CSN上加了一个XMINXMAX。CSN快照可以供应更高的性能。在高并发情形下,生动事务特殊多,快照的动作非常慢,由于须要做内存拷贝。内存拷贝的动作有一个锁,这会造玉成部业务系统并发的冲突问题。通过测试创造,在没有利用CSN快照之前,大概最多到40万TPMC,再往上增加规格时,获取事务的表的冲突非常严重。通过CSN快照,目前在32c之上,一贯到128c,大概基本上可以做到线性。用户在公有云上在业务系统变革越来越大的情形下,可以通过升级用户业务的规格,为他们带来性能上的收益。
那么PG社区自从2012年提出来,到现在还没做出来,技能上难点在什么地方?其实在于CSN的设计非常繁芜,它涉及到事务、存储、日志等。但阿里大概花费了一年的韶光就做出来了,这是由于可以将CSN快照与差异快照结合起来,所有与生态干系、或影响生态的功能连续保留,那么最大的技能难点在于如何找到CSN快照与差异快照的映射关系。这是阿里做成CSN快照的紧张缘故原由。但之后再连续设计的时候还是会碰着很多的问题,如做成插件或者工具的话,插件或者工具的兼容问题如何办理,与生态的兼容性问题如何办理,备份规复如何处理?
PolarDB增强 —— DMA高可用
DMA高可用,既基于Raft三节点做的高可用的提升。Raft三节点可以做到RPO即是0,Follower副本只读,支持容器化支配,兼容主备高可用,CM一体化架构,同城三节点达到同城可能性。
PolarDB增强 —— Ganos
Ganos是一款包含管理,空间几何数据、时空轨迹、专题栅格、遥感影像的时空大数据引擎系统。系统内置了高效的时空索引算法、空间拓扑几何算法、遥感影像处理算法等。广泛运用于空间、时空、遥感大数据存储。Ganos系统在很多的实际场景中被投入利用,如高德舆图。
PolarDB增强 —— Performance Insight
大家在公有云上利用PolarDB的时候会创造性能指标非常完全,大量的性能指标通过图表的形式非常清晰的展示给用户,包括连接Connections、CPU利用率、内存利用率、IOPS负载等数据。目前这些性能数据在线上和线下,公有云和稠浊云上都是同步的。
四、PolarDB迁移PolarDB迁移 —— ADAM
数据库和运用迁移(Advanced Database & Application Migration, 以下简称ADAM)。目前PolarDB的迁移过程中,用户险些不须要修正代码,迁移的韶光越来越短的紧张的缘故原由是ADAM。ADAM是阿里云结合阿里巴巴多年内部业务系统数据库和运用异构迁移的履历,自主研发的、迁移Oracle数据库和运用上云的企业级迁云产品和解决方案,能帮助企业最大限度降落Oracle数据库和运用迁移上云的风险、技能难度和履行周期。ADAM可以做到线上,线下的用户直接支配到自己的用户端,通过对用户真个代码进行扫描,采集用户数据,剖析用户代码中Oracle的部分哪些是兼容的,哪些是不兼容的,剖析如何改进。ADAM还可以自动的对不兼容的代码进行改写,包括SQL翻译、数据库改造、运用改造、PL/SQL改写成JAVA。ADAM在用户迁移到PolarDB的过程中,采集了大量的用户的特色,当然用户已经授权了,剖析用户在迁移过程中哪些功能PolarDB不支持。通过近两年的不断的对Oracle功能的兼容性迭代,PolarDB基本已经支持调研的Top 100以内的功能。这使得大多数业务系统迁移到PolarDB越来越快,越来越方便。
PolarDB迁移周期
下图是用户业务系统从开始准备迁移,到末了迁移完成会经历的过程以及会利用到的PolarDB生态中的工具。最开始利用ADAM接入,在业务系统上运行,获取到兼容性指标、用户数据库中各项性能指标负载情形、评估技能可行性;然后在新的Polar上通过Benchmark做测试;知足用户性能哀求之后,通过DTS数据全量和增量迁移,完成双向的数据同步;再通过DMS&Console完成数据库的管理,包括备份、审计等;利用Performance Insight监控用户的在PolarDB上性能指标;随着用户业务量的增加,平滑的支持业务需求。全体过程可以确保客户业务真正做到平滑迁移。
作者:stromal
本文为阿里云原创内容,未经许可不得转载