MySQL数据分析怎么解决

技术MySQL数据分析怎么解决本篇内容主要讲解“MySQL数据分析怎么解决”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“MySQL数据分析怎么解决”吧!作为最为流行的开源数据

本文主要讲解如何解决MySQL数据分析。感兴趣的朋友不妨看看。本文介绍的方法简单、快速、实用。让边肖带你学习“如何解决MySQL数据分析”!

作为最受欢迎的开源数据库,MYSQL正成为越来越多企业的选择。MySQL数据库广泛应用于各种业务系统中。除了在线业务逻辑的读写,还会有一些额外的数据分析需求,比如BI报表、可视化大屏、大数据应用等等。但是由于MySQL架构等问题,在面对数据分析场景时,往往力不从心。

对于这种情况,业内有很多解决方案。这里有一个推荐mdash的新方法;面对低成本场景,湖泊数据分析是一个不错的选择。在推出正式内容之前,先简单介绍一下相对陌生的数据湖概念。

Lake是一个无服务器的交互式联邦查询服务。使用标准的SQL,您可以分析和集成来自对象存储(OSS)、数据库(PostgreSQL/MySQL)等的数据。)和NoSQL(表存储等)。).

01. 方案背景

需求场景1

MySQL数据库广泛应用于各种业务系统中。除了在线业务逻辑的读写,还会有一些额外的数据分析需求,比如BI报表、可视化大屏、大数据应用等等。随着业务的发展,单个MySQL数据库达到一定数据量后,直接使用MySQL进行数据分析的性能较差,会影响在线业务的读写性能。在这种情况下,有必要寻求一种新的数据分析方案。

需求场景2

MySQL中的数据需要和日志数据联合分析。在这种场景下,一些公司会使用开源的大数据系统(比如Hive、Hadoop、Spark等。)来构建数据仓库。这种方法虽然可以解决问题,但需要的人力和服务器等资源成本最高。如何低成本地将MySQL与其他系统的数据结合起来?

需求场景3

当MySQL中的数据量超过单机性能时,为了保证在线业务性能,DBA通常采用子数据库和子表的技术,将一个数据库中单个表的数据拆分为多个数据库中的多个表。因为一个逻辑表被拆分成多个表,所以此时分析数据会非常复杂。需要一种新的分析方法。

02. 案评估因素

在MySQL分析场景中,如果要解决以上三个场景问题,主要考虑哪些因素?如果有多个方案,我该如何选择?你可以参考以下关键因素。

1.成本因素

这里所说的成本是一个综合性的概念,不仅指经济成本,还包括时间、人力、风险成本等。用户在进行方案选择时,应考虑综合“性价比”。

2.能力因素

维度包括功能和性能两个方面。功能上,方案是否提供完整的分析能力和扩展能力。在性能方面,是否满足用户对时效性和并行性的要求,尤其是大规模。

3.可维护性

一个好的产品应该提供良好的可维护性。用户可以非常简洁地使用它。当有问题时,也可以很容易地检查和解决。

4.易用性

产品本身要有良好的可用性。用户只需要很低的门槛就可以使用数据分析服务。

03. 方案选择

MySQL数据分析场景的解决方案有很多,包括对MySQL只读实例的直接分析、自建开源数据仓库和数据湖建设方案。让我们仔细看看这些方案的优缺点。

基于MySQL只读实例分析

MySQL数据分析怎么解决

通过购买额外的服务器构建一个MySQL只读备用实例,然后基于只读实例进行数据分析。该方案的优点和缺点:

缺点:

功能不能满足场景2和场景3的需求。即使对于需求场景1,当数据量增加时(参考下面的TPC-H 10G SQL,需要时间),基于只读实例的分析性能也会非常差。

成本更高:额外只读实例的成本也更高。

优点:

方案简单,可以防止对线上业务的影响;良好的可用性和兼容性。

自建开源数据仓库

7/515695.png" alt="MySQL数据分析怎么解决">

使用开源大数据系统(如Hive,Hadoop,Spark等)搭建数据仓库,然后同步MySQL数据到数据仓库,再基于Spark或Hive进行数据分析。

缺点:

  •  易用性差:开源大数据系统使用门槛比较高,需要专门的大数据工程师来操作和运维;此外Sqoop同步不支持表结构变更,增加和删除列都会导致同步失败。

  •  成本最高:另外还需要额外购买服务器搭建系统,增加了硬件成本,这个方案整体成本最高。

优点:

  •  能解决需求场景一和二的问题,分析性能较好。

分析型数据库

使用开源或商用的分析型数据库,通过数据同步工具完成数据同步,再基于SQL进行数据分析。

缺点:

  •  可维护性差,需要专门运维人员。

  •  成本较高,需额外购买资源。

优点:

  •  满足海量规模的数据分析

数据湖构建方案

MySQL数据分析怎么解决

基于阿里云数据湖分析构建方案,它能完美的解决低成本分析MySQL数据的需求。

优点:

  •  方便易用:使用一键建仓可以很轻松把整个数据库同步到数据湖。

  •  分析能力强:数据湖分析(Data Lake Analytics)与MySQL体验完全相同,数据量增加对分析性能几乎没有影响。

  •  成本极低:不需要购买服务器,按查询量计费,无查询不收费;无维护成本。

  •  对源库影响:数据分析对在线业务无影响。

04.  数据湖构建方案评测数据及技术原理

接下来让我们详细看一下数据湖构建方案的评测数据和技术原理。

低成本高性能

  •  低成本

下面是成本的对比,额外购买一台高性能RDS(MySQL数据库)包月费用需2344元;以TPC-H 10G为例,如果每天执行一次TPC-H的22条SQL,使用DLA一个月的费用只需要26.64元,平均每天不到1元。只需1%的成本就能获取高性能的分析;此外DLA的列式存储消耗只需要3G,而原生Mysql的存储可能消耗约20G。

MySQL数据分析怎么解决

  •  高性能

数据湖构建把数据从源数据库同步后,使用列式+压缩的方式存储,以TPC-H 10G的数据为例,存储在MySQL将消耗大约20G存储,但使用列式+压缩方式存储只消耗约3G存储。

使用阿里云数据湖分析(DLA)分析,能以极低的成本获得高效的分析,再次以TPC-H 10G的数据为例,TPC-H的22条SQL在DLA执行耗时平均为5.5s,在MySQL中平均耗时为345.5s,且有4条SQL跑不出来。

下图TPC-H 10G 22条SQL在MySQL和DLA的耗时对比。

MySQL数据分析怎么解决

易用性

  •  支持丰富数据源

阿里云数据湖分析构建方案,支持丰富的数据源,包括自建的MySQL、SQLServer、PostgreSQL、Oracle、云数据库RDS、PolarDB、ADB等。与传统的数据仓库相比,它的设计目标是"简单",让用户通过简单的配置就能实现数据同步到DLA,真正实现"一键"建仓。

MySQL数据分析怎么解决

  •  自动同步保持数据一致

数据湖构建支持自动同步更新的数据,也能自动同步包括创建表,删除表,新增列、修改列、删除列等元数据操作。在分库分表的场景中,数据湖构建能把一张分布在多个数据库的逻辑表合并到一张表中,实现基于一张表做数据分析。此外数据湖构建支持同步的表数量无上限限制。

MySQL数据分析怎么解决

  •  增量构建

数据湖分析(DLA)团队正在研发数据湖增量构建以支持增量模式同步源库数据,能完全消除对源库产生的影响;并且能大大提升数据分析的时效性。增量构建将于近期发布上线,敬请期待。

  •  对源库影

基于数据湖分析查询对源库完全无影响;在数据湖从源库同步数据时,对源库的影响也保证在10%以内。下图是数据湖构建针对不同规格源数据库的CPU消耗:随着机器规格增大,连接数会自动增加,最终源库的平均CPU消耗都在10%以内。

MySQL数据分析怎么解决

为了尽量减低同步对源数据库的影响,数据湖构建做了大量的优化。包括:

  •  数据湖构建会自动根据源数据库的机器规格,动态调整连接数,能保证对源数据库的压力在10%以内。

  •  在并发同步一张表时,优先选择索引列做切分,通过索引快速定位一段数据范围,减小同步对源数据库的影响。

  •  数据湖构建默认选择业务低谷做数据同步,防止影响线上业务。

最终实现对源库的压力几乎可以忽略。如果用户希望加快同步速度,也可以手动增加连接数加快同步速度。

05.  阿里云数据湖实践

如果你希望试用数据湖分析构建MySQL低成本分析,只需要以下步骤即可开通试用。

1、登录Data Lake Analytics管理控制台。在页面左上角,选择DLA所在地域。(https://datalakeanalytics.console.aliyun.com)

2、在左侧导航栏单击解决方案。在解决方案页面,单击一键建仓中的进入向导。

3、根据页面提示,进行参数配置。

4、完成上述参数配置后,单击创建,就可以开始使用数据湖愉快的分析了。

到此,相信大家对“MySQL数据分析怎么解决”有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/133177.html

(0)

相关推荐

  • redis中的五种基本类型(redis的几种类型分别适用什么场景)

    技术redis层级结构是怎样的本篇内容主要讲解“redis层级结构是怎样的”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“redis层级结构是怎样的”吧!redis中保存数据时

    攻略 2021年12月23日
  • 怎么确认java项目能接收多少并发(栈和队列java用什么实现)

    技术Java队列数据结构的实现方法是什么这篇文章主要介绍“Java队列数据结构的实现方法是什么”,在日常操作中,相信很多人在Java队列数据结构的实现方法是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法

    攻略 2021年12月16日
  • 如何理解Oracle补丁体系及其迭代阶段

    技术如何理解Oracle补丁体系及其迭代阶段这篇文章主要介绍“如何理解Oracle补丁体系及其迭代阶段”,在日常操作中,相信很多人在如何理解Oracle补丁体系及其迭代阶段问题上存在疑惑,小编查阅了各式资料,整理出简单好

    攻略 2021年10月28日
  • 微信如何实名认证不绑定银行卡,微信没有银行卡怎么实名认证

    技术微信如何实名认证不绑定银行卡,微信没有银行卡怎么实名认证微信不绑定银行卡也可通过绑定身份证进行实名认证的微信如何实名认证不绑定银行卡,具体操作如下:1、打开手机微信,点击微信页面下方的“我”2、进入我的页面,点击“钱

    生活 2021年10月28日
  • 牛客网面试题

    技术牛客网面试题 牛客网面试题目录
    一、JAVA
    二、计算机网络
    三、操作系统
    四、项目
    五、数据库
    第六部分 框架
    第七部分 设计模式
    第八部分 数据结构和算法
    第九部分 Linux
    ########

    礼包 2021年12月20日
  • 零基础学java应该从哪里开始(java学什么方面比较好)

    技术零基础学Java要掌握哪些技能本篇内容介绍了“零基础学Java要掌握哪些技能”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有

    攻略 2021年12月22日