导读
在大数据中,需要处理的数据来自各个渠道。一个非常重要的渠道是存储在关系数据库中的数据。在企业中,业务数据存储在关系数据库(通常是MySQL)中。另外,在后续的学习中,你会需要学习Hive、SparkSQL、Flink SQL等内容,但这些内容的共同基础是SQL语法。因此,你应该学会如何使用MySQL来使用SQL语法,掌握基本的增、删、改、查询操作和多表查询操作,为后续课程学习打下坚实的基础。
此外,大数据的数据处理过程可能需要将处理后的数据导出以供其他业务场景使用。导出业务数据的最常见方法是导出到MySQL 数据库。因此,这部分课程要求您:让我们专心学习Go吧!
数据库(DataBase,DB):长期存储在计算机存储器中的、按照特定规则组织的、可供不同用户和应用程序共享的数据集合。
数据库管理系统(DBMS):用于集中管理和控制数据库以建立、使用、维护和保证数据库安全性和完整性的大型软件。数据库。用户通过数据库管理系统访问数据库中的数据。
数据库发展史
分层数据库阶段(1960年代)
分层数据库是数据库管理系统的早期形式。该数据库系统采用层次结构来组织数据,其中数据分层存储,每一层包含一组相关数据。这种数据库模型的缺点是数据之间的关系比较复杂,导致数据的查询和更新困难。网络数据库时期(1960年代-1970年代)
网络数据库模型是层次模型的细化。使用更灵活的数据结构,允许您将一个数据节点连接到多个其他节点。这种数据库模型的缺点是数据结构比较复杂,难以维护。关系数据库阶段(20世纪70年代至今)
关系数据库是当今使用最广泛的数据库类型。该数据库模型使用关系模型来组织和管理数据。数据以表格的形式展示,表格通过关系连接。关系数据库可以更好地处理数据之间的关系,并方便查询和更新操作。对象数据库阶段(20世纪80年代至今)
对象数据库是将面向对象技术应用于数据库管理系统的一种方法。向数据库引入对象的思想来封装数据和操作,增加数据抽象和可重用性。 NoSQL 数据库阶段(2000 年代至今)
NoSQL 数据库是非关系数据库,不使用关系模型来存储数据,而是使用其他数据模型,例如文档、键值对和图形。 NoSQL数据库具有高扩展性、高性能、高可用性等优点,适合大规模数据存储和处理场景。
SQL 和 NoSQL 型数据库的区别
数据存储结构不同:
SQL 数据库使用表格结构,其中数据以行和列的形式存储。
NoSQL 数据库使用各种数据结构,例如键值对、文档和图形。数据之间的关系不那么固定,更加灵活。数据查询方式不同如下:
SQL 数据库使用结构化查询语言(SQL),它为查询提供了极大的灵活性和复杂性。
NoSQL数据库使用自己的查询语言(例如MongoDB的查询语言)。查询方式比较简单,但不支持复杂查询。数据大小变化如下:
SQL数据库适合存储和管理从小到大的数据量,但当发生大量数据和高并发访问时,性能和可扩展性受到限制。
NoSQL数据库适合大规模数据和高并发访问,具有高扩展性和高性能的特点。不同的应用场景:
SQL数据库适合需要事务处理的应用场景,例如金融、电商等。
NoSQL数据库适合需要快速处理大量数据的应用场景,例如社交网络和大数据分析。
SQL 和 NoSQL 型数据库的分类
关系数据库(SQL) Oracle: 是Oracle 数据库产品Mysql:最初由瑞典公司MysqlAB 所有,于2009 年4 月20 日被Sun 收购。 SQLServer: Microsoft 的数据库产品Access: Microsoft 的数据库产品DB2: IBM 的数据库产品非关系数据库(nosql) HBase 是分布式、面向列的开源数据库MongoDB 是基于分布式文件存储的数据库Redis 是开源日志类型; - 用ANSI C 语言编写的值数据库。它支持联网,基于内存和持久化,使用图形数据模型来存储数据,数据以节点和关系存储的形式组织。这种存储方式非常适合处理复杂的数据关系
MySQL 数据库
mysql
MySQL是一个开源关系数据库管理系统,也是最流行的关系数据库之一。 MySQL由Oracle公司开发,支持多种操作系统和编程语言,包括Linux、Windows、Java和Python。 MySQL的主要特点是:
标准SQL语言支持:MySQL支持标准SQL语言,允许用户对数据进行增、删、改、查等操作。灵活的数据存储:MySQL支持多种数据类型,可以存储不同类型的数据,包括文本、数字、图像等。高可靠性和安全性:MySQL提供完善的安全机制支持数据备份和恢复,保证数据的可靠性和安全性。高性能:MySQL使用索引、缓存等各种优化技术来提高数据库性能和响应能力。易于集成和部署:MySQL支持多种编程语言和操作系统,轻松集成到各种应用程序中,并且易于部署和管理。
MySQL广泛应用于Web应用、电子商务、金融、医疗保健等各个领域。 MySQL 是开源、免费且易于使用的,使其成为许多开发人员和企业的首选数据库。 DB-Engines Ranking 根据受欢迎程度对数据库管理系统进行排名。该排名基于对搜索、Google 趋势、Stack Overflow 网站、LinkedIn、Twitter 和其他社交网络的突出程度的综合比较。该排名涵盖了全球388 个数据库系统,表明Mysql 仍然非常受欢迎。
MySQL 在大数据领域的作用
数据存储和管理:MySQL可以用作大数据系统的数据存储和管理工具。在大数据系统中,MySQL通常用于存储与业务相关的结构化数据,例如用户信息、订单信息、产品信息等。同时,MySQL还可以与Hadoop、Spark等其他大数据工具集成,进行数据存储和管理。数据清洗和处理:大数据系统通常需要对原始数据进行清洗和处理以供后续分析。 MySQL可以作为数据清洗和处理工具,允许您通过SQL语言对数据进行过滤、聚合、分组等操作,为后续的数据分析做好准备。数据分析和挖掘:MySQL可以作为数据分析和挖掘的工具,利用SQL语言和各种分析函数进行数据挖掘和分析。同时,还可以将MySQL与Tableau、PowerBI等其他数据分析工具集成,实现更复杂的数据分析和可视化。数据可视化和报告:MySQL可以作为数据可视化和报告工具,可以使用各种BI工具进行数据可视化和报告。 MySQL的数据存储和管理功能为BI工具提供了高质量的数据源,从而实现更准确、更有价值的数据分析和报告。综上所述,MySQL在大数据领域发挥着重要的作用,可以作为数据存储和管理、数据清洗和处理、数据分析和挖掘、数据可视化和报表等方面的工具,是一个强大的提供支持。对于大数据系统。
版权声明:本文转载于网络,版权归作者所有。如有侵权,请联系本站编辑删除。