[大数据] 【分布式数据库技术】相关知识概述

分布式数据库技术-基础知识概述

1. NoSQL数据库的类型有哪些？
2. 怎么判断一个数据库是否是NoSQL数据库？
3. NoSQL技术诞生的最初发点是为了解决什么问题？
4. 列族数据库存储结构？
5. NoSQL数据库有哪些不同类型并举例说明?
6. 文档数据库存储的基本元素是哪些？
7. Nosql事务处理的BASE特点指的是？
8. TRDB擅长解决哪些问题，NoSQL擅长解决问题？
9. CAP定理的三大特性？
10. MongoDB的特点是什么?
11. MongoDB由什么语言编写和实现的？
12. MongoDB数据库的命名规则？
13. MongoDB成为最好NoSQL数据库的原因是什么?
14. MongoDB运行必须需要大量RAM内存？
15. Redis的基本数据结构类型有哪些？Redis集群模式？
16. MongoDB的主要特征是什么？mongodb的分片集群的组成？
17. MongoDB配置文件采用什么格式？
18. MongoDB和Redis数据库有什么区别？
19. MongoDB中查看数据库和集合的命令？
20. 什么是“mongod”进程和“mongo”进程？
21. MongoDB中的基本命令？根据条件修改一条数据和多条数据的内容命令？
22. Redis的几个常见命令？Redis中常见字符串命令
23. Redis订阅命令？
24. Redis消息发布/订阅机制的原理是什么？主要命令有哪些？
25. 如何启动redis服务？
26. Redis 数据库对大小写敏感不？Redis选择不同的数据库使用什么命令？
27. 单机环境下什么是影响数据库读写速度的最大瓶颈？
28. 把数据从硬盘读写处理，改为内存处理，是属于什么类型的扩展？
29. NoSQL主要解决了大数据环境下的什么问题？
30. 进行大数据分析，NoSQL相对TRDB至少具有什么优势？
31. 键值数据库、文档数据库、列族数据库对值查找能力的比较？
32. Redis安装包如何使用？发布者和订阅者的消息订阅机制？
33. 大型网站应用时对于海量数据的解决方案有哪些？
34. 论述TRDB与NoSQL的技术特点区别？
35. 实例化一个mongo客户端,服务器地址：localhost(本地)，端口号：27017
36. 实例化一个mongo数据库, 创建并获取数据库中集合,在集合中插入一条文档。
37. 实例化一个mongo客户端,服务器IP地址，端口号：27017，实例化一个mongo数据库db, 创建集合,获取数据库中集合tt文档中具有n和a属性值，在集合tt中获取文档中的内容，打印输出每条文档中的键 “n”对应的值。
38. 使用 Java 代码在mongodb中完成文档的检索（查询）、更新与删除。
39. 创建集合t2将以下文档插入 db2 数据库的 t2 集合中；检索 t2 中的所有文档；更新 Xi 的信息为25岁；删除Xiao的信息。
40. HBase对于空（NULL）的列，占不占用存储空间？MapReduce的基本设计思想？
41. Spark 的四大组件？Spark的主要特点？
42. Spark是hadoop哪个组件的替代方案? Spark为什么比Mapreduce快？Hadoop和Spark能否部署在同一个集群？
43. Hadoop和Spark能不能同时部署？
44. Spark的几个主要概念：RDD、DAG、阶段、分区、窄依赖、宽依赖？
45. spark集群部署模式有哪几种？SparkContext的概念？Executor，Worker？Spark组成部件有哪些？
46. Spark的出现是为了解决Hadoop MapReduce的不足，试列举Hadoop MapReduce的几个缺陷，并说明Spark具备哪些优点。

1. NoSQL数据库的类型有哪些？

2. 怎么判断一个数据库是否是NoSQL数据库？

3. NoSQL技术诞生的最初发点是为了解决什么问题？

4. 列族数据库存储结构？

5. NoSQL数据库有哪些不同类型并举例说明?

6. 文档数据库存储的基本元素是哪些？

7. Nosql事务处理的BASE特点指的是？

8. TRDB擅长解决哪些问题，NoSQL擅长解决问题？

9. CAP定理的三大特性？

10. MongoDB的特点是什么?

11. MongoDB由什么语言编写和实现的？

12. MongoDB数据库的命名规则？

13. MongoDB成为最好NoSQL数据库的原因是什么?

14. MongoDB运行必须需要大量RAM内存？

15. Redis的基本数据结构类型有哪些？Redis集群模式？

16. MongoDB的主要特征是什么？mongodb的分片集群的组成？

MongoDB的主要特征是：MongoDB的提供了一个面向文档存储，操作起来比较简单和容易。

17. MongoDB配置文件采用什么格式？

18. MongoDB和Redis数据库有什么区别？

19. MongoDB中查看数据库和集合的命令？

20. 什么是“mongod”进程和“mongo”进程？

21. MongoDB中的基本命令？根据条件修改一条数据和多条数据的内容命令？

22. Redis的几个常见命令？Redis中常见字符串命令

23. Redis订阅命令？

24. Redis消息发布/订阅机制的原理是什么？主要命令有哪些？

发布原理：发布消息时现根据chanel找到对应订阅者链表，然后遍历发送消息。

订阅原理：Redis的底层结构中，Redi服务器结构体中定义了一个pubsub_channels字典，维护了频道和订阅者的对应关系，每次客户端添加订阅时将对应的客户端信息添加到链表的末尾

25. 如何启动redis服务？

26. Redis 数据库对大小写敏感不？Redis选择不同的数据库使用什么命令？

27. 单机环境下什么是影响数据库读写速度的最大瓶颈？

28. 把数据从硬盘读写处理，改为内存处理，是属于什么类型的扩展？

29. NoSQL主要解决了大数据环境下的什么问题？

30. 进行大数据分析，NoSQL相对TRDB至少具有什么优势？

31. 键值数据库、文档数据库、列族数据库对值查找能力的比较？

键值数据库对值查询功能较弱、文档数据库较强、列族数据库很强。

32. Redis安装包如何使用？发布者和订阅者的消息订阅机制？

发布者和订阅者不是直接传输消息的，是通过代理来传输的。

33. 大型网站应用时对于海量数据的解决方案有哪些？

34. 论述TRDB与NoSQL的技术特点区别？

NoSQL是弥补传统关系型数据库技术的不足而产生的新的数据库技术。

35. 实例化一个mongo客户端,服务器地址：localhost(本地)，端口号：27017

36. 实例化一个mongo数据库, 创建并获取数据库中集合,在集合中插入一条文档。

37. 实例化一个mongo客户端,服务器IP地址，端口号：27017，实例化一个mongo数据库db, 创建集合,获取数据库中集合tt文档中具有n和a属性值，在集合tt中获取文档中的内容，打印输出每条文档中的键 “n”对应的值。

38. 使用 Java 代码在mongodb中完成文档的检索（查询）、更新与删除。

使用驱动 com.mongodb.client.MongoCollection 类中的 find() 方法来获取集合中的所有文档。

你可以使用 com.mongodb.client.MongoCollection 类中的 updateMany() 方法来更新集合中的文档：

要删除集合中的第一个文档，首先你需要使用 com.mongodb.DBCollection 类中的 findOne() 方法来获取第一个文档，然后使用 remove() 方法删除。

39. 创建集合t2将以下文档插入 db2 数据库的 t2 集合中；检索 t2 中的所有文档；更新 Xi 的信息为25岁；删除Xiao的信息。

40. HBase对于空（NULL）的列，占不占用存储空间？MapReduce的基本设计思想？

41. Spark 的四大组件？Spark的主要特点？

42. Spark是hadoop哪个组件的替代方案? Spark为什么比Mapreduce快？Hadoop和Spark能否部署在同一个集群？

43. Hadoop和Spark能不能同时部署？

44. Spark的几个主要概念：RDD、DAG、阶段、分区、窄依赖、宽依赖？

45. spark集群部署模式有哪几种？SparkContext的概念？Executor，Worker？Spark组成部件有哪些？

模式：本地模式，standalone集群模式，spark on yarn集群模式，spark on mesos集群模式

46. Spark的出现是为了解决Hadoop MapReduce的不足，试列举Hadoop MapReduce的几个缺陷，并说明Spark具备哪些优点。

①Spark的计算模式也属于MapReduce,但不局限于Map和Reduce操作,还提供了多种数据集操作类型,编程模型比MapReduce更灵活;
②Spark提供了内存计算,中间结果直接存放内存中,带来更高的迭代运算效率;
③Spark基于DAG的任务调度执行机制,要优于MapReduce的迭代执行机制。