IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 影像系统需求分析及架构概要 -> 正文阅读

[大数据]影像系统需求分析及架构概要

业务功能

  1. 文件上传
  2. 文件下载
  3. 文件列表查询
  4. 文件删除
  5. 文件关联

文件作为无业务的数据对象存储后有一个唯一的文件fileId,通过文件fileId能找到文件的数据;


业务角度并不关心fileId,业务只关心业务busiSeqNo,因此需要建立busiSeqNo和fileId的映射;


影像文件在生产业务中强关联用户信息或者其它一级业务信息,因此有必要把热点busiSeqNo和
fileId关联,比如用户uuid和fileId的关联,这样就可以通过uuid拿到用户的所有影像资料

fileId、busiSeqNo、uuid是影像文件的核心领域属性字段;

技术架构

一、文件信息

  1. fileId
  2. 文件存储路径
  3. 文件存储大小
  4. 文件业务分类类型
  5. 文件格式
  6. 文件是否加密
  7. 文件加密算法
  8. 文件其余存储引擎相关信息
  9. 创建时间
  10. 更新时间
  11. 文件主权系统

二、文件和业务信息的映射关系

文件fileId和busiSeqNo的映射关系存储;busiSeqNo和文件fileId呈正相关,虽然映射关系数据结构简单,但是存储量非常大;因此需要选一个大存储的组件;

  1. MySQL可以用sharding做分库分表
    1. 一致性hash环实现
    2. 分片累加:第一个分片慢了再存第二个分片,以此类推
    3. 分片键的选择及分片数设定
      1. 考虑是否迁移数据
      2. 考虑数据增长速度
      3. 考虑扩容?
      4. 缩容没考虑
  2. ES存储提升查询性能,可以存超大数量的信息
  3. HBbase这种K-V存储也适合,可以存超大数量的信息
  4. 其它

三、文件的存储引擎选择

  1. 常规的FTP服务
  2. 分布式文件存储系统 FastDFS
  3. 云SAS存储
  4. 对象存储系统
  5. ...............

根据系统业务容量,业务增长情况,成本预算、技术支持能力、项目时间KPI等综合考虑选择不同的存储引擎

四、数据权限管理

  1. 系统常规鉴权,鉴权通过后就可以直接查看文件,这种权限粒度比较粗
  2. 文件权限有效期保护,权限是有有效期的
  3. 业务维度做权限矩阵表
  4. 后台管理人员对数据权限的管理
  5. 删除权限界定,谁可以删除?
  6. 查看权限界定,谁可以查看

五、安全

  1. 文件加密存储
  2. 文件压缩存储
  3. 文件下载、上传的安全校验
    1. 比如暴力脱库下载如何防护
    2. 暴力上传打死IO如何防护
  4. 防止攻击
    1. 限流
    2. 熔断
    3. 身份识别?
  5. 只能内网调用?
  6. 防止数据丢失
  7. 数据备份

六、数据质量治理

  1. 数据的准确性:是否可以定时订正修复
  2. 数据的有效性:是否可以定时过滤掉无效数据
  3. 重复文件清除
  4. 类似文件筛选掉
  5. 数据归档

七、成本及性能问题

  1. 数据的存储空间成本考核
    1. 动态调整存储压缩算法,比如把非热点数据压缩,热点数据不压缩;
    2. 根据网络情况做分布式缓存,提高访问能力
  2. 数据的优先级存储
    1. 优先级高的存储高性能存储
    2. 优先级低的存储普通存储
  3. 怎么保证文件上传功能是数据一致性
  4. 批量上传和下载性能如何保障
  5. 大文件存储怎么解决?
  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-03-15 22:37:16  更:2022-03-15 22:38:05 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 8:56:43-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码