电商业务简介
电商业务流程
以用户的浏览足迹为例说明
用户点开电商首页开始浏览,通过分类查询或通过全文搜索寻找自己中意的商品 , 将商品添加到购物车后,对商品进行结算,这时候购物车的管理和商品订单信息的生成都会对业务数据库产生影响,会生成相应的订单数据和支付数据
订单正式生成之后,还会对订单进行跟踪处理,直到订单全部完成
电商的业务流程 : 用户前台浏览商品时的商品详情的管理,用户商品加入购物车进行支付时用户个人中心&支付服务的管理,用户支付完成后订单后台服务的管理
电商常识
SKU和SPU
SKU (Stock Keeping Unit )(库存量基本单位): 产品统一编号 , 每种产品均对应有唯一的SKU号 , 如 : 一台银色、128G内存的、支持联通网络的iPhoneX
SPU( Standard Product Unit ):是商品信息聚合的最小单位,是一组可复用、易检索的标准化信息集合 , 如 : iPhoneX手机
SPU : 一类商品
同一SPU的商品可以共用 :
平台属性和销售属性
平台属性 :
销售属性 :
电商业务数据
电商系统表结构
中心 :
- 订单表 :
- 用户表 : 用户的详细信息
- SKU商品表 : 商品的详细信息
- 活动表
- 优惠券表
延伸 :
- 优惠券领用表
- 支付流水表 : 该订单的支付详情
- 活动订单表
- 订单详情表 : 订单的商品数量
- 订单状态表
- 商品评论表
- 编码字典表退单表
- SPU商品表
电商业务表 :
后台管理系统 :
活动信息表(activity_info)
字段名 | 字段说明 | 类型 |
---|
id | 活动id | bigint(20) | activity_name | 活动名称 | varchar(200) | activity_type | 活动类型(1:满减,2:折扣) | varchar(10) | activity_desc | 活动描述 | varchar(2000) | start_time | 开始时间 | datetime(0) | end_time | 结束时间 | datetime(0) | create_time | 创建时间 | datetime(0) |
活动规则表(activity_rule)
字段名
字段名 | 字段说明 | 类型 |
---|
id | 编号 | int(11) | activity_id | 活动ID | int(11) | activity_type | 活动类型 | varchar(20) | condition_amount | 满减金额 | decimal(16, 2) | condition_num | 满减件数 | bigint(20) | benefit_amount | 优惠金额 | decimal(16, 2) | benefit_discount | 优惠折扣 | decimal(10, 2) | benefit_level | 优惠级别 | bigint(20) |
活动商品关联表(activity_sku)
字段名 | 字段说明 | 类型 |
---|
id | 编号 | bigint(20) | activity_id | 活动 id | bigint(20) | sku_id | sku_id | bigint(20) | create_time | 创建时间 | datetime(0) |
平台属性表(base_attr_info)
字段名 | 字段说明 | 类型 |
---|
id | 编号 | bigint(20) | attr_name | 属性名称 | varchar(100) | category_id | 分类id | bigint(20) | category_level | 分类层级 | int(11) |
平台属性值表(base_attr_value)
字段名 | 字段说明 | 类型 |
---|
id | 编号 | bigint(20) | value_name | 属性值名称 | varchar(100) | attr_id | 属性id | bigint(20) |
一级分类表(base_category1)
字段名 | 字段说明 | 类型 |
---|
id | 编号 | bigint(20) | name | 分类名称 | varchar(10) |
二级分类表(base_category2)
字段名 | 字段说明 | 类型 |
---|
id | 编号 | bigint(20) | name | 二级分类名称 | varchar(200) | category1_id | 一级分类编号 | bigint(20) |
三级分类表(base_category3)
字段名 | 字段说明 | 类型 |
---|
id | 编号 | bigint(20) | name | 三级分类名称 | varchar(200) | category2_id | 二级分类编号 | bigint(20) |
字典表(base_dic)
字段名 | 字段说明 | 类型 |
---|
dic_code | 编号 | varchar(10) | dic_name | 编码名称 | varchar(100) | parent_code | 父编号 | varchar(10) | create_time | 创建日期 | datetime(0) | operate_time | 修改日期 | datetime(0) |
省份表(base_province)
字段名 | 字段说明 | 类型 |
---|
id | id | bigint(20) | name | 省名称 | varchar(20) | region_id | 大区id | varchar(20) | area_code | 行政区位码 | varchar(20) | iso_code | 国际编码 | varchar(20) | iso_3166_2 | ISO3166编码 | varchar(20) |
地区表(base_region)
字段名 | 字段说明 | 类型 |
---|
id | 大区id | varchar(20) | region_name | 大区名称 | varchar(20) |
品牌表(base_trademark)
字段名 | 字段说明 | 类型 |
---|
id | 编号 | bigint(20) | tm_name | 属性值 | | logo_url | 品牌logo的图片路径 | varchar(20) |
购物车表(cart_info)
字段名 | 字段说明 |
---|
id | 编号 | user_id | 用户id | sku_id | skuid | cart_price | 放入购物车时价格 | sku_num | 数量 | img_url | 图片文件 | sku_name | sku名称 (冗余) | is_checked | | create_time | 创建时间 | operate_time | 修改时间 | is_ordered | 是否已经下单 | order_time | 下单时间 | source_type | 来源类型 | source_id | 来源编号 |
评价表(comment_info)
字段名 | 字段说明 |
---|
id | 编号 | user_id | 用户id | nick_name | 用户昵称 | head_img | | sku_id | skuid | spu_id | 商品id | order_id | 订单编号 | appraise | 评价 1 好评 2 中评 3 差评 | comment_txt | 评价内容 | create_time | 创建时间 | operate_time | 修改时间 |
优惠券信息表(coupon_info)
字段名 | 字段说明 |
---|
id | 购物券编号 | coupon_name | 购物券名称 | coupon_type | 购物券类型 1 现金券 2 折扣券 3 满减券 4 满件打折券 | condition_amount | 满额数(3) | condition_num | 满件数(4) | activity_id | 活动编号 | benefit_amount | 减金额(1 3) | benefit_discount | 折扣(2 4) | create_time | 创建时间 | range_type | 范围类型 1、商品(spuid) 2、品类(三级分类id) 3、品牌 | limit_num | 最多领用次数 | taken_count | 已领用次数 | start_time | 可以领取的开始日期 | end_time | 可以领取的结束日期 | operate_time | 修改时间 | expire_time | 过期时间 | range_desc | 范围描述 |
优惠券优惠范围表(coupon_range)
字段名 | 字段说明 |
---|
id | 购物券编号 | coupon_id | 优惠券id | range_type | 范围类型 1、商品(spuid) 2、品类(三级分类id) 3、品牌 | range_id | |
优惠券领用表(coupon_use)
字段名 | 字段说明 |
---|
id | 编号 | coupon_id | 购物券ID | user_id | 用户ID | order_id | 订单ID | coupon_status | 购物券状态(1:未使用 2:已使用) | get_time | 获取时间 | using_time | 使用时间 | used_time | 支付时间 | expire_time | 过期时间 |
收藏表(favor_info)
字段名 | 字段说明 |
---|
id | 编号 | user_id | 用户名称 | sku_id | skuid | spu_id | 商品id | is_cancel | 是否已取消 0 正常 1 已取消 | create_time | 创建时间 | cancel_time | 修改时间 |
订单明细表(order_detail)
字段名 | 字段说明 |
---|
id | 编号 | order_id | 订单编号 | sku_id | sku_id | sku_name | sku名称(冗余) | img_url | 图片名称(冗余) | order_price | 购买价格(下单时sku价格) | sku_num | 购买个数 | create_time | 创建时间 | source_type | 来源类型 | source_id | 来源编号 | split_total_amount | 分摊总金额 | split_activity_amount | 分摊活动减免金额 | split_coupon_amount | 分摊优惠券减免金额 |
订单明细活动关联表(order_detail_activity)
字段名 | 字段说明 |
---|
id | 编号 | order_id | 订单id | order_detail_id | 订单明细id | activity_id | 活动ID | activity_rule_id | 活动规则 | sku_id | skuID | create_time | 获取时间 |
订单明细优惠券关联表(order_detail_coupon)
字段名 | 字段说明 |
---|
id | 编号 | order_id | 订单id | order_detail_id | 订单明细id | coupon_id | 购物券ID | coupon_use_id | 购物券领用id | sku_id | skuID | create_time | 获取时间 |
订单表(order_info)
字段名 | 字段说明 |
---|
id | 编号 | consignee | 收货人 | consignee_tel | 收件人电话 | total_amount | 总金额 | order_status | 订单状态 | user_id | 用户id | payment_way | 付款方式 | delivery_address | 送货地址 | order_comment | 订单备注 | out_trade_no | 订单交易编号(第三方支付用) | trade_body | 订单描述(第三方支付用) | create_time | 创建时间 | operate_time | 操作时间 | expire_time | 失效时间 | process_status | 进度状态 | tracking_no | 物流单编号 | parent_order_id | 父订单编号 | img_url | 图片路径 | province_id | 地区 | activity_reduce_amount | 促销金额 | coupon_reduce_amount | 优惠券 | original_total_amount | 原价金额 | freight_fee | 运费 | freight_fee_reduce | 运费减免 | refundable_time | 可退款日期(签收后30天) |
退单表(order_refund_info)
字段名 | 字段说明 |
---|
id | 编号 | user_id | 用户id | order_id | 订单id | sku_id | skuid | refund_type | 退款类型 | refund_num | 退货件数 | refund_amount | 退款金额 | refund_reason_type | 原因类型 | refund_reason_txt | 原因内容 | refund_status | 退款状态(0:待审批 1:已退款) | create_time | 创建时间 |
订单状态流水表(order_status_log)
字段名 | 字段说明 |
---|
id | | order_id | | order_status | | operate_time | |
支付表(payment_info)
字段名 | 字段说明 |
---|
id | 编号 | out_trade_no | 对外业务编号 | order_id | 订单编号 | user_id | | payment_type | 支付类型(微信 支付宝) | trade_no | 交易编号 | total_amount | 支付金额 | subject | 交易内容 | payment_status | 支付状态 | create_time | 创建时间 | callback_time | 回调时间 | callback_content | 回调信息 |
退款表(refund_payment)
字段名 | 字段说明 |
---|
id | 编号 | out_trade_no | 对外业务编号 | order_id | 订单编号 | sku_id | | payment_type | 支付类型(微信 支付宝) | trade_no | 交易编号 | total_amount | 退款金额 | subject | 交易内容 | refund_status | 退款状态 | create_time | 创建时间 | callback_time | 回调时间 | callback_content | 回调信息 |
SKU平台属性值表(sku_attr_value)
字段名 | 字段说明 |
---|
id | 编号 | attr_id | 属性id(冗余) | value_id | 属性值id | sku_id | skuid | attr_name | 属性名称 | value_name | 属性值名称 |
SKU信息表(sku_info)
字段名 | 字段说明 |
---|
id | 库存id(itemID) | spu_id | 商品id | price | 价格 | sku_name | sku名称 | sku_desc | 商品规格描述 | weight | 重量 | tm_id | 品牌(冗余) | category3_id | 三级分类id(冗余) | sku_default_img | 默认显示图片(冗余) | is_sale | 是否销售(1:是 0:否) | create_time | 创建时间 |
SKU销售属性表(sku_sale_attr_value)
字段名 | 字段说明 |
---|
id | id | sku_id | 库存单元id | spu_id | spu_id(冗余) | sale_attr_value_id | 销售属性值id | sale_attr_id | | sale_attr_name | | sale_attr_value_name | |
SPU信息表(spu_info)
字段名 | 字段说明 |
---|
id | 商品id | spu_name | 商品名称 | description | 商品描述(后台简述) | category3_id | 三级分类id | tm_id | 品牌id |
SPU销售属性表(spu_sale_attr)
字段名 | 字段说明 |
---|
id | 编号(业务中无关联) | spu_id | 商品id | base_sale_attr_id | 销售属性id | sale_attr_name | 销售属性名称(冗余) |
SPU销售属性值表(spu_sale_attr_value)
字段名 | 字段说明 |
---|
id | 销售属性值编号 | spu_id | 商品id | base_sale_attr_id | 销售属性id | sale_attr_value_name | 销售属性值名称 | sale_attr_name | 销售属性名称(冗余) |
用户地址表(user_address)
字段名 | 字段说明 |
---|
id | 编号 | user_id | 用户id | province_id | 省份id | user_address | 用户地址 | consignee | 收件人 | phone_num | 联系方式 | is_default | 是否是默认 |
用户信息表(user_info)
字段名 | 字段说明 |
---|
id | 编号 | login_name | 用户名称 | nick_name | 用户昵称 | passwd | 用户密码 | name | 用户姓名 | phone_num | 手机号 | email | 邮箱 | head_img | 头像 | user_level | 用户级别 | birthday | 用户生日 | gender | 性别 M男,F女 | create_time | 创建时间 | operate_time | 修改时间 | status | 状态 |
模拟生成业务数据
MySQL安装
业务数据生成
在 cpucode101 的 /opt/module/db_log 文件夹
mkdir db_log/
把 gmall2020-mock-db-2021-11-14.jar 和 application.properties 上传到 cpucode101 的 /opt/module/db_log 路径上
根据需求修改 application.properties 相关配置
logging.level.root=info
spring.datasource.driver-class-name=com.mysql.jdbc.Driver
spring.datasource.url=jdbc:mysql://cpucode103:3306/gmall?useUnicode=true&characterEncoding=utf-8&useSSL=false&serverTimezone=GMT%2B8
spring.datasource.username=root
spring.datasource.password=123456
logging.pattern.console=%m%n
mybatis-plus.global-config.db-config.field-strategy=not_null
mybatis.mapperLocations=classpath:mapper/*.xml
mock.date=2020-06-14
mock.clear=1
mock.clear.user=1
mock.user.count=200
mock.user.male-rate=20
mock.user.update-rate:20
mock.favor.cancel-rate=10
mock.favor.count=100
mock.cart.user-rate=10
mock.cart.max-sku-count=8
mock.cart.max-sku-num=3
mock.cart.source-type-rate=60:20:10:10
mock.order.user-rate=30
mock.order.sku-rate=50
mock.order.join-activity=1
mock.order.use-coupon=1
mock.coupon.user-count=100
mock.payment.rate=70
mock.payment.payment-type=30:60:10
mock.comment.appraise-rate=30:10:10:50
mock.refund.reason-rate=30:10:20:5:15:5:5
logging.level.com.atguigu.gmall2020.mock.db.mapper=debug
生成 2020-06-14 日期数据:
java -jar gmall2020-mock-db-2021-11-14.jar
查看 gmall 数据库,观察是否有 2020-06-14 的数据出现
业务数据梳理工具
业务数据采集模块
业务数据同步概述
数据同步策略概述
每日定时从业务数据库中抽取数据,传输到数据仓库中,之后再对数据进行分析统计
为保证统计结果的正确性,需要保证数据仓库中的数据与业务数据库是同步,离线数仓的计算周期通常为天,所以数据同步周期为天 ( 每天同步一次 )
数据的同步策略 :
全量同步 : 每天都将业务数据库中的全部数据同步一份到数据仓库,保证两侧数据同步的最简单的方式
增量同步 : 每天只将业务数据中的新增及变化数据同步到数据仓库。采用每日增量同步的表 ( 首日一次全量同步 )
数据同步策略选择
两种策略对比 :
同步策略 | 优点 | 缺点 |
---|
全量同步 | 逻辑简单 | 在某些情况下效率较低。例如某张表数据量较大,但是每天数据的变化比例很低,若对其采用每日全量同步,则会重复同步和存储大量相同的数据。 | 增量同步 | 效率高,无需同步和存储重复数据 | 逻辑复杂,需要将每日的新增及变化数据同原来的数据进行整合,才能使用 |
结论:业务表数据量大,且每天数据变化低 ( 增量同步 ) ,否则 全量同步
各表同步策略:
数据同步工具概述
数据同步工具 :
- 离线、批量同步 : 基于Select查询 , DataX、Sqoop
- 实时流式同步 : 基于数据库数据变更日志 , Maxwell、Canal
增量同步方案 | DataX/Sqoop | Maxwell/Canal |
---|
对数据库的要求 | 数据表中存在create_time、update_time等字段,然后根据这些字段获取变更数据 | 要求数据库记录变更操作,如 : MySQL开启 binlog | 数据的中间状态 | 获取最后一个状态,中间状态无法获取 | 获取变更数据的所有中间状态 |
全量同步 : DataX
增量同步 : Maxwell
数据同步工具部署
DataX
Maxwell
全量表数据同步
数据通道
全量表数据由DataX从MySQL业务数据库直接同步到HDFS
DataX 配置文件
增量表数据同步
数仓环境准备
|