生活
本地特色
美食养生
求职招聘
特色小吃
家常菜
保健食品
农产品
饮料
蛋糕甜点
火锅
肉类海鲜
新闻
时光记忆
恋恋爱
母婴
测试
科技
电脑
手机
其他
编程
汽车
文化
读书
历史
心得
艺术
高考
跨境电商
跨境交流
跨境市场
跨境百科
跨境头条
玩
NBA
自驾游
徒步骑行
明星八卦
旅了个游
搞笑
游记攻略
美景分享
随手拍
城市风光
英语
英语家园
英语学习
每日一句
有声读物
汽车
搜索
快捷导航
登录
注册
ဆ
热搜词
活动
交友
discuz
本版
文章
帖子
用户
科技
+关注
+发表新主题
大数据测试之数据接入部分测试
[复制链接]
作者:
忆君柳下奕
|
时间: 2024-6-4 04:56:17
|
其他
|
0
80
忆君柳下奕
当前离线
积分
6108
窥视卡
雷达卡
忆君柳下奕
2036
主题
2036
帖子
6108
积分
研究生
研究生, 积分 6108, 距离下一级还需 892 积分
研究生, 积分 6108, 距离下一级还需 892 积分
积分
6108
发消息
发表于 2024-6-4 04:56:17
|
显示全部楼层
|
阅读模式
刚才我们讲了整个数据流程,我们把整个数据框架打平了之后,我们把整个流程切分了几个环节。首先我们一起来看一下数据接入这部分的测试。
数据接入:业务数据或者文件通过一定的技术手段复制到大数据系统的过程。
首先我们一起看一下数据抽取这部分,这部分测试我们主要关注四个维度。第一个是数据测试,数据测试主要关注数据总量和字段这两块。数据总量是否一致、数据是否存在重复、字段是否存在错位、格式是否一致。
元数据这一块主要是关注两个方面,一个是字段,另一个是建表语句。字段主要关注数量、类型和命名规范。建表语句主要关注注释、类型、存储位置和存储格式是否正确。第三个我们需要关注抽取任务,也就是整个调度任务的测试,首先第一块我们需要关注任务的运行时间,然后参数配置和接入的方式是否正确。最后一个导入测试主要是针对文件的,需要关注导入路径和文件的大小。
下面是从业务口抽取到大数据系统的例子,我们可以看到从MySQL中不同的表中,把所有的数据抽取到一张表里面,但是在业务库中这些表的数据结构都是一模一样的。
这是代码截图,大家可以看一下。
这里我们就引出了一个业务系统一个分表分库的概念:
分库分表是为了解决由于数据量过大而导致数据库性能降低的问题,将原来独立的数据库拆分成若干数据库组成 ,将数据大表拆分成若干数据表组成,使得单一数据库、单一数据表的数据量变小,从而达到提升数据库性能的目的。了解完数据接入这部分,后面的文章会带大家继续了解一下什么是数据转化和清洗,欢迎大家继续关注。
(本系列文章根据《优品软件培育计划》公益直播内容整理,关注微信公众号【道普云测】,回复关键字 【搜狐】,获取免费观看链接。)
来源:
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
返回列表
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
发表新帖
回复
楼主新帖
大数据测试之数据接入部分测试
pvsyst视频教程:带你1堂课入门PVsyst光伏设计
Joplin for Mac v3.0.6 开源免费的Mac笔记本工具 激活版
观感如同真哔哔小子:玩家用CRT显示器玩《辐射3》
Django 是一个高级 Python Web 框架1
24小时热门
更多>
快速回复
返回列表
返回顶部