网站公司引入数据的一致性
网站数据的一致性主要体现在三个方面:
网站公司推出的第一个就是不符合既定的一致性规则。
比如网站建设数据的整体和细分需要一致,所有商品的总销售额要等于网站的总销售额。如果有违反此类一致性规则的数据,需要检查部分指标的定义和计算规则是否统一,或者网站底层的数据模型设计、维度表的结构、与事实表的关联是否存在问题。
第二,两个数据源的描述不一致。
我们可以观察对所有省份字段唯一值排序的结果,这样类似的不一致描述就一目了然了。比如各省的细分数据,可能一个数据源记录的是“”,一个是“市”,那么两个数据源的数据合并在一起就会出现问题。还有一个就是网站建设的数据源之间的编码不一致。如果完全用两套代码,很难合并。但是,如果网站的一组产品代码使用P1001和P1002,另一组使用1001和1002 & # 8230;也就是第一组代码统一在数字前面加字母P,这样我们就可以统一合并了。保留或去除p是可行的。
第三,网站公司介绍有重复记录。
一般是因为重复录入数据。如果可以在数据库中使用primary key约束或unique约束来防止类似的情况,如果有重复记录,可以直接使用Excel中Data选项卡下的Delete Duplicates来删除重复记录,也可以统计重复记录的数量。例如,表中有100条记录,但经过重复数据删除后只有99条记录,因此必须有一条重复记录。还可以使用SQL语句删除重复的记录。
数据一致性主要指以上三项。在为网站设计数据库的时候,一定要注意一致性的原则。否则很可能会给后面的数据分析带来很多麻烦,耽误网站建设和制作的进程。
本文来自投稿,不代表重蔚自留地立场,如若转载,请注明出处https://www.cwhello.com/84235.html
如有侵犯您的合法权益请发邮件951076433@qq.com联系删除