为什么选择 Glue 数据质量自动监测功能?
如果没有适当的监督,数据湖可能会变成数据沼泽。设置数据质量检查既耗时又繁琐,而且容易出错。您必须手动创建数据质量规则并编写代码来监控数据管道,并在数据质量下降时提醒数据使用者。AWS Glue 数据质量自动监测功能将这些手动质量工作从几天减少到几小时。它会自动计算统计数据、推荐质量规则、进行监控并在检测到问题时提醒您。对于隐藏和难以发现的问题,Glue 数据质量自动监测功能将使用机器学习算法。将基于规则的方法和机器学习方法以及无服务器、可扩展和开放的解决方案结合使用所产生的强大力量,使您能够提供高质量的数据,从而自信地做出业务决策。