数据正在迅速成为数字经济的货币,因此现在是研究我们的数据治理的好时机《如何像数据中心极客一样说话》系列。大数据的大规模增长为组织提供了新的机会,可以挖掘可操作的见解并创建货币化方法。例如,到2021年,insight -As- a - service市场预计将增长到33.1亿美元。我
然而,通常情况下,过度增长会导致过度关注,数据治理也不例外。企业和政府都越来越关注与数据相关的关键问题,例如:
- 我如何才能最好地利用和管理今天运行我的组织的数据?
- 我所拥有的信息质量如何?
- 如何确保正确的团体有权访问数据?
- 采取了何种数据保护措施?我如何验证和监控我的客户/公民数据是否安全?
- 我在哪里可以利用正确的工具和创新来在未来将我的数据货币化?是在公共云上还是其他地方?
让我们深入探讨这篇极客文章的主题,看看它是否能帮助我们理清思路。
数据治理
在谷歌上搜索“数据治理”一词可能会导致更多的困惑而不是清晰。每个组织似乎都有自己的定义——例如,一篇light on Data文章列出了10个不同的定义。2一些混乱可能源于这样一个事实,即它既是一个业务策略,又是一个组织如何管理其数据的it流程。数据是一种有价值的商业资产——类似于建筑物、员工或供应链。与这些其他业务资产一样,业务和IT策略和流程有助于确保数据符合法规、保持安全、高质量,并利用数据实现最大的业务利益。简而言之,数据治理是决定如何在业务操作中使用数据的策略和流程集,并反映在系统架构中。让我们来看看数据治理的一些元素:
数据采集:业务数据输入的第一个点,无论是手动输入、从传感器自动收集还是由工具摄取。像Apache Spark或Kafka这样的开源软件有助于跨分布式IT架构摄取数据。除了数据收集之外,此阶段的数据治理还侧重于数据清理和确保高数据质量。
数据质量:数据质量是指数据在特定上下文中符合其目的的程度——通常是在业务操作、决策制定和计划中的预期用途。数据质量取决于数据的准确性、完整性、相关性和最新程度。在分布式IT体系结构中,维护高数据质量的单一真实源可能具有挑战性,特别是当数据源的数量随着传感器和其他设备的增加而激增时。数据治理有助于确保各个系统之间数据质量的一致性,其过程可以解决数据冲突,并确保数据的完整和准确。
数据移动:将数据从一个地方(源)移动到另一个地方(目标),通常是通过加载、馈送、传输或存储。这通常是通过数据结构来完成的——一组跨内部部署和多云环境的各个端点管理数据的数据服务。
数据主权:数据主权通常与法规或数据隐私要求公司在收集数据的国家境内保存某些数据的法律。一个很好的例子是欧盟的《通用数据保护条例》(GDPR),该条例规定了如何使用或访问欧盟公民的数据。数据治理通过设置保护措施来管理谁可以访问数据以及数据被用于正确的目的,从而确保符合这些法规。在需要将数据移到国外进行处理或分析的情况下,数据屏蔽或数据标记化可以通过用虚假或修改的内容替换敏感数据来帮助确保合规性。
数据隐私vs数据保护:数据隐私是指管理个人数据使用的法规、法律或政策。数据隐私通常关注个人身份或其他敏感信息,如医疗保健或财务记录、联系信息或上网行为。数据保护或数据安全是用于执行政策和法规的工具、程序和技术的集合。这包括防止授权访问或滥用客户同意与公司共享的数据,3以及保护数字数据免受网络攻击数据泄露.
数据分析:数据分析是从原始数据集中提取见解的过程和科学,越来越多地借助实时自动化和人工智能。传统上,数据被转移到一个集中的数据仓库进行分析,但随着数据源和数据量的不断增加,这越来越多地转移到数字边缘。通过部署基于面向互连体系结构™(IOA™)最佳实践的IT体系结构,企业可以使用本地事件处理收集和聚合数据,以优化数据流流和数据处理优势分析.
数据货币化:随着数据和实时洞察的不断增长,领导者们更加关注如何将数据转化为商业价值。数据可以直接或间接地转化为新的产品或服务。例如,医疗服务可以基于可穿戴设备收集的数据来开发,或者杂货店可以根据客户冰箱中的内容来简化库存。这些新市场的核心问题是,公司如何以合规和可信的方式买卖数据(或算法)?
未来证明作为一种服务
关注未来的领导者不能忽视数据治理。在数字经济中,竞争优势来自于组织利用数据的能力。要想物有所值,就意味着要确保数据从第一次收集到货币化,都是高质量的、受保护的、符合法规的。
方法,了解如何更好地控制全局分布的数据188bet投注分布式安全的数字边缘剧本.
另外,要真正学习如何像数据中心的极客一样说话,看看这个系列的每一篇文章。(注意:欢迎疯狂阅读的极客!)