微信扫一扫,关注公众号

  • 科技行者

  • 算力行者

见证连接与计算的「力量」

首页 借数据迁移之机迈出数据治理第一步

借数据迁移之机迈出数据治理第一步

2014-03-28 10:38
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2014-03-28 10:38 CNET科技资讯网

作为任何企业进行新的应用部署或系统更新的重要组成部分,数据迁移可以完成的远不止简单的数据传输。我们完全可以把它当作改进现有数据质量的一个机会,而且还可以对信息应用采用更高标准,为公司增添力量。它也可作为数据治理计划的理想试点。

借数据迁移之机迈出数据治理第一步

数据治理是一个不断发展的学科。其目的是通过持续应用标准流程及方法,给予公司对数据质量和安全性的控制。

数据治理着眼于:提高数据质量、保护敏感数据、鼓励信息共享、提供关键业务数据、信息生命周期中的管理。

“许多数据迁移项目存在这样的问题:过于频繁地把遗留环境中的坏数据移动到全新系统中。”Informatica产品战略副总裁RobKarel说。“在您把数据迁移到新的应用系统之前,您必须先要询问哪些数据可以放入新的干净环境中。”

Karel主张将应用数据清理规则、统协重复数据以及清除孤立和未使用数据作为迈向数据治理标准的良好开端。

“因为对数据治理项目的支持或许可望而不可及,通常需要一套有用的具体步骤来开始。”Karel建议要像TDWI研究概括的那样,使用以下八个步骤,启动一个包含数据迁移的数据治理方案:

学习数据质量技术并加以应用。数据质量是一整套技术和实践,它能为企业数据迁移工作的成功做出巨大贡献。

及早并经常剖析数据质量。剖析数据质量奠定了企业为新系统制定数据质量、模型、架构及使用规则标准的基础。

在前进过程中创建业务词汇表。根据业务使用情况定义遗留或新系统中的数据。

使用数据质量度量标准。使用这些度量标准持续改进数据,并治理数据迁移前后的整个生命周期。

纠正不合规数据。使用有利工具,以允许运行时自动及手动数据迁移数据的一致性问题。

通过验证和确认治理实时数据。一旦新系统启动并运行,在持续基础上监测关键信息,以确保数据与数据治理政策及标准相容。

使用管理技术以调整数据治理和业务目标。数据管理非常重要,因为这一角色为业务和技术团队的沟通服务。

协作管理。跨职能团队决定迁移过程中哪些数据应该被治理以及如何治理,所有数据并非同等重要。

分享至
0赞

好文章,需要你的鼓励

推荐文章
  • 奖励设计:让AI学会智能使用工具的关键
    2025-04-23 17:39

    奖励设计:让AI学会智能使用工具的关键

    想象一下,你有一个非常聪明的朋友,他知道很多知识,但每当需要使用计算器、搜索引擎或查询最新天气时,却变得像个笨手笨脚的孩子。这正是当前大语言模型(简称LLMs,如ChatGPT这类AI系统)面临的尴尬处境。

  • ToolRL:奖励设计是工具学习所需的全部
    2025-04-23 17:34

    ToolRL:奖励设计是工具学习所需的全部

    想象一下,你拥有一个聪明的助手,它知道很多知识,但在面对需要使用计算器、搜索引擎或查询最新信息时却显得笨手笨脚。这正是当前大语言模型(LLMs)面临的困境。虽然这些模型已经通过监督微调(SFT)学会了使用工具的基本能力,但它们常常在面对复杂或不熟悉的场景时表现不佳。

  • X-Teaming:使用自适应多智能体进行多轮越狱攻击和防御
    2025-04-23 14:08

    X-Teaming:使用自适应多智能体进行多轮越狱攻击和防御

    想象你正在和一个智能助手聊天。如果你直接要求它提供有害信息,它很可能会礼貌拒绝。但如果你通过一系列看似无害的对话,逐步引导它走向你的真实目标呢?这就是当前AI安全领域面临的一个严峻挑战——多轮对话中的安全漏洞。

  • "思考操纵":用外部思考让大型推理模型更高效
    2025-04-22 16:43

    "思考操纵":用外部思考让大型推理模型更高效

    想象你在使用一个非常聪明的AI助手完成一项复杂任务,比如解决一道数学难题。你可能注意到这个助手会花很长时间"思考",一步一步写下大量推理过程,最后才给出答案。虽然这种详细的思考过程确实帮助AI做出了更准确的判断,但同时也带来了一个明显的问题:它太"啰嗦"了,消耗了大量的计算资源和时间。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-