生成式人工智能可以创建新数据,这些数据可用于各种目的,例如生成文本、图像和音乐。但是,为了有效地使用生成式AI,企业必须充分了解与数据收集、清理、标记、安全性和治理相关的数据管理最佳实践:
- 数据采集。基于大量数据训练生成式 AI 模型。这些数据可以来自各种来源,例如内部系统、社交媒体、传感器和物联网设备。企业必须使用数据库、数据仓库和数据湖技术以易于访问和管理的方式收集和存储这些数据。在为生成 AI 收集数据时,必须考虑几个关键因素,包括所需的数据类型。例如,如果企业想要生成文本,则需要文本数据集。还要考虑数据集的大小和多样性。较大的数据集通常会产生更好的结果。多样化的数据集可以帮助防止生成式 AI 模型中的偏见。
- 数据清理。 用于训练生成式 AI 模型的数据必须干净且一致。这意味着必须纠正数据中的任何错误或不一致之处。企业可以使用数据清理工具来识别和纠正数据中的错误,以及数据可观测性工具。
- 数据标记。 企业必须标记数据,以便生成 AI 对其进行训练。这意味着使用正确的信息标记数据,例如数据类型、数据源和数据上下文。企业可以使用数据标记工具来标记数据。
- 数据安全。 生成式 AI 模型可以创建敏感数据,例如个人或财务数据。企业必须确保这些数据被安全存储,并且其访问仅限于授权用户。
- 数据治理。 企业需要数据治理框架来确保数据管理的一致性和安全性。该框架应包括收集、存储和使用数据的政策和程序。
这些是企业需要考虑的数据管理工具,以帮助企业尝试实施或嵌入生成式 AI。在TechTarget企业战略小组最近进行的一项研究中,参与者被问及其企业实施数据准备工具或服务最重要的预期结果是什么。30% 预计性能会提高,26% 预计数据洞察会提高,21% 预计数据驱动的最终用户满意度会提高,12% 预计风险会降低。
这些结果表明,企业需要构建弹性数据管理实践,以便从生成式 AI 实践中获得有效结果。企业可以使用生成式 AI 来创建新数据。这些数据有多种用途,包括客户服务改进、营销内容生成和新产品创建。
除了这些数据管理实践之外,企业在使用生成式 AI 时还应考虑以下道德考虑因素:
- 数据隐私。 生成式 AI 模型可以创建类似于真实数据的数据。保护用于训练生成式 AI 模型的数据的机密性至关重要。企业必须确保数据在用于训练生成式AI模型之前是匿名或假名化的。
- 数据偏差。如果在有偏见的数据上进行训练,生成 AI 模型可能会有偏差。使用多样化的数据集来训练生成 AI 模型非常重要。企业应该意识到其数据中可能存在偏见,并采取措施减轻偏见。
- 数据安全。 生成式 AI 模型可以创建敏感数据。保护这些数据的安全至关重要,因此企业必须使用加密和其他安全措施来保护它。
通过遵循这些数据管理实践和道德考虑,企业可以确保他们负责任和合乎道德地使用生成式AI。
在企业战略小组调查中,企业报告说,他们绝大多数都希望实施人工智能实践,包括生成人工智能,以创造竞争优势。当参与者被问及如何评估数据分析对组织决策或竞争优势的影响时,33%的人认为非常有影响,另有66%的人认为有影响。
企业想要开发生成式 AI 实践以及技术供应商将 AI 和生成式 AI 嵌入其产品的原因有很多。负责任的人工智能可以带来更具弹性的数据管理实践,能够有效地从任何来源提取和利用数据的价值。
这可以使决策者能够获得可信和受管控的数据,以业务的速度运营。生成式AI可以给企业带来很多好处,这包括运营效率、成本节约、更快的创新、竞争优势以及数据驱动的业务和消费者决策。但是,数据管理层必须正确设置才能到达那里。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
Java、JDBC和Postgres
现在越来越多的企业开始部署PostgreSQL,为什么呢?当你看到这个许可开源数据库所提供的功能,你就不会对此 […]
-
5个元数据管理最佳实践
在数据驱动的环境中,元数据不仅仅是数据的副产品;还是综合数据治理战略的关键组成部分。企业需要适当的元数据管理, […]
-
Cockroach Labs增加矢量搜索,更新定价选项
Cockroach Labs 近日推出矢量搜索功能,旨在使客户能够访问和操作非结构化数据,以训练生成式人工智能 […]
-
如何使用数据治理成熟度模型
如果没有强大的数据治理,数据就无法产生有价值的见解以及改善决策。数据治理成熟度模型可帮助企业评估当前的成就水平 […]