近年来,预训练的大型语言模型(LLM)如GPT-4和Gemini备受组织关注。这种机器学习技术可以建立比以往更为智能和自适应的系统,例如聊天机器人、副驾驶等应用。据麻省理工科技评论最新报告称,名为“C级领导人的AI准备情况”的调查发现,将人工智能(AI)或基于AI技术的GenAI扩展是82%受访高管的“首要任务”。
图片授权服务商:Midjourney,图片来源:Unsplash
据该调查发现,83%的组织已经确定了要用于AI或GenAI的数据来源。但是实际上如何准备好这些数据并连接上GenAI,仍然值得讨论。同时还需确保在这一过程中不会危及隐私或安全。
报告指出,平均来说,组织需要 “超过十几种不同的技术来收集关于其数据的所有智能信息,相同数量的技术来集成、转换和复制数据”,这带来了巨大的困难。组织需要面临各种挑战,包括数据治理和安全、数据集成和构建数据管道,以及数据质量等问题。数据目录和LLM投资的占比只有7%,表明组织需要投入更多精力来解决数据基础问题。
调查发现,虽然64%的调查对象表示数据集成工具和ETL/管道工具是其前两个GenAI投资重点之一,但是35%的人将数据湖视为优先事项,而31%的人将数据转换工具视为优先事项。可以看出,组织在构建数据基础时面临着许多挑战。
调查还发现,组织在数据治理、合规和报告方面存在诸多挑战。大量调查对象指出,准备数据供AI使用的 “最大”挑战是数据治理和安全(44%的受访者提到),以及数据集成或管道(45%的受访者提到)。然而,在实际数据中,不同行业的科技高管对安全和治理的担忧并没有同样的比例,特别是在制造业和零售业等领域。
数据安全和治理的问题是不容忽视的。组织可能无法控制某人在业务应用程序中使用数据并将其发送给生成式AI模型。这些都是非常重要的问题。所以,组织在构建数据基础时需要考虑到这些方面。
在将AI技术应用到生产环境中之前,组织需要充分掌握数据的来源及准备问题,以及数据湖和数据转换工具的优缺点。同时,组织还需要确保数据治理和安全的问题得到更好的解决。基于坚实的数据基础,GenAI 才可以在未来的应用中持续发挥其最大的潜力。最后,如果您有任何相关的问题或建议,请在评论区与我们分享!
感谢您的观看!请关注我们的博客以获取更多有关人工智能和搜索引擎优化(SEO)的信息。同时,也请点赞、分享和留言,您的一切支持和鼓励,都是我们不断前进的动力。