纽约时报揭露OpenAI、谷歌和Meta在AI训练中存在的不当行为
近日,据纽约时报报道,OpenAI、谷歌和Meta被指控在训练人工智能模型时存在不当行为。报告指出,OpenAI使用名为Whisper的语音识别工具从YouTube视频中转录音频,由于OpenAI员工曾讨论这一行为可能违反视频网站的规则,所以涉事行为备受争议。实际上,OpenAI的员工转录了超过100万小时的YouTube视频,并将这些转录用于训练GPT-4模型,更令人担忧的是这些视频的版权存在干扰。同时,据报道称,Meta曾考虑收购出版商Simon & Schuster,以获取长篇作品用于训练AI,还曾讨论从互联网收集受版权保护的数据,即使可能面临诉讼。谷歌也被指控转录YouTube视频以获取文本用于AI模型训练,纽约时报称这可能触犯了视频的版权。
图源备注:图片由AI生成,图片授权服务商Midjourney
纽约时报的报道引起了许多人对于AI公司训练数据的合法性和道德性的担忧,这些行为是否合法?答案很明确,如果这些数据的版权归相关权利人所有,那么这些公司的做法就是违法行为。然而,在AI一直以来的发展中,数据的获取和合法使用一直是一个大问题。数据的获得需要消耗大量的金钱和人力,因此,许多AI公司并不遵循版权规则,而是通过某些不太光彩的手段来获取数据,以降低成本,提高效率。
AI技术在不断发展,但是,AI技术在获得数据的过程中还面临着巨大的困境和争议。数据的获取涉及版权问题,而版权的归属又往往是不确定的。AI技术开发公司应该如何在遵守法律和规定的前提下完成对数据的收集和处理?这是一个AI公司不得不面对的重要问题。
关于AI公司如何获得数据的问题,除了法律问题,还有一个就是道德问题。AI技术的发展离不开数据的支持与推动,但不当的行为会可能会影响到他人的权益,给其带来不必要的损失。AI公司在训练数据时,应当尊重他人的版权,不得在未经授权的情况下随意转载,这是一种非常基本的道德要求。为了更好地发展AI技术,AI公司应该选择合法的和道德规范的数据获取方式,切勿以非法手段追求商业利益。
AI技术的发展是大势所趋,数据的获取和使用是AI技术发展中的重要环节。AI公司需要合理使用数据,这也是AI公司在如何遵守法律、规定、尊重他人权益等重要的前提下来推动AI技术发展的一部分。未来,人工智能技术的发展会越来越快,就如何在合法、合规范围内推动AI技术发展的问题上,AI公司需要认真思考并制定有针对性的计划和措施。
总之,纽约时报对OpenAI、谷歌、Meta等公司进行的调查和揭露引起了广泛的关注和讨论,这些问题提醒着我们,人工智能技术的发展需要在法律、规定和道德的框架下才能够更加可持续、稳健地前行。同时,我们也需要思考一个问题,就是如何在尊重他人版权的前提下获得AI数据,推进AI技术的发展。
感谢您的阅读,如果您有这方面的经验或考虑,欢迎在评论区留言和我们分享。
如果你觉得这篇文章有帮助,请点赞并关注我,我们下期再见!
谢谢!