OpenAI推出GPT-4Turbo,重新夺回Chatbot Arena榜首位置
最近,OpenAI推出了更新的GPT-4Turbo版本,并给开发人员和付费ChatGPT订阅者提供了使用权限。据悉,这个新版本在多项方面都做了改进。
在上周四,更新版的GPT-4Turbo重新夺回了Large Model Systems Organization(LMSYS) Chatbot Arena的榜首位置。这是一个众包的开放平台,用户可以在其中评估大型语言模型(LLM)。
在Chatbot Arena中,用户可以与两个LLMs并排聊天并比较它们的回答,而不知道每个模型的身份。82个LLMs,包括市场上所有最受欢迎的LLMs,如Gemini Pro、Claude3系列LLMs和Mistral-Large-2402,被用于排名。截至最新的Chatbot Arena更新,更新版的GPT-4Turbo在整体、编码和英语类别中占据领先地位。
gpt-4-turbo-2024-04-09在编码、数学、逻辑推理和写作能力方面的改进,表现更高于一系列用于测试AI模型熟练程度的基准测试。
有两种方法来比较gpt-4-turbo-2024-04-09与其他LLMs的表现。首先,可以访问Chatbot Arena网站,点击“Arena(side-by-side)”选项,选择要比较的模型。其次,可以使用“Arena(battle)”选项将随机模型进行比较。
如果想要跳过测试,直接使用GPT-4Turbo在ChatGPT中,需要成为ChatGPT Plus订阅者。费用为每月20美元。
在大型语言模型领域,GPT-4Turbo的确是领跑者,它不断地更新和改进着自己的技术,加速了自己在行业中的发展。想要了解更多关于GPT-4Turbo的信息,可以访问OpenAI官网。如果您对本文有任何意见或建议,欢迎在评论区留言,感谢您的观看!
图源:Unsplash
推荐阅读:
感谢您的关注、点赞和分享!