欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
1、苹果WWDC放出深水炸弹 GPT-4o加持Siri 全家桶都上生成式AI
苹果在2024年的全球开发者大会WWDC上宣布了全线产品进入生成式AI时代,推出了全新个性化智能系统Apple Intelligence。更新核心是结合生成式AI模型和用户资料的智能服务,深度集成在iOS18、iPadOS18和macOS Sequoia中。Siri变革,具备更丰富语言理解能力和跨应用执行操作。系统集成ChatGPT提供图像和文档理解功能,新增写作工具和Image Playground等功能。
苹果宣布与谷歌的 Gemini 模型合作,开放第三方模型接入,为用户提供更多选择。Siri 将整合 ChatGPT,用户可在不离开 Siri 的情况下进行会话,并保持隐私控制。苹果更新开发工具包,首次接入 OpenAI 的 ChatGPT,同时发布一系列新特性和更新。
苹果在最新发布的iOS18 系统中,对短信功能进行了全面革新。用户不仅可以为短信内容添加下划线和删除线能应用一系列动态文字效果,让每一条信息都充满个性。
这篇文章介绍了腾讯混元团队联合中山大学、香港科技大学推出的全新图生视频模型"Follow-Your-Pose-v2",实现了多人视频动作生成、强泛化能力和正确处理人物遮挡等亮点。该模型在视频生成领域具有重要意义,应用前景广阔。
MotionFollower是一项创新技术,能够将一个视频中的运动复制到另一个视频中的人物上,保持人物外观不变。这项技术应用广泛,可用于电影制作、广告创作、游戏开发等领域。
Adobe宣布重新修订服务条款,澄清不会用客户作品进行AI训练,目的是赢回用户的信任。这一变化是在一周前的用户强烈抗议后宣布的。
OpenAI最新更新了ChatGPT的语音功能,允许用户与聊天机器人交互使用各种AI生成的声音和声音风格。新功能让用户指示AI聊天机器人使用任何语音实时做出响应,提升了互动性和可访问性。
上海交大和香港中文大学的研究团队推出了名为Bootstrap3D的新框架,通过结合微调的3D感知多模态大模型,能自动生成高质量多视角图片数据,显著提升3D生成模型的能力。框架的合成数据集已全面开源,供研究人员和开发者免费使用。该框架的关键特点包括数据构建Pipeline、文本提示生成、图像生成、多视图合成、质量筛选和描述重写等。研究团队还提出了训练timestep重安排(TTR)策略,优化去噪过程的不同阶段,解决多视图扩散模型训练中的问题。实验结果表明,使用TTR策略的多视图扩散模型在图像-文本对齐、图像质量和视图一致性方面表现优异,有效提升了多视图生成的效果。
谷歌研究院推出AGREE框架,旨在增强大型语言模型生成内容和引用的准确性。该框架通过检索相关段落来提高回答准确性,并为用户提供验证信息真实性的途径。核心技术包括训练阶段微调和测试时自适应。实验结果显示AGREE在提升内容回答准确性和引用性方面表现突出。
粉笔集团将于2024年8月推出自研AI智能老师,成为其线上平台提供的AI学习工具之一,首先应用于国家或省级招录类及资格证考试系统班。
如果对以上内容有任何疑问或想