DeepMind“机器猫”自学成才,能操作多个机器人、不依赖人类监督 知名AI研究人员Jacob Devlin离开OpenAI重新回到谷歌 上海人工智能实验室、武汉大学和商汤科技的自动驾驶研究论文斩获CVPR 2023最佳论文奖 人工智能创意工作室Captions获得2500万美元B轮融资 Stability AI推出SDXL 0.9,开启图像生成新时代 谷歌云推出AI驱动的反洗钱产品AML AI OpenAI首席执行官支持欧盟AI监管 微软宣布重大突破!10 年内打造量子超级计算机,科技发展实现 10 倍速
清昴智能完成数千万元天使轮融资,致力于降低AI模型的使用门槛

DeepMind“机器猫”自学成才,能操作多个机器人、不依赖人类监督

今日AI资讯-06.25 - 图1

RoboCat:全球第一个可以解决和适应多种任务的机器人AI智能体

Google DeepMind最近宣布,他们开发了一款名为RoboCat的机器人AI智能体。这个神经网络模型可以在多个不同的真实世界机械臂上工作,并且学习新任务越多就越擅长解决额外的新任务。RoboCat使用Gato这种多模态模型来处理语言、图像和动作,在现实环境下训练数据集比传统基于视觉的方案要好得多,成功率高达74%。

三大突破

整体来看,RoboCat最主要的突破在三个方面:

  1. 可以快速操作新的机械臂,解决新的复杂任务;
  2. 学习新任务越多就越擅长学习和解决额外的新任务;
  3. 能够减少对人类监督训练需求。

多样化训练方式

通过100次左右演示,RoboCat就可以学会操控机械臂完成各式各样复杂而又不同类型的任务。此前从未见过并具有挑战性、难度更大甚至出现“干扰因素”的情形也被成功应对。RoboCat通过自生成的数据进行迭代改进,每项新任务的学习分为五个步骤:

  1. 收集100-1000个由研究人员控制的机械臂完成的新任务演示;
  2. 在新任务所使用的机械臂上微调(Fine-tune)RoboCat,创建一个专用衍生代理;
  3. 衍生代理在机械臂上练习10000次以生成更多训练数据;
  4. 将演示数据和自生成数据合并到RoboCat现有训练数据集中;
  5. 在新训练数据集上训练RoboCat的新版本。

重要意义

DeepMind认为,这种“通用性学习能力”是RoboCat最主要突破之一。此外,它还具备学得快、减少监督需求等优点。该技术将对于制造可以完成更多种类任务的通用机器人AI智能体发展起到重要推动作用。

论文地址:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/robocat-a-self-improving-robotic-agent/robocat-a-self-improving-foundation-agent-for-robotic-manipulation.pdf

https://zhidx.com/p/383108.html

知名AI研究人员Jacob Devlin离开OpenAI重新回到谷歌

今日AI资讯-06.25 - 图2

据报道,知名AI研究人员Jacob Devlin曾在谷歌内部反对训练其Bard AI聊天机器人的方式,并于去年1月跳槽到OpenAI。但是现在Devlin已经重新回到了谷歌原来的工作岗位。

在加入OpenAI之前,Devlin共同撰写了一篇关于机器学习模型训练方法的开创性论文,在其中提出的方法后来被包括ChatGPT在内的多个产品所采用。然而,在ChatGPT推出后不久,Devlin向谷歌高层提出了他对使用ChatGPT生成数据进行训练的反对意见。

具体而言,Devlin认为开发Bard所依赖的ShareGPT网站发布与ChatGPT对话有违规定条款。这些条款明确禁止使用“输出……开发与OpenAI竞争的模型”等信息。当他提出这个问题并离开之后,谷歌停止使用ChatGPT数据来训练Bard,并表示该聊天机器人中没有包含从ShareGPT获取的任何训练数据。虽然Jacob Devlin曾经离开谷歌加入OpenAI,这个事件也反映出人工智能领域中一些重要的技术、道德和法律问题正在得到广泛关注,并引起了业内专家和公众对于AI研究及应用的更多思考与探索。

https://finance.yahoo.com/news/top-ai-researcher-reportedly-left-190003999.html?guccounter=1&guce_referrer=aHR0cHM6Ly93d3cuZ29vZ2xlLmNvbS8&guce_referrer_sig=AQAAAHeUBXL9mprKYPkRQObazYcin3hVI7qL10L7ZA14nvutj-60D1gFjIjUQ1M4BHJ8TvbxQm1x6gvMN3-nqn97_SGz0IuMxsmxc65-LorkuFQD1VpEH11ADsSIibxcRme1POTSFxozUK-mqck-O1IbtapCgj5GL9ZgsEpRGqYkZz2x

上海人工智能实验室、武汉大学和商汤科技的自动驾驶研究论文斩获CVPR 2023最佳论文奖

今日AI资讯-06.25 - 图3

本届国际计算机视觉顶会CVPR 2023在加拿大温哥华举行,共收到9155篇论文投稿。经过评审,最终有2369篇被接收,并且上海人工智能实验室、武汉大学和商汤科技联合完成的一篇自动驾驶研究论文《Planning-oriented Autonomous Driving》荣获了本届CVPR最佳论文奖(Best Paper Award)。

这是CVPR历史上第一次以自动驾驶为主题的最佳论文。该研究首次提出了感知决策一体化的通用自动驾驶大模型UniAD,并将多个任务如检测、跟踪、建图、轨迹预测等整合到一个基于Transformer 的端到端网络框架下。这种新方法更加高效,同时也开创了以全局任务为目标的自动驾驶大模型架构先河。

此外,该文章还探讨了路径规划对于自主车辆性能优化方面所具有重要意义,并通过在不同场景下的实验验证了UniAD模型的有效性和优越性。并为未来的自动驾驶技术发展提供了新思路和新方法。

论文地址:https://tech.meituan.com/2023/06/16/cvpr-2023-meituan.html

人工智能创意工作室Captions获得2500万美元B轮融资

今日AI资讯-06.25 - 图4

总部位于纽约的人工智能创意工作室 Captions 在 B 轮融资中筹集了 2500 万美元。这笔投资由凯鹏华盈领投,其他投资方包括红杉资本、Andreessen Horowitz 和 SV Angel,共计4000万美元。

Captions 的首席执行官 Gaurav Misra 领导着一家利用人工智能进行内容创建过程的公司。该公司致力于培育一个多样化和包容性的在线社区,并推出适用于“谈话视频”的相机应用程序以满足不断增长的需求。基于 iOS 的订阅现已发展成为一个全面性平台,可处理字幕、编辑、配音、脚本创建和音乐集成等任务,从而简化整个流程。

该公司提供一系列功能来简化优质视频内容开发过程,其中 Al Dubbing 可将说话者声音无缝配音成另一种语言;AI Shorts 可自动从任何长视频中提取具有病毒传播价值的剪辑;Al Voiceover 基于文本生成与真实录制没有差别的画外音;AI 缩放自动合并相关缩放以保持视频的吸引力和吸引力;AI 眼神接触纠正拍摄对象的眼神接触,与观众建立更有吸引力的联系;AI 音乐可为每个视频量身定制音乐以提升整体制作价值;人工智能图像和表情符号自动插入相关图像和表情符号,增强视觉叙事和观众参与度。这笔融资将被用于扩大 Captions 的业务范围。

https://accesspath.com/tech/5852237/

https://www.captions.ai/

Stability AI推出SDXL 0.9,开启图像生成新时代

今日AI资讯-06.25 - 图5

Stability AI宣布推出最先进的开发套件Stable Diffusion文生图模型SDXL 0.9。这款消费级GPU可运行的模型在4月份beta版基础上进行了大幅改进,特别是在图像和构图细节上有很大提升。

SDXL 0.9是所有开源图像模型中参数数量最多的之一,包括一个35亿参数基础模型和66亿参数集成pipeline。其第二阶段模型用于向第一阶段输出添加更精细的细节,并可以通过ClipDrop访问。API即将发布,而预计7月中旬将会发布SDXL 1.0版本。

与测试版相比,在两个CLIP模型上运行(其中包括迄今为止训练过的最大OpenCLIP vitg /14),SDXL 0.9显著增强了处理能力和创建高分辨率逼真图像的能力。该团队还将很快发布一篇研究博客来详细介绍该模型规范和测试情况。这次更新标志着稳定性AI已经开启了一个全新时代,并为未来极具创造性地应用场景打下坚实基础。

https://zhidx.com/news/38087.html

https://stability.ai/

谷歌云推出AI驱动的反洗钱产品AML AI

今日AI资讯-06.25 - 图6

谷歌云近日宣布推出一款名为“Anti Money Laundering AI”的由AI驱动的反洗钱产品,简称“AML AI”。该工具利用机器学习技术帮助金融领域客户筛选和报告潜在的可疑活动。相比于其他竞品,AML AI采用了AI驱动的交易监控方法代替了传统手动定义、基于规则的方法,并且可以利用金融机构数据来训练高级机器学习模型,提供全面风险评分视图。

目前已有多家知名用户接入了这项服务,包括汇丰银行、巴西布拉德斯科银行以及丹麦数字银行Lunar等。据谷歌云表示,新技术帮助汇丰银行减少了60%警报数量并提高了警报准确性。此外,在消除超过60%误判率方面也取得显著成效。

谷歌云称AML AI有三点优势:甄别出可疑活动数量是竞品2至4倍;消除超过60%误判率;能生成解释并向分析师、风险经理和审计师提供建议。

然而,一些金融机构可能会对将控制权交给机器学习模型这一新型技术持怀疑态度。不过,谷歌云高管Zac Maufe称,“第三点优势”可以缓解这种担忧。每当AML AI标记某个客户时,它都会附带提供导致高风险评分的交易以及背景因素的信息。

汇丰银行高管、美国前反洗钱高级官员Jennifer Shasky Calvery表示:“当我们看到谷歌反洗钱AI能发现更多信息,并且噪音显着减少时……我们就开始问自己,为什么不应该使用它呢?”

https://m.cls.cn/detail/1384952

OpenAI首席执行官支持欧盟AI监管

今日AI资讯-06.25 - 图7

OpenAI首席执行官奥特曼表示,他支持欧盟在人工智能方面的做法,并补充说:“我真的很感谢欧洲的机构在这里,以及对这个问题如此认真对待的远见,对世界其他地区也是如此。”随着越来越强大的人工智能系统出现,全球合作变得前所未有地重要。据悉,在美国加州会议上,OpenAI、Meta公司和英伟达等公司与欧盟产业主管埃里·布雷顿进行了讨论。目前正在最后阶段进行协商。

据分析人士称,“水印”等措施可以有效减少非法使用或者恶意篡改数据集等行为。同时,在新技术快速发展时期内制定相关规范和政策将更有助于保护公共利益和社会安全。

今年以来,随着OpenAI旗下智能聊天工具ChatGPT的大火,国内外科技巨头频频在人工智能领域出手并加大布局力度。

http://mini.eastday.com/nsa/230625001901824838284.html

微软宣布重大突破!10 年内打造量子超级计算机,科技发展实现 10 倍速

今日AI资讯-06.25 - 图8

微软在量子计算领域取得了重要进展,并发布了微软量子超级计算机的路线图。他们计划在未来10年内完成量子超级计算机的构建。微软的目标是将未来250年的化学和材料科学进展压缩到未来25年。

微软的量子计算团队通过Azure Quantum项目加速科学发现。Azure Quantum Elements整合了高性能计算、人工智能和量子计算的最新突破,可以加速科学发现的过程。它可以缩短研发流程,加快创新产品上市的速度,扩大新材料的搜索空间,并加速化学模拟。Azure Quantum Elements还利用人工智能和高性能计算来解决量子化学问题,并为规模化量子计算做好准备。

Azure Quantum中的Copilot是一个辅助工具,帮助科学家使用自然语言推理复杂的化学和材料科学问题。它结合了云端超级计算、高级人工智能和量子技术,可以生成计算和模拟结果,查询和可视化数据,并提供复杂概念的指导性答案。Copilot还可以帮助人们了解量子计算并编写适用于当前量子计算机的代码。

微软还公布了通往量子超级计算机的路线图。量子超级计算机将解决经典计算机无法解决的问题,并具备高性能和可靠性。微软已经实现了通向量子超级计算机的第一个里程碑,即创造和控制马约拉纳准粒子。他们计划逐步实现可靠的逻辑量子位和规模化的量子超级计算机。

微软的目标是共同加速科学发现,帮助科学家和企业解决复杂的化学和材料科学问题,并推动人类的进步。他们将继续进行规划和减轻风险,同时注重量子安全,并与客户和行业合作伙伴合作支持这一领域的发展。

https://36kr.com/p/2312286582894089

清昴智能完成数千万元天使轮融资,致力于降低AI模型的使用门槛

今日AI资讯-06.25 - 图9

清华计算机系出身的创始团队成立了推理部署解决方案提供商「清昴智能」。该公司日前宣布已完成数千万元的天使轮融资,由绿洲资本独家领投,用于算法研发、产品开发和团队扩充。据知情人士透露,在成立之初,清昴智能还完成了来自奇绩创坛的种子轮融资。

关超宇是该公司的创始人之一,并曾获得过清华大学研究生特奖,在边缘计算和模型自动压缩方向有十余年积累。他表示,当前业内有多种方式解决大模型资源消耗高、落地难等问题。比如从软件工程角度可从资源调度层提升集群效率;从算法优化角度,可通过模型压缩等手段降低大模型复杂度;又比如在硬件设计或选型角度,企业可选择对于目标模型性价比更高的机器进行推理,或者设计更适配模型的硬件或模组等方式。清昴智能的使命是降低包括基础模型在内的AI使用和落地成本,通过针对模型的推理和部署环节进行优化来降低AI模型的使用门槛,目标是让AI能够运行在任何设备上。

当前,清昴智能已经推出了针对AI模型的推理优化工具链MLGuider,并致力于成为适配任何硬件环境的优化与推理引擎。据关超宇介绍,在与客户合作中,MLGuider已被验证可让大语言模型在AMD MI200系列产品上,实现对标Nvidia A100的性能。此外,该公司还将基于MLGuider推出围绕基础模型的LLMOps平台。

投资方绿洲资本表示,“清昴团队所积累的推理部署底层技术能够大幅降低模型落地门槛和成本”,期待他们不断打破技术边界助力行业加速发展;而奇迹创坛则认为该公司表现出极高执行和迭代能力,并希望其最大程度解放大模型生产力。