每日AI资讯 - 今日AI资讯-12.13 - 《AI学习相关》

华科大发布AI大模型猴子">华科大发布AI大模型猴子
李飞飞团队、谷歌联合发布AI视频扩散模型W.A.L.T
Runway宣布开展通用世界模型研发">Runway宣布开展通用世界模型研发
传华为云大模型核心成员顾晓韬加入智谱AI">传华为云大模型核心成员顾晓韬加入智谱AI
海通证券发布“泛海言道”金融大模型">海通证券发布“泛海言道”金融大模型
零一万物再度澄清套壳争议
OpenAI首席科学家论文获NeurIPS时间检验奖
阿里云前首席安全科学家创业个人AI计算机">阿里云前首席安全科学家创业个人AI计算机
Mistral AI发布专家混合模型Mixtral 8x7B">Mistral AI发布专家混合模型Mixtral 8x7B
微软与美国劳联-产联合作，确保AI为工人服务">微软与美国劳联-产联合作，确保AI为工人服务

华科大发布AI大模型猴子

李飞飞团队、谷歌联合发布AI视频扩散模型W.A.L.T

Runway宣布开展通用世界模型研发

传华为云大模型核心成员顾晓韬加入智谱AI

海通证券发布“泛海言道”金融大模型

零一万物再度澄清套壳争议

OpenAI首席科学家论文获NeurIPS时间检验奖

阿里云前首席安全科学家创业个人AI计算机

Mistral AI发布专家混合模型Mixtral 8x7B

微软与美国劳联-产联合作，确保AI为工人服务

华科大发布AI大模型猴子

今日AI资讯-12.13 - 图1

华中科技大学软件学院发布了名为”Monkey”的多模态大模型，擅长图像描述和视觉问答。Monkey在18个数据集上的实验中表现出色，超越了微软的LLAVA、谷歌的PALM-E和阿里的Mplug-owl等知名模型。它在文本密集的问答任务中显示出显著优势，并在某些样本上超越了GPT-4V。Monkey具有出色的”看图说话”能力，能够感知图像细节，并能处理高达1344 x 896像素的图像，是其他模型能处理尺寸的6倍。该团队已将Monkey代码开源于GitHub。

开源地址：https://github.com/Yuliang-Liu/Monkey

李飞飞团队、谷歌联合发布AI视频扩散模型W.A.L.T

今日AI资讯-12.13 - 图2

李飞飞的斯坦福团队与谷歌联合发布了名为W.A.L.T的扩散模型，用于生成逼真的视频。该模型基于Transformer进行训练，支持文生视频、图生视频和3D摄像机运动。据介绍，该方法采用了两个关键的设计。首先是使用因果编码器，在统一的潜空间内联合压缩图像和视频，实现跨模态的训练和生成。其次是为了提高记忆和训练效率，采用了窗口注意力架构，针对空间和时空联合生成进行量身定制。最后，团队针对文本到视频的生成任务训练了一个级联模型，包括一个基本潜在视频扩散模型和两个视频超分辨率扩散模型。该模型能够以每秒8帧的速度生成分辨率为512*896的视频。

项目地址：walt-video-diffusion.github.io/ 论文地址：walt-video-diffusion.github.io/assets/W.A.L.T.pdf

https://twitter.com/agrimgupta92/status/1734253883076063426?s=20

Runway宣布开展通用世界模型研发

今日AI资讯-12.13 - 图3

Runway宣布，他们正在开展长期研究工作，目标是建立通用世界模型（General World Models），以表现和模拟与现实世界中一致的广泛互动。Runway的Gen-2视频生成系统是非常早期的通用世界模型，对物理和运动有一定的了解，但在处理复杂的摄像机或物体运动等问题上仍有困难。为了建立通用的世界模型，Runway正在进行几项公开的研究，包括生成环境地图，在环境中导航和交互，捕捉世界和世界中居民的动态，建立逼真的人类行为模型等。

https://research.runwayml.com/introducing-general-world-models

传华为云大模型核心成员顾晓韬加入智谱AI

华为云大模型团队的核心技术骨干顾晓韬最近离职，加入了智谱AI。据了解，顾晓韬在华为云主要从事自然语言处理（NLP）和大模型的研发工作，是盘古大模型的三位算法负责人之一。他负责预训练，而另外两位负责监督微调的史佳欣和负责强化学习的朱疆成。在本科期间，顾晓韬曾在清华大学知识工程实验室进行科研实习，师从智谱AI的创始人唐杰，从事数据挖掘和模型训练等相关研究。他参与了清华大学Aminer数据挖掘系统的开发，并获得了一项名为“基于人名的邮箱地址推荐方法及系统”的专利。而Aminer是由唐杰主导的，也是智谱AI起家的第一个业务领域。

https://mp.weixin.qq.com/s/RlifnOND10rB0wLhuY0wog

海通证券发布“泛海言道”金融大模型

今日AI资讯-12.13 - 图4

在第五届上海金融科技国际论坛智慧金融平行论坛上，海通证券正式发布了名为”泛海言道”的大模型。据介绍，”泛海言道”综合应用了前沿的大模型技术，成功应用于智能问答、智能研报、智能研发等业务场景。它可以结合互联网检索引擎，为外部客户和内部员工提供即时、高质量的问答服务；通过样例示范学习能力，深度解读和分析财报数据，生成研报初稿，为研究人员提供专业可靠的写作服务；它还可以嵌入开发环境，快速识别开发人员的代码需求，支持多种编程语言，自动生成高质量的程序，为开发人员提供高效的研发服务。

https://mp.weixin.qq.com/s/dCMokDrcWFwr7im3nbAakg

零一万物再度澄清套壳争议

今日AI资讯-12.13 - 图5

根据DoNews昨日的报道，零一万物公司内部经过几周的国际和国内法律研判，已确认其完全没有涉及套壳和抄袭，并做出了进一步的澄清。此前，曾向零一万物官方发邮件建议修改张量名称的Eric Hartford也在社交平台X上为其澄清，称零一万物“没有在任何事情上撒谎，他们从零开始使用自己创建的数据集训练Yi，对开源领域的贡献是值得赞扬的”。另外，据零一万物微信公众号昨日发文，其Yi-34B系列模型最近在斯坦福大学研发的大语言模型评测AlpacaEval Leaderboard中取得了94.08%的胜率，超过了Llama 2、Claude 2、ChatGPT等模型，成为世界范围内仅次于GPT-4英语能力的大语言模型，并且是经由Alpaca官方认证为数不多的开源模型。同时，在加州大学伯克利分校主导的LMSYS ORG排行榜中，Yi-34B-Chat以1102的Elo评分晋升为最新开源SOTA模型之一，性能表现追平GPT-3.5。

模型地址： https://huggingface.co/01-ai/ https://modelscope.cn/organization/01ai

https://mp.weixin.qq.com/s/iE1aH5ZfnPJGK5iJmG6CxQ

OpenAI首席科学家论文获NeurIPS时间检验奖

今日AI资讯-12.13 - 图6

NeurIPS公布了今年的获奖论文，包括时间检验奖、两篇杰出论文、两篇杰出论文亚军、两篇优秀数据集和基准论文。大部分论文都围绕大型语言模型展开。其中获得时间检验奖的是由谷歌团队在10年前发布的论文，作者包括现任OpenAI首席科学家Ilya Sutskever。该论文介绍了开创性的词嵌入技术word2vec，展示了从大量非结构化文本中学习的力量。这项技术促进了标志着自然语言处理新时代开始的进步，并被引用超过4万次。

论文地址：https://arxiv.org/pdf/1310.4546

https://twitter.com/NeurIPSConf/status/1734354905647734922?s=20

阿里云前首席安全科学家创业个人AI计算机

今日AI资讯-12.13 - 图7

杭州云麓知道科技有限公司企业名称变更为“杭州半个宇宙科技有限公司”。同时，公司的人员也发生了重大变动，法定代表人和大股东从张宏变更为吴翰清。根据官网显示，KMind（半个宇宙）公司是由前阿里巴巴研究员吴翰清（道哥）与两名联合创始人和13名创始团队成员于2023年创立的。该公司在12月份推出了名为“半个宇宙”的操作系统，为普通用户提供由kOS驱动的个人AI计算机，以帮助人们处理数据。KMind的使命是发明一种新型的个人AI计算机（PAIC，Personal AI Computer），打破当前互联网巨头的数据垄断，让数据为个人和小微企业创造价值，最终实现自由、开放、共享和平等的AI互联网。据悉，吴翰清曾担任阿里云首席安全科学家和云盾负责人，于今年5月离开阿里。当时有媒体报道称他将投身于AI短视频赛道创业。半个宇宙官网地址：https://kmind.cn https://www.qcc.com/firm/6c21fde4a9b55987407df0803dd3f1d3.html

Mistral AI发布专家混合模型Mixtral 8x7B

法国AI创企Mistral AI在其官网宣布正式发布了名为Mixtral 8x7B的模型。该模型是一个高质量稀疏专家混合模型（SMoE），具有开放权重。据介绍，Mixtral 8x7B在大多数基准测试中表现优于Llama 2 70B，并且推理速度快6倍。它的测评成绩与GPT-3.5相媲美甚至更好。Mixtral可以处理32k长度的上下文，支持英语、法语、意大利语、德语和西班牙语，并具备强大的代码生成能力。该模型总共拥有467亿参数，但每个令牌只使用了129亿参数，因此它的处理速度和成本与12.9B模型相当。 Mistral还开放了第一个平台服务的测试版。该平台提供了三个聊天端点，用于根据文本指令生成文本，并提供了一个嵌入端点。根据介绍，前两个端点（mistral-tiny和mistral-small）分别使用Mistral 7B和刚发布的Mixtral 8x7B；第三个端点（mistral-medium）使用性能更高的原型模型，目前正在测试部署环境中。平台地址：https://console.mistral.ai

微软与美国劳联-产联合作，确保AI为工人服务

今日AI资讯-12.13 - 图8

微软宣布与美国劳工联合会-产业工会联合会（AFL-CIO）就AI和劳动力达成合作协议。该协议旨在确保AI为美国工人服务，主要实现三个目标： 1、与工会领袖和工人分享有关AI技术趋势的深度信息； 2、将工人的观点和专业知识纳入AI技术的开发； 3、帮助制定支持一线工人技术技能和需求的公共政策。

https://www.prnewswire.com/news-releases/afl-cio-and-microsoft-announce-new-tech-labor-partnership-on-ai-and-the-future-of-the-workforce-302011444.html?tc=eml_cleartime