- 华科大发布AI大模型猴子">华科大发布AI大模型猴子
- 李飞飞团队、谷歌联合发布AI视频扩散模型W.A.L.T
- Runway宣布开展通用世界模型研发">Runway宣布开展通用世界模型研发
- 传华为云大模型核心成员顾晓韬加入智谱AI">传华为云大模型核心成员顾晓韬加入智谱AI
- 海通证券发布“泛海言道”金融大模型">海通证券发布“泛海言道”金融大模型
- 零一万物再度澄清套壳争议
- OpenAI首席科学家论文获NeurIPS时间检验奖
- 阿里云前首席安全科学家创业个人AI计算机">阿里云前首席安全科学家创业个人AI计算机
- Mistral AI发布专家混合模型Mixtral 8x7B">Mistral AI发布专家混合模型Mixtral 8x7B
- 微软与美国劳联-产联合作,确保AI为工人服务">微软与美国劳联-产联合作,确保AI为工人服务
华科大发布AI大模型猴子
李飞飞团队、谷歌联合发布AI视频扩散模型W.A.L.T
Runway宣布开展通用世界模型研发
传华为云大模型核心成员顾晓韬加入智谱AI
海通证券发布“泛海言道”金融大模型
零一万物再度澄清套壳争议
OpenAI首席科学家论文获NeurIPS时间检验奖
阿里云前首席安全科学家创业个人AI计算机
Mistral AI发布专家混合模型Mixtral 8x7B
微软与美国劳联-产联合作,确保AI为工人服务
华科大发布AI大模型猴子
华中科技大学软件学院发布了名为”Monkey”的多模态大模型,擅长图像描述和视觉问答。Monkey在18个数据集上的实验中表现出色,超越了微软的LLAVA、谷歌的PALM-E和阿里的Mplug-owl等知名模型。它在文本密集的问答任务中显示出显著优势,并在某些样本上超越了GPT-4V。Monkey具有出色的”看图说话”能力,能够感知图像细节,并能处理高达1344 x 896像素的图像,是其他模型能处理尺寸的6倍。该团队已将Monkey代码开源于GitHub。
开源地址:https://github.com/Yuliang-Liu/Monkey
李飞飞团队、谷歌联合发布AI视频扩散模型W.A.L.T
李飞飞的斯坦福团队与谷歌联合发布了名为W.A.L.T的扩散模型,用于生成逼真的视频。该模型基于Transformer进行训练,支持文生视频、图生视频和3D摄像机运动。据介绍,该方法采用了两个关键的设计。首先是使用因果编码器,在统一的潜空间内联合压缩图像和视频,实现跨模态的训练和生成。其次是为了提高记忆和训练效率,采用了窗口注意力架构,针对空间和时空联合生成进行量身定制。最后,团队针对文本到视频的生成任务训练了一个级联模型,包括一个基本潜在视频扩散模型和两个视频超分辨率扩散模型。该模型能够以每秒8帧的速度生成分辨率为512*896的视频。
项目地址:walt-video-diffusion.github.io/ 论文地址:walt-video-diffusion.github.io/assets/W.A.L.T.pdfhttps://twitter.com/agrimgupta92/status/1734253883076063426?s=20
Runway宣布开展通用世界模型研发
Runway宣布,他们正在开展长期研究工作,目标是建立通用世界模型(General World Models),以表现和模拟与现实世界中一致的广泛互动。Runway的Gen-2视频生成系统是非常早期的通用世界模型,对物理和运动有一定的了解,但在处理复杂的摄像机或物体运动等问题上仍有困难。为了建立通用的世界模型,Runway正在进行几项公开的研究,包括生成环境地图,在环境中导航和交互,捕捉世界和世界中居民的动态,建立逼真的人类行为模型等。https://research.runwayml.com/introducing-general-world-models
传华为云大模型核心成员顾晓韬加入智谱AI
华为云大模型团队的核心技术骨干顾晓韬最近离职,加入了智谱AI。据了解,顾晓韬在华为云主要从事自然语言处理(NLP)和大模型的研发工作,是盘古大模型的三位算法负责人之一。他负责预训练,而另外两位负责监督微调的史佳欣和负责强化学习的朱疆成。在本科期间,顾晓韬曾在清华大学知识工程实验室进行科研实习,师从智谱AI的创始人唐杰,从事数据挖掘和模型训练等相关研究。他参与了清华大学Aminer数据挖掘系统的开发,并获得了一项名为“基于人名的邮箱地址推荐方法及系统”的专利。而Aminer是由唐杰主导的,也是智谱AI起家的第一个业务领域。https://mp.weixin.qq.com/s/RlifnOND10rB0wLhuY0wog
海通证券发布“泛海言道”金融大模型
在第五届上海金融科技国际论坛智慧金融平行论坛上,海通证券正式发布了名为”泛海言道”的大模型。据介绍,”泛海言道”综合应用了前沿的大模型技术,成功应用于智能问答、智能研报、智能研发等业务场景。它可以结合互联网检索引擎,为外部客户和内部员工提供即时、高质量的问答服务;通过样例示范学习能力,深度解读和分析财报数据,生成研报初稿,为研究人员提供专业可靠的写作服务;它还可以嵌入开发环境,快速识别开发人员的代码需求,支持多种编程语言,自动生成高质量的程序,为开发人员提供高效的研发服务。https://mp.weixin.qq.com/s/dCMokDrcWFwr7im3nbAakg
零一万物再度澄清套壳争议
根据DoNews昨日的报道,零一万物公司内部经过几周的国际和国内法律研判,已确认其完全没有涉及套壳和抄袭,并做出了进一步的澄清。此前,曾向零一万物官方发邮件建议修改张量名称的Eric Hartford也在社交平台X上为其澄清,称零一万物“没有在任何事情上撒谎,他们从零开始使用自己创建的数据集训练Yi,对开源领域的贡献是值得赞扬的”。另外,据零一万物微信公众号昨日发文,其Yi-34B系列模型最近在斯坦福大学研发的大语言模型评测AlpacaEval Leaderboard中取得了94.08%的胜率,超过了Llama 2、Claude 2、ChatGPT等模型,成为世界范围内仅次于GPT-4英语能力的大语言模型,并且是经由Alpaca官方认证为数不多的开源模型。同时,在加州大学伯克利分校主导的LMSYS ORG排行榜中,Yi-34B-Chat以1102的Elo评分晋升为最新开源SOTA模型之一,性能表现追平GPT-3.5。
模型地址: https://huggingface.co/01-ai/ https://modelscope.cn/organization/01aihttps://mp.weixin.qq.com/s/iE1aH5ZfnPJGK5iJmG6CxQ
OpenAI首席科学家论文获NeurIPS时间检验奖
NeurIPS公布了今年的获奖论文,包括时间检验奖、两篇杰出论文、两篇杰出论文亚军、两篇优秀数据集和基准论文。大部分论文都围绕大型语言模型展开。其中获得时间检验奖的是由谷歌团队在10年前发布的论文,作者包括现任OpenAI首席科学家Ilya Sutskever。该论文介绍了开创性的词嵌入技术word2vec,展示了从大量非结构化文本中学习的力量。这项技术促进了标志着自然语言处理新时代开始的进步,并被引用超过4万次。
论文地址:https://arxiv.org/pdf/1310.4546https://twitter.com/NeurIPSConf/status/1734354905647734922?s=20