- 大模型3D可视化工作原理项目发布
- 首个无自然语言的大型视觉模型发布">首个无自然语言的大型视觉模型发布
- UC伯克利等发布多模态基础模型CoDi-2
- R-CNN作者离开Meta加入AI2
- AI智能决策公司悠桦林完成近亿元C+轮融资
- 谷歌发布无监督同声传译架构Translatotron 3
- 青海昆仑人工智能算力中心正式揭牌启动运营
- 微软Copilot结束公测全面上市">微软Copilot结束公测全面上市
- 恒山光量子算力平台公测上线">恒山光量子算力平台公测上线
- 研究发现向ChatGPT承诺小费,回复会更详细">研究发现向ChatGPT承诺小费,回复会更详细
- 谷歌Gemini推迟至明年1月发布">谷歌Gemini推迟至明年1月发布
大模型3D可视化工作原理项目发布
首个无自然语言的大型视觉模型发布
UC伯克利等发布多模态基础模型CoDi-2
R-CNN作者离开Meta加入AI2
AI智能决策公司悠桦林完成近亿元C+轮融资
谷歌发布无监督同声传译架构Translatotron 3
青海昆仑人工智能算力中心正式揭牌启动运营
微软Copilot结束公测全面上市
恒山光量子算力平台公测上线
研究发现向ChatGPT承诺小费,回复会更详细
谷歌Gemini推迟至明年1月发布
大模型3D可视化工作原理项目发布
开发者Brendan Bycroft在社交平台X上发布了他的大模型工作原理的3D可视化项目。该项目使用3D渲染展示了运行单个标记推理的所有步骤,并提供了步骤的演练指南和一些可交互的元素。通过可视化,可以展示计算发生的位置、复杂性以及张量和权重的相对大小。该项目演示了GPT-2、GPT-3和轻量级的NanoGPT等模型。
项目地址:https://bbycroft.net/llm首个无自然语言的大型视觉模型发布
UC伯克利等发布多模态基础模型CoDi-2
UC伯克利的博士Zineng Tang在社交平台X上发布了多模态大模型CoDi-2的论文。该模型可以在零/少样本的交互方式下生成任何模态(文本、视觉、音频),并且能够根据复杂的多模态交错上下文指令进行操作。为了训练CoDi-2,来自UC伯克利、微软Azure AI等机构的团队构建了一个大规模的生成数据集,涵盖了跨文本、视觉和音频的上下文多模态指令。CoDi-2展示了广泛的零样本图像生成能力,如推理、组合性、指令编辑、示例学习和主题驱动生成等。此外,CoDi-2还展示了音频生成的零镜头/少镜头能力,以及指令编辑和示例学习等复杂的提示。
论文地址: https://arxiv.org/pdf/2311.18775.pdf 项目地址: https://codi-2.github.iohttps://twitter.com/ZinengTang/status/1730658941414371820?s=20
R-CNN作者离开Meta加入AI2
AI2(艾伦AI研究所)的计算机视觉高级总监Ani Kembhavi在社交平台X上发文,宣布Ross Girschick将加入PRIOR团队。PRIOR是感知推理和交互研究的缩写,是AI2的一个计算机视觉研究团队,旨在推进计算机视觉领域,创建能够观察、探索、学习和推理世界的人工智能系统。Meta首席科学家杨立昆也在社交平台X上发文,表示Girschick离开对Meta基础AI研究所(FAIR)来说是一种损失,但他也为他感到高兴。他认为科研人员从工业实验室转向学术界或非营利组织是一种自然的职业过渡。Girschick因开发基于区域的卷积神经网络(R-CNN)的目标检测方法而闻名,并凭借“Mask R-CNN”在2017年的ICCV上获得了Marr奖。他的个人主页最近也进行了更新,宣布他将于2024年初加入AI2。
https://twitter.com/ylecun/status/1730713022195470541?s=20
AI智能决策公司悠桦林完成近亿元C+轮融资
AI智能决策公司悠桦林微信公众号今日发布文章称,悠桦林近日完成了近1亿元人民币的C+轮融资,由上汽恒旭领投。这轮融资将用于加强悠桦林在运筹优化领域的技术优势和招募顶级行业人才,持续完善算法、产品和服务体系,特别是在智能供应链计划和排程优化平台方面的创新和深化,加快智能化决策解决方案的商业化步伐。
https://mp.weixin.qq.com/s/_BjYRDQPWw783jBrVYaWlg
谷歌发布无监督同声传译架构Translatotron 3
谷歌在其官网上发布了无监督语音到语音翻译架构Translatotron 3,该架构只使用单语数据就可以学习语音到语音翻译任务。据介绍,该方法不需要对目标语言进行直接监督,这有助于保留源语音的语音附带特征(例如音调、情感等)。为了实现语音到语音的翻译,研究团队使用了反向翻译,这是一种无监督机器翻译(UMT)技术,使用源语言的合成翻译来进行翻译,而无需双语文本数据集。
论文地址:https://arxiv.org/abs/2305.17547
https://blog.research.google/2023/12/unsupervised-speech-to-speech.html
青海昆仑人工智能算力中心正式揭牌启动运营
https://mp.weixin.qq.com/s/my3AmRrhkFU_e25RXK_KqQ
微软Copilot结束公测全面上市
https://blogs.bing.com/search/december-2023/Microsoft-Copilot-is-now-generally-available
恒山光量子算力平台公测上线
研究发现向ChatGPT承诺小费,回复会更详细
https://twitter.com/ylecun/status/1730713022195470541?s=20
谷歌Gemini推迟至明年1月发布
https://www.theinformation.com/articles/google-postpones-big-ai-launch-as-openai-zooms-ahead