- 智源研究院提出多模态统一预训练模型Emu">智源研究院提出多模态统一预训练模型Emu
- MIT开发实验科学家智能助手CRESt
- 商汤大模型团队提出的文生图大模型RAPHAEL">商汤大模型团队提出的文生图大模型RAPHAEL
- 谷歌人工智能聊天机器人Bard将进军欧洲和巴西市场">谷歌人工智能聊天机器人Bard将进军欧洲和巴西市场
- 中国首个AIGC管理办法正式公布-国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》">中国首个AIGC管理办法正式公布-国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》
- 中科创达和北京智源人工智能研究院成立“魔方未来联合实验室”共同推进大模型技术发展
- 京东推出源于产业的大模型:言犀,融合70%通用数据和30%数智供应链原生数据
- 谷歌发布人工智能笔记应用 NotebookLM:基于源文档私人专属 AI
- 谷歌医学AI登Nature 临床准确率超92%
智源研究院提出多模态统一预训练模型Emu
智源研究院推出全新的统一多模态预训练模型 Emu,实现了从多模态输入到输出的无缝衔接,是首个真正意义上的“全能预训练模型”。Emu在图像处理、文本生成、视频理解等多种任务上都有出色的表现,多项基准测试结果均超过了当前最先进的模型,展现出了超强的跨模态泛化能力。Emu大量采用了视频训练数据,采用创新性的统一多模态学习框架,相比其他模型拥有更丰富的世界知识。作为新一代多模态基础模型,Emu为各种视觉、语言等AI应用提供了统一的接口,预示着多模态AI进入新的发展阶段。
论文链接:
https://arxiv.org/pdf/2307.05222.pdf
模型链接:
https://github.com/baaivision/Emu
Demo链接:
https://new.qq.com/rain/a/20230713A07BVJ00
MIT开发实验科学家智能助手CRESt
MIT李巨教授团队利用ChatGPT开发了一个专为实验科学家打造的智能助手CRESt。CRESt可以进行语音交互,调用实验室机械臂进行自动化实验,主动查询资料进行实验设计优化。CRESt集成了主动学习算法,可以根据数据库内容主动为用户设计实验方案。用户可以通过语音指令启动实验,CRESt可以自主操作设备完成样品制备等实验步骤。CRESt可以与手机端保持连接,向用户发送实验进展更新。总体来说,CRESt使无编程经验的科研工作者也能利用自动化实验平台开展研究。它展示了语言模型在实验科学领域的应用潜力,也预示着语言模型将在科研各环节发挥更大作用。
论文地址:https://doi.org/10.26434/chemrxiv-2023-tnz1xhttps://new.qq.com/rain/a/20230713A03EIJ00
商汤大模型团队提出的文生图大模型RAPHAEL
商汤大模型团队提出的文生图大模型 RAPHAEL,它可以生成具有高度艺术风格或者摄影风格的图片,而且生成速度极快,并且在各项测试上击败了 Stable Diffusion XL,DALL-E 2,DeepFloyd 等模型。该研究还提供了在线试玩链接,同时设置了反馈按钮来帮助他们不断优化。RAPHAEL 使用了 Space-MoE, Time-MoE 以及 Edge-supervised learning 模块,其中 Space-MoE 找出了文本中每一个 token 在图片中对应的区域,用不同的 expert 来处理不同的区域,最后再融合;Time-MoE 模块使得模型能够在不同的 timestep 上选择不同的 expert。Edge-supervised learning 使用物体的轮廓纹理来监督 attention 模块的学习,帮助模型更好的学习到图片的结构信息。RAPHAEL 在 FID 上达到了 6.61 的分数,并且在图文匹配度以及生成质量上均超过了 Stable Diffusion XL,DeepFloyd,文心一格以及 DALL-E 2。
提供了将 RAPHAEL 作为基座的 artist v0.3.0 beta 模型的在线试玩链接,可以在https://miaohua.sensetime.com/zh-CN/ 中免费试玩 论文地址:
https://arxiv.org/pdf/2305.18295.pdf
https://www.163.com/dy/article/I9HM56O90511AQHO.html
谷歌人工智能聊天机器人Bard将进军欧洲和巴西市场
谷歌的人工智能聊天机器人Bard将进军欧洲和巴西市场,这也是该产品自今年2月推出以来的最大扩张。Bard和ChatGPT都是使用生成式人工智能进行对话和回答各种问题的程序,受到全球众多用户的关注。谷歌还为Bard添加了一些全球范围内的新功能,包括超过40种语言的支持,用户可以更改Bard回答的语气和风格,将对话固定或重命名,并在提示中使用图像。然而,在欧盟地区,Bard曾因当地隐私监管机构的问题而受阻,但谷歌已经与监管机构进行了会面以解决相关问题。Bard的工程副总裁表示,用户可以选择不收集他们的数据。谷歌最近在美国面临了一起新的集体诉讼,指控其滥用用户的个人信息来训练其人工智能系统。
https://cn.technode.com/post/2023-07-13/google-bard-entering-europe-brazil/
中国首个AIGC管理办法正式公布-国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》
《生成式人工智能服务管理暂行办法》已经发布,旨在促进生成式人工智能健康发展和规范应用,维护国家安全和社会公共利益,保护公民、法人和其他组织的合法权益。该办法提出了国家坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展,并对生成式人工智能服务实行包容审慎和分类分级监管。此外,该办法还规定了生成式人工智能服务规范,包括生成式人工智能服务提供者应当采取有效措施防范未成年人用户过度依赖或沉迷生成式人工智能服务,按照《互联网信息服务深度合成管理规定》对图片、视频等生成内容进行标识,发现违法内容应当及时采取处置措施等.
生成式人工智能服务管理暂行办法:
https://mp.weixin.qq.com/s/NlmvE_ujTL8HGxJ02lA24A
http://www.cac.gov.cn/2023-07/13/c_1690898326795531.htm
中科创达和北京智源人工智能研究院成立“魔方未来联合实验室”共同推进大模型技术发展
中科创达和北京智源人工智能研究院宣布共同成立“魔方未来联合实验室”,双方将在大模型开发与应用创新等方面进行战略合作,共同推进大模型技术创新与成果转化,促进人工智能技术在智能汽车、智能机器人、智慧工业、智能物联网等领域的应用落地。该实验室的成立将为创达魔方语言大模型的研发注入新的技术活力。此外,联合实验室还将依托北京市在人工智能领域的利好政策与良好的基础设施,充分发挥中科创达在产品、生态、应用场景的积累以及北京智源人工智能研究院的技术与人才优势,在通用型基础模型、专用型模型、合规安全可信数据集以及通用型机器人系统等方面进行研发探索,从而推进人工智能数据、技术、场景和人才的建设与发展。
https://news.mydrivers.com/1/922/922596.htm
京东推出源于产业的大模型:言犀,融合70%通用数据和30%数智供应链原生数据
2023京东全球科技探索者大会暨京东云峰会上推出的京东言犀大模型。这个大模型是源于产业的,融合了70%通用数据和30%数智供应链原生数据,具有更高产业属性、更强泛化能力、更多安全保障等优势。京东集团CEO许冉表示,大模型的价值在于在产业应用中实现,当产业效率和边界拓展得到提升时,大模型才有了更重要的实际价值和意义。京东言犀大模型的特点和优势包括:
- 源于产业,融合70%通用数据和30%数智供应链原生数据
- 具有更高产业属性、更强泛化能力、更多安全保障等优势
- 天然具备“产业基因”,可深入零售、物流、金融、健康、政务等产业场景,解决真实产业问题
- 能够保障客户在云上云下安全使用
- 具备行业泛化能力,可在不同行业场景中应用
- 京东具备深厚的产业数据积累和千行百业Know-How,成为京东布局大模型的核心优势。
http://www.news.cn/tech/20230713/66a18ae3819240af9a6e79281f2cf761/c.html
谷歌发布人工智能笔记应用 NotebookLM:基于源文档私人专属 AI
Google 推出了一款名为 Google NotebookLM 的实验性产品,这是他们第三款笔记应用,旨在利用语言模型的能力和潜力,结合您现有的内容,更快地获取重要见解。与传统的人工智能聊天机器人不同的是,NotebookLM 允许您将语言模型与您的笔记和来源相关联。Google 表示将经常与用户和社区进行交流,以使 NotebookLM 成为一个真正有用的产品。
注册等候名单:https://notebooklm.google.com/
https://www.ithome.com/0/705/539.htm
谷歌医学AI登Nature 临床准确率超92%
谷歌最近在学术刊物《自然》上发表了他们的医学大语言模型Med-PaLM。该模型可以回答医学问题,并且其准确率为92.6%,略低于医学专业人士92.9%的正确率。研究还发现,模型的反应中只有5.8%可能造成伤害,低于临床医生达到的6.5%。然而,《自然》指出,虽然这些结果很有希望,但是医学领域很复杂,还需要对模型进行进一步评估,特别是在安全性、公平性和偏见方面。据悉,谷歌于2022年末推出该模型,并在今年3月推出迭代版本Med-PaLM 2。最新版本已进入部分医院进行测试。
论文地址:https://www.nature.com/articles/s41586-023-06291-2