《出版业生成式人工智能技术应用指南》
智源FlagEval 12月榜发布,新增鲁棒性评测
摩尔线程:首个千卡智算中心落地
CMU称:Gemini Pro不如GPT-3.5 Turbo
轻松集团:自研大模型升级 发布七大AI+健康应用
微软与Suno合作,Copilot引入音乐生成功能
谷歌:零样本视频生成模型VideoPoet
AI机器人在迷宫游戏中超越人类
荷兰地图平台TomTom与微软合作打造车载AI助手
百度智能云:千帆AppBuilder开放服务
港中大团队:开源AI音频工具包Amphion
《出版业生成式人工智能技术应用指南》
中国音像与数字出版协会发布了关于发布团体标准《出版业生成式人工智能技术应用指南》的公告。该指南经过立项审核、标准起草、征求意见、专家组审查等程序,并通过团标委审查,现予以批准发布。标准编号为T/CADPA 47-2023,自2024年1月20日起开始实施。
《出版业生成式人工智能技术应用指南(征求意见稿)》 https://web-yinxiang.oss-cn-beijing.aliyuncs.com/yinxiang/upload/yinxiang/file/20231114/1699945418432981.pdfhttp://www.cadpa.org.cn/3281/202312/41644.html
智源FlagEval 12月榜发布,新增鲁棒性评测
FlagEval大语言模型测评榜单12月榜发布,新增大语言模型鲁棒性评测结果,FlagEval平台更新了C-SEM v2.0数据集评测结果,新增了Qwen-72B/1.8B、DeepSeek-67B(Base)模型评测。其中,Qwen-72B-Chat模型主观评测结果准确率达83.6%。北京航空航天大学与智源FlagEval团队共同构建了大语言模型鲁棒性评测方案,分为内容扰动鲁棒性评测和格式扰动鲁棒性评测。 测评结果:https://flageval.baai.ac.cn/#/trendinghttps://mp.weixin.qq.com/s/qsSkR5HE3gUVS4PjU4SKmg
摩尔线程:首个千卡智算中心落地
摩尔线程KUAE智算中心在北京成功举办揭幕仪式,宣告国内首个以国产全功能GPU为基础的大规模算力集群正式投入使用。摩尔线程CEO张建中发布了旨在支持千亿参数大模型训练和推理的大模型智算加速卡MTT S4000和摩尔线程KUAE平台。该平台支持业界主流分布式框架,融合了多种并行算法策略,并进行了额外优化以提高通信计算并行和Flash Attention效率。https://mp.weixin.qq.com/s/ixPrVNbpQRAobaCHalXmMw
CMU称:Gemini Pro不如GPT-3.5 Turbo
卡内基梅隆大学(CMU)和BerriAI的研究人员共同发表了一篇论文,对谷歌的Gemini Pro模型与OpenAI的GPT-3.5 Turbo、GPT-4 Turbo以及Mistral AI的Mixtral 8x7B进行了测试对比。他们通过一组不同的提示运行所有模型,包括向他们询问57个不同的多项选择题,涉及STEM、人文科学、社会科学等方面的内容。测试结果显示,Gemini Pro得分在十几个数据集的测试上表现都不如GPT-3.5 Turbo。研究人员还发现,当提示不同的模型在标记为A、B、C或D的答案之间进行选择时,Gemini选择“D”的次数比其他模型不成比例地多,无论它是否是正确的答案。 论文地址:arxiv.org/pdf/2312.11444.pdfhttps://venturebeat.com/ai/google-gemini-is-not-even-as-good-as-gpt-3-5-turbo-researchers-find/
轻松集团:自研大模型升级 发布七大AI+健康应用
轻松集团旗下的医疗健康服务平台轻松健康宣布,他们自主研发的垂直领域大型模型“轻松问医Dr.GPT”已全面升级。同时,轻松健康还发布了基于该大型模型研发的七大应用,以满足不同应用场景和用户群体的特定需求,包括“智能问诊系统”、“个性化健康管理顾问”、“慢性病管理计划”、“心理健康指导师”、“医学知识库和技能培训平台”、“辅助诊疗助手”、“患教内容智创平台”,覆盖健康管理服务的各个场景应用。
https://mp.weixin.qq.com/s/SCyfL6hXDtdGfUOUqD6Y9Q