合合信息发布首个古彝文基础编码“大字典”,用AI“抢救”濒危语言

潞晨与澜舟将合作打造企业级LLM解决方案

中美多家机构联合发布大模型可解释性技术综述

英国政府:AI对多边体系构成了“严峻考验”

梅安森计划推出第一代矿山安全模型

OpenAI发布视觉模型GPT-4V及其系统卡论文

Spotify合作OpenAI推出AI语音翻译功能

百度发布首个量子领域大模型及两大AI原生应用

Getty合作英伟达推出生成式AI工具

抖音:上线地方方言AI自动翻译功能

合合信息发布首个古彝文基础编码“大字典”,用AI“抢救”濒危语言

今日AI资讯-09.27 - 图1

合合信息联合上海大学和华南理工大学发布了业内首个古彝文基础编码数据库。该项目是由合合信息与上海大学社会学院、华南理工大学文档图像分析识别与理解实验室共同推进的。该数据库针对现有的《西南彝志》和云贵一带的字符,利用智能图像处理和文字识别等AI技术进行统一编码,最近发布了业内首个古彝文基础编码数据库。在对7万6千字符的样本进行训练后,团队成功建立了包含上千个古彝文基础编码的数据库。在收集语料的过程中,研究人员使用了合合信息旗下扫描全能王“智能高清滤镜”功能,高效解决古彝文识别的版式检测、图像处理和文字识别等难题。对于污渍、残破的彝文古籍,收集者只需通过“智能高清滤镜”轻轻一扫,即可得到一张清晰、平整的图片。可以通过API数据接口等形式,该数据库有望帮助高校研究人员、文化工作者、兴趣爱好者等人群快速找到古彝文在字典中的读音、汉语释义、用法,如同“大字典”一般,帮助人们降低古彝文书籍、文献阅读的门槛。

https://www.yicai.com/news/101866808.html

潞晨与澜舟将合作打造企业级LLM解决方案

今日AI资讯-09.27 - 图2

北京潞晨科技有限公司(简称“潞晨科技”)与北京澜舟科技有限公司(简称“澜舟科技”)签署了战略合作协议。潞晨科技将以Colossal-AI系统为基础,利用内存管理、多维并行、推理提速等先进技术,帮助澜舟科技更高效、更快速地实现垂直领域模型的落地,使孟子系列通用大模型、行业大模型和场景服务模型更好地服务于行业头部和标杆企业,共同推动AI大模型在多个领域的产业应用和落地,积极助力各行业的数字化转型。

https://mp.weixin.qq.com/s/jLB_fhNAKtwlnEdnCpFLrg

中美多家机构联合发布大模型可解释性技术综述

今日AI资讯-09.27 - 图3

中美多家机构,包括新泽西理工学院、约翰斯·霍普金斯大学、维克森林大学、佐治亚大学、上海交大、百度等,联合发布了一份综述,介绍了大模型可解释性技术的研究现状。综述对传统的Fine-tuning模型和基于Prompting的超大模型的可解释性技术进行了全面的梳理,并探讨了模型解释的评估标准和未来的研究挑战。 论文链接: https://arxiv.org/abs/2309.01029 GitHub链接: https://github.com/hy-zhao23/Explainability-for-Large-Language-Models

英国政府:AI对多边体系构成了“严峻考验”

今日AI资讯-09.27 - 图4

英国政府在最近的联合国大会上发出警告称,人工智能对多边体系构成了“严峻考验”,并表示正在寻求包括中国在内的国家支持其监管该技术“社会规模”风险的愿景。据英国《金融时报》报道,英国副首相Oliver Dowden和外交大臣James Cleverly在联合国大会期间接受采访时为英国邀请中国参加人工智能监管峰会的决定进行了辩护,该峰会最初被描述为只包括“志同道合的国家”。

https://www.ft.com/content/9d98da0a-14e2-4bbb-a076-91ef131fe2b2

梅安森计划推出第一代矿山安全模型

梅安森董事长马焰在接受《科创板日报》记者采访时表示,安全领域的物联网企业梅安森利用华为盘古大模型和算力对原有产品进行了优化,并已成功应用于项目中。梅安森与上海人工智能研究院合作共建了矿山安全大模型联合实验室,计划尽快推出第一代针对细分领域问题的矿山安全模型,并逐步完善其在矿山中的应用。

OpenAI发布视觉模型GPT-4V及其系统卡论文

今日AI资讯-09.27 - 图5

OpenAI在其官网发布了一篇有关多模态视觉模型GPT-4V(Vision)的论文。据悉,GPT-4V可以使用户指示GPT-4分析用户提供的图像输入。该系统在2022年完成训练,并在2023年3月开始提供早期访问系统。该论文概述了OpenAI如何为GPT-4部署视觉功能,并分析了GPT-4V的安全属性。

论文地址: https://cdn.openai.com/papers/GPTV_System_Card.pdf

https://openai.com/research/gpt-4v-system-card

Spotify合作OpenAI推出AI语音翻译功能

今日AI资讯-09.27 - 图6

Spotify最近与OpenAI合作,推出了基于OpenAI的语音转录工具Whisper的AI语音翻译功能。该功能利用该工具将其他播客的英语剧集翻译成另一种语言,并以播客自己的声音合成版本再现。目前该功能已推出西班牙语翻译,并计划在未来几周内推出法语和德语翻译。

https://www.theverge.com/2023/9/25/23888009/spotify-podcast-translation-voice-replication-open-ai

百度发布首个量子领域大模型及两大AI原生应用

今日AI资讯-09.27 - 图7

2023量子产业大会在安徽合肥举行。在会上,百度量子计算研究所所长段润尧发布了首个量子领域大模型,以及两大AI原生应用:百度量子助手和量子写作助手。他还发布了量子领域大模型白皮书,展望量子领域大模型的未来发展趋势和技术潜力。据段润尧介绍,该量子领域大模型是在文心一言基础上,使用量子领域高质量数据进行更有针对性的训练和优化而构建的,能更好地理解量子知识,并专业执行量子任务。

https://mp.weixin.qq.com/s/QpACJh3RXKKfyKCvBvapjQ

Getty合作英伟达推出生成式AI工具

今日AI资讯-09.27 - 图8

Getty Images与英伟达合作推出了一款生成式AI工具,基于英伟达的Edify模型,用户可以使用Getty Images的授权照片库创建图像。该工具将与标准的Getty Images订阅分开定价,并且定价基于即时数量,但Getty未具体说明价格。Getty承诺,任何使用该工具并发布其商业图像的人都将受到法律保护。

https://www.gettyimages.com/ai/generation/about?language=en-us

抖音:上线地方方言AI自动翻译功能

今日AI资讯-09.27 - 图9

抖音最近推出了方言自动翻译功能,创作者可以轻松将粤语、闽语、吴语、西南官话、中原官话等方言视频转化为普通话字幕,以方便公众观看。据介绍,抖音火山引擎技术团队使用自研的自监督预训练模型和多语言翻译模型,实现了在极少量标注数据条件下识别方言的能力,同时训练效率提升一倍,有效提升了多语言翻译的性能,同时大幅度降低了模型训练的资源消耗。

https://www.cnr.cn/yczg/yczx/wzzx/20230925/t20230925_526432138.shtml