- 阿里:将推出大模型数学工具 MindOpt Copilot
- 联想推出AI大模型训练服务器
- 快手APP内测“AI对话”">快手APP内测“AI对话”
- “视频版ControlNet”开源了,靠提示词精准换画风,全华人团队出品!">“视频版ControlNet”开源了,靠提示词精准换画风,全华人团队出品!
- 清华系团队开源多模态生物医药大模型
- 字节跳动对外测试AI对话产品“豆包”">字节跳动对外测试AI对话产品“豆包”
- AI创企Arthur开源大模型性能评估工具
- 美国网安公司:AI被愈发用于操纵信息
- 谷歌前顶尖研究员于日本成立Sakana AI
- Meta将推出“免费版编程工具”- Code Llama">Meta将推出“免费版编程工具”- Code Llama
阿里:将推出大模型数学工具 MindOpt Copilot
联想推出AI大模型训练服务器
快手APP内测“AI对话”
“视频版ControlNet”开源了,靠提示词精准换画风,全华人团队出品!
清华系团队开源多模态生物医药大模型
字节跳动对外测试AI对话产品“豆包”
AI创企Arthur开源大模型性能评估工具
美国网安公司:AI被愈发用于操纵信息
谷歌前顶尖研究员于日本成立Sakana AI
Meta将推出“免费版编程工具” - Code Llama
阿里:将推出大模型数学工具 MindOpt Copilot
阿里决策智能团队研发了一款大模型数学工具 MindOpt Copilot,可将用户以自然语言描述的优化问题转化为线性规划和混合整数线性规划的优化模型,并获得最佳答案。该工具可用于解决餐饮、零售、物流货运、生产制造等场景的资源配置和优化问题。MindOpt Copilot 当下还在探索工业级的解题技能,但可处理包含上百个变量或约束条件的问题,也能处理需要结合数据文件输入的高维度问题,还可输出数学公式和代码。
https://new.qq.com/rain/a/20230818A064Q900
联想推出AI大模型训练服务器
联想公司推出了两款全新的AI服务器产品——联想问天WA7780 G3 AI大模型训练服务器和联想问天WA5480 G3 AI训推一体服务器。此外,联想还发布了联想AI算力战略,以及联想智算中心解决方案和服务核心产品。
其中,联想问天WA7780 G3采用第四代英特尔至强可扩展处理器,NVIDIA HGX H800系统配备8颗H800 NVLink GPU,并拥有高达640GB的HBM3高速显存。通过NVLINK,GPU间互联带宽高达400GB/s。据称该产品将AI算力提升了3.44倍,至高可达32P FLOPS AI算力。此外,该产品还配合Transformer引擎(FP8精度),相比上一代产品,大模型AI训练速度提升高达9倍,大模型AI推理速度提升高达30倍。
https://www.zhidx.com/news/39167.html
快手APP内测“AI对话”
快手 APP推出了AI对话功能。此功能基于自研大语言模型应用,可以帮助用户快速查找短视频、达人、百科等内容,并为用户提供全网检索服务。相较于通用化的大模型,快手AI对话将快手站内大量的内容资源作为索引,提升了回答准确性,并用更加有效地资源组织形式满足了用户多元化需求。此外,它还可以进行追问,在个性化的场景中寻找到更适合自己的搜索结果。快手已经在多个应用场景开始新产品及功能的探索。据悉,这是短视频直播行业首个基于大语言模型落地的应用产品。
https://tech.ifeng.com/c/8SOY0vGAobR
“视频版ControlNet”开源了,靠提示词精准换画风,全华人团队出品!
CoDeF是由全华人团队打造的最新视频处理算法,能够对原视频做到精准控制,只需根据给到的提示词,就能改变视频的画风,而且是针对完整视频。比如输入“Chinese ink painting”,风景纪录片能秒变国风水墨大作。CoDeF还能跟踪水和烟雾,实现更好的跨帧一致性,甚至跟踪非刚性物体。整个过程非常轻松,不需要对待操作视频进行任何调整或处理。
代码地址:
https://github.com/qiuyu96/CoDeF
https://qiuyu96.github.io/CoDeF/
https://tech.ifeng.com/c/8SOusRSndjV
清华系团队开源多模态生物医药大模型
清华大学智能产业研究院(AIR)和大模型初创公司水木分子合作,开源了可商用的多模态生物医药百亿参数大模型BioMedGPT-10B。据称,该模型可应用于提升药物研发各个环节的效率,包括新药立项评估、药物设计和优化、临床试验设计、适应症拓展等。该模型在生物医药领域的问答能力已达到“比肩人类专家水平”,并在多个生物医药问答基准数据集上实现了SOTA(state-of-the-art model,目前最先进的模型),并已通过美国医师资格考试。
BioMedGPT-10B已于8月14日上线开源。此外,水木分子团队还上线了BioMedGPT-LM-7B,这是“首个可商用、生物医药专用的Llama2大模型”。水木分子是由清华大学智能产业研究院孵化成立的大模型创业公司,致力于打造生物医药行业基础大模型及新一代对话式药物研发助手,目前已完成千万级种子轮融资。清华大学国强教授、AIR首席研究员聂再清教授任首席科学家。
开源地址:
https://github.com/PharMolix/OpenBioMed
https://huggingface.co/PharMolix/BioMedGPT-LM-7B
https://mp.weixin.qq.com/s/NbkY4SNfou0FtdJpWQYt3w
字节跳动对外测试AI对话产品“豆包”
字节跳动开始对外测试AI对话产品“豆包”,“豆包”即此前的“Grace”,Grace是一个AI对话类测试项目的内部代号,尚还处于初级阶段。而Grace的测试网站为gracebot.cn——现在该地址对应“豆包”的下载页面。该产品提供以AI对话为核心功能的技术服务,接入了大规模语言模型以及其他模型及服务,可以根据用户输入的指令,通过自动化分析后生成参考信息。该产品由北京春田知韵科技有限公司提供软件及相关服务,页面相对简洁,用户可自主创建新对话并编辑对话名称。
https://new.qq.com/rain/a/20230817A078BE00
AI创企Arthur开源大模型性能评估工具
纽约的AI初创公司Arthur于8月17日发布了一款名为Bench的开源AI模型评估工具,旨在比较生成文本模型的大型语言模型(LLM)、提示和超参数。据称,Arthur Bench可以帮助企业进行模型选择和验证、预算和隐私优化以及将学术基准转化为实际应用。Arthur还推出了生成评估项目GAP,该项目旨在对OpenAI、Anthropic和Meta等AI领先企业提供的语言模型产品的优缺点进行排名。评估行业领导者(如OpenAI、Anthropic和Meta)的语言模型的优势和劣势,并与公众分享有关行为差异和最佳实践的发现。
https://www.arthur.ai/blog/introducing-arthur-bench
美国网安公司:AI被愈发用于操纵信息
美国网络安全公司Mandiant表示,近年来越来越多的政治操纵信息活动使用了人工智能(AI)技术,但该技术在其他数字入侵中的使用迄今为止还很有限。该公司的研究人员发现,自2019年以来,已经出现了许多AI生成的内容,例如伪造的个人资料图片,用于政治动机的网络影响活动中。这些活动包括与俄罗斯、中国、伊朗、埃塞俄比亚、印度尼西亚、古巴、阿根廷、墨西哥、厄瓜多尔和萨尔瓦多政府相关的团体。
然而,这些活动的影响有限。Mandiant的副总裁桑德拉·乔伊斯(Sandra Joyce)表示:“从效果的角度来看,并没有取得太多胜利。他们还没有真正改变威胁形势。”
Mandiant称,它还没有看到AI在俄罗斯、伊朗、中国或朝鲜的威胁中发挥关键作用。研究人员表示,预计在短期内数字入侵中使用AI的情况将保持较低水平。不过,他们补充说:“我们可以非常有信心地说,这将是一个随着时间推移而变得越来越严重的问题。”
谷歌前顶尖研究员于日本成立Sakana AI
David Ha和Llion Jones是两位著名的谷歌前研究员,他们于8月17日在东京宣布成立了一家新的AI公司Sakana AI,专注于为基础模型创建新架构。Ha担任首席执行官,此前曾担任Stability AI研究主管和谷歌大脑研究员;Jones则担任首席技术官,他是提出Transformer深度学习架构论文的第五作者,该论文的所有作者现均已离开谷歌。两位联合创始人表示,其研究受到自然概念的启发,例如进化和集体智慧。Sakana在日语中是“鱼”的意思,代表着“一群鱼聚在一起,根据简单的规则行程连贯实体”的愿景。
Meta将推出“免费版编程工具”- Code Llama
Meta计划于下周推出一款名为Code Llama的开源AI软件,旨在帮助开发人员自动生成编程代码。该软件将与OpenAI的Codex模型竞争,并较Meta的开源大语言模型Llama 2显著增强。Code Llama的开源属性将令企业用户更容易开发自有AI助手,并与由Codex支持的微软GitHub Copilot等付费编程助手工具争夺客户。此举被认为是Meta试图颠覆人工智能领域的最新大胆举措,也将直接挑战OpenAI和谷歌等业内大佬。
https://www.philschmid.de/cdk-llama2
https://finance.sina.com.cn/stock/usstock/c/2023-08-19/doc-imzhscev5531546.shtml