扩散模型
大一统视角理解扩散模型Understanding Diffusion Models: A Unified Perspective 阅读笔记
专业术语
Token
Token是模型用来表示自然语言文本的基本单位,可以直观的理解为“字”或“词”。对于中文文本来说,1个token通常对应一个汉宇;对于英文文本来说,1个token通常对应3至4个字母,
通义千问1.8B、7B、14B和72B模型服务根据模型输入和输出的总token数量进行计量计费,其中多轮对话中的history作为输入也会进行计量计费。每一次模型调用产生的实际token数量可以从 response 中获取。
JSON
JSON是一种轻量级的数据交换格式,它以易于理解和生成的方式表示数据。在算法标注中,JSON常用于存储和传输数据,以便算法可以处理和分析数据。
一、AI 大模型
ChatGPT简介
ChatGPT是什么?
ChatGPT底层核心概念
词嵌入
Transformer
自注意力机制
预训练与微调
大模型评测方法
上下文
幻觉问题
WDTA:大语言模型安全测试方案:https://mp.weixin.qq.com/s/cBWUWEtJU-Fh7YFiGZF9Tw
算法服务器
GPU:V100;32G 100多G的GPU