扩散模型

大一统视角理解扩散模型Understanding Diffusion Models: A Unified Perspective 阅读笔记

专业术语

Token

Token是模型用来表示自然语言文本的基本单位,可以直观的理解为“字”或“词”。对于中文文本来说,1个token通常对应一个汉宇;对于英文文本来说,1个token通常对应3至4个字母,

通义千问1.8B、7B、14B和72B模型服务根据模型输入和输出的总token数量进行计量计费,其中多轮对话中的history作为输入也会进行计量计费。每一次模型调用产生的实际token数量可以从 response 中获取。

JSON

JSON是一种轻量级的数据交换格式,它以易于理解和生成的方式表示数据。在算法标注中,JSON常用于存储和传输数据,以便算法可以处理和分析数据。

大模型专业术语积累 - 图1

大模型专业术语积累 - 图2

一、AI 大模型

ChatGPT简介

ChatGPT是什么?

ChatGPT底层核心概念

词嵌入

Transformer

大模型专业术语积累 - 图3

自注意力机制

预训练与微调

大模型评测方法

上下文

幻觉问题

WDTA:大语言模型安全测试方案:https://mp.weixin.qq.com/s/cBWUWEtJU-Fh7YFiGZF9Tw

大模型落地最后一公里:111页全面综述大模型评测

算法服务器

GPU:V100;32G 100多G的GPU

大模型专业术语积累 - 图4

Kimi.ai - 帮你看更大的世界