详细介绍 LangChain-Chatchat 项目在 Linux 系统上的部署
RoPE 原理与代码详解
GLM 原理详解
创建属于自己的 LLM-Agent
清华大学发布 LLM4VG 基准,用于评估 LLM 模型的视频时刻定位能力。
一篇非常详细的关于 LLM 的综述,并且作者还提供了中文版本。
GPT-2 论文粗读,以及 nanoGPT 核心代码的解读
现有的 LLM 大多采用 Decoder-Only 架构,这些 LLM 使用到了 Casual Mask(也成为 Casual Attention)。正是由于 Casual Mask,我们可以通过将注意力中的 K 和 V 进行保存,以空间换时间,从而加快 LLM 的推理过程。