2024 (24)
- 综述:神经网络量化(Quantization)
- LLM 的评价指标:Perplexity(PPL)
- 训练一个 Tokenizer
- 从零开始构建 NanoGPT
- RoPE-Tie(RoPE for Text-image)
- DeepSeek-V2:更强的开源 MoE 大模型
- KAN 网络
- YOCO:You Only Cache Once
- Mamba 的代码实现
- The Survey of Vision Mamba
- Vision Mamba
- State Space Model
- Mamba 的代码实现
- 更长上下文的 Transformer
- Nougat:从 PDF 论文中提取数学公式
- ChromaDB:开源的向量数据库
- FastChat:基于 FastAPI 构建大模型加载服务
- XSS Game
- Linux 常用命令
- 向量数据库:LLM 的检索增强剂
- Linux 上部署 LangChain-Chatchat
- RoPE:旋转位置编码
- GLM 原理详解
- LLM-Agent
2023 (64)
- LLM4VG 基准:用于评估 LLM 的视频时刻定位能力
- Large Language Model 综述
- GPT-2 论文 & nanoGPT 代码
- KV Cache:LLM 推理加速
- Mixtral 8x7B:首个开源 MoE 大模型
- Flash-Attention
- Cesium 加载离线地图
- VanillaNet
- Stable-Diffusion-WebUI 初尝
- 在小数据集上更稳定地微调 BERT 模型
- Multimodal Transformer 综述
- 梯度视角下的 LoRA
- Transformer 的各种位置编码方式
- Google I/O 2023 总结(AI 部分)
- ImageBind:通过 Image 将其他模态的数据进行绑定(bind,对齐)
- DeepNet:成功训练 1000 层的 Transformer
- 使用 "无知之幕" 的思想来对齐 AI
- 英文论文 "万金油" 句子收集
- UltraChat 数据集:两个独立 ChatGPT Turbo API 的对话
- LLaMA:Open and Efficient Foundation Language Models
- 综述:基础模型(Foundation Models)
- PEFT 工具
- Prompt-VTG:一些预训练的 Video-Language Model
- SAM:Segment Anything Model
- Transformer 中 FFN 的记忆功能(Memory)
- 大型语言模型的涌现能力
- 综述:PEFT(Parameter-Efficient Fint-Tuning)
- 为什么现在的 LLM 都是 Decoder-only 架构?
- VC-TVG
- Toolformer:让 LLM 教会自己使用(调用)外部工具
- 大模型时代下做科研的四种思路
- nn.Embedding() 和 nn.Parameter() 的使用
- 一些 ChatGPT 镜像
- PaLM-E:多模态具身模型
- MaPLe:Multi-modal Prompt Learning
- 关于 ChatGPT 的信息、资讯汇总(不断更新)
- BitFit:只微调 Bias Term 的轻量化微调方法
- 积分梯度(Integrated Gradients)
- 论文:Modular and Parameter-Efficient Multimodal Fusion with Prompting
- 论文:Prompt Tuning for Generative Multimodal Pretrained Models
- RLHF(Reinforcement Learning from Human Feedback)
- 《Fine-Tuning Language Models from Human Preferences》
- P-Tuning
- R-Drop:Regularized Dropout for Neural Networks
- ChatGPT 浏览器插件
- 指令微调(Instruction Tuning)
- 学习率衰减策略
- ControlNet:为 Stable Diffusion 插上翅膀
- Multimodal-CoT:多模态的 Chain-of-Thought
- Tiny Windows 11 系统
- PyTorch 中关于实验可复现的设置
- 效率工具 Microsoft PowerToys 的使用
- Windows 放大镜的使用
- 下载 bilibili 视频的工具
- IPTV 的使用与资源整理
- 视频检索任务论文整理
- AutoCut:基于 Whisper 的视频剪辑工具
- 注册 ChatGPT 的步骤
- 在 Jekyll 博客中添加图片查看器
- 在 Jekyll 博客中添加音乐播放器
- 在 Jekyll 博客中添加网站分析工具
- Google AdSense In Jekyll's Blog
- Search In Static Blog
- Comment System In Static Blog