Categories

AI

  1. 2024-05-19 KAN 网络
  2. 2023-05-11 Google I/O 2023 总结(AI 部分)
  3. 2023-04-26 使用 "无知之幕" 的思想来对齐 AI
  4. 2023-04-22 LLaMA:Open and Efficient Foundation Language Models
  5. 2023-03-17 PaLM-E:多模态具身模型
  6. 2023-03-14 R-Drop:Regularized Dropout for Neural Networks
  7. 2023-03-12 指令微调(Instruction Tuning)
  8. 2023-03-05 ControlNet:为 Stable Diffusion 插上翅膀
  9. 2023-02-28 Multimodal-CoT:多模态的 Chain-of-Thought
  10. 2023-02-08 视频检索任务论文整理
  11. 2023-02-06 AutoCut:基于 Whisper 的视频剪辑工具
  12. 2023-01-29 注册 ChatGPT 的步骤

Agent

  1. 2024-01-01 LLM-Agent

Blog

  1. 2023-01-18 在 Jekyll 博客中添加图片查看器
  2. 2023-01-15 在 Jekyll 博客中添加音乐播放器
  3. 2023-01-12 在 Jekyll 博客中添加网站分析工具
  4. 2023-01-11 Google AdSense In Jekyll's Blog
  5. 2023-01-10 Search In Static Blog
  6. 2023-01-07 Comment System In Static Blog

CNN

  1. 2023-06-03 VanillaNet

CTF

  1. 2024-01-11 XSS Game

CV

  1. 2023-04-11 SAM:Segment Anything Model

Cesium

  1. 2023-06-20 Cesium 加载离线地图

ChatGPT

  1. 2023-03-18 一些 ChatGPT 镜像
  2. 2023-03-17 关于 ChatGPT 的信息、资讯汇总(不断更新)
  3. 2023-03-15 RLHF(Reinforcement Learning from Human Feedback)
  4. 2023-03-13 ChatGPT 浏览器插件
  5. 2023-03-12 指令微调(Instruction Tuning)

CoT

  1. 2023-02-28 Multimodal-CoT:多模态的 Chain-of-Thought

Comment

  1. 2023-01-07 Comment System In Static Blog

Diffusion

  1. 2023-06-02 Stable-Diffusion-WebUI 初尝
  2. 2023-03-05 ControlNet:为 Stable Diffusion 插上翅膀

Foundation Model

  1. 2023-04-17 综述:基础模型(Foundation Models)

GPT-2

  1. 2024-06-17 LLM 的评价指标:Perplexity(PPL)
  2. 2024-06-12 从零开始构建 NanoGPT
  3. 2023-12-24 GPT-2 论文 & nanoGPT 代码

Google Adsense

  1. 2023-01-11 Google AdSense In Jekyll's Blog

KAN

  1. 2024-05-19 KAN 网络

LLM

  1. 2024-06-19 综述:神经网络量化(Quantization)
  2. 2024-06-17 LLM 的评价指标:Perplexity(PPL)
  3. 2024-06-13 训练一个 Tokenizer
  4. 2024-06-12 从零开始构建 NanoGPT
  5. 2024-06-02 DeepSeek-V2:更强的开源 MoE 大模型
  6. 2024-05-12 YOCO:You Only Cache Once
  7. 2024-04-16 更长上下文的 Transformer
  8. 2024-04-15 Nougat:从 PDF 论文中提取数学公式
  9. 2024-04-14 ChromaDB:开源的向量数据库
  10. 2024-01-19 FastChat:基于 FastAPI 构建大模型加载服务
  11. 2024-01-06 向量数据库:LLM 的检索增强剂
  12. 2024-01-04 Linux 上部署 LangChain-Chatchat
  13. 2024-01-02 RoPE:旋转位置编码
  14. 2024-01-02 GLM 原理详解
  15. 2024-01-01 LLM-Agent
  16. 2023-12-31 LLM4VG 基准:用于评估 LLM 的视频时刻定位能力
  17. 2023-12-25 Large Language Model 综述
  18. 2023-12-24 GPT-2 论文 & nanoGPT 代码
  19. 2023-12-17 KV Cache:LLM 推理加速
  20. 2023-12-13 Mixtral 8x7B:首个开源 MoE 大模型
  21. 2023-04-22 LLaMA:Open and Efficient Foundation Language Models
  22. 2023-04-08 Transformer 中 FFN 的记忆功能(Memory)
  23. 2023-04-08 大型语言模型的涌现能力
  24. 2023-04-03 为什么现在的 LLM 都是 Decoder-only 架构?
  25. 2023-04-02 Toolformer:让 LLM 教会自己使用(调用)外部工具

LM

  1. 2023-05-30 在小数据集上更稳定地微调 BERT 模型

Linux

  1. 2024-01-11 Linux 常用命令

MoE

  1. 2024-06-02 DeepSeek-V2:更强的开源 MoE 大模型
  2. 2023-12-13 Mixtral 8x7B:首个开源 MoE 大模型

Multimodal

  1. 2023-05-28 Multimodal Transformer 综述
  2. 2023-03-16 论文:Modular and Parameter-Efficient Multimodal Fusion with Prompting
  3. 2023-03-16 论文:Prompt Tuning for Generative Multimodal Pretrained Models

PDF

  1. 2024-04-15 Nougat:从 PDF 论文中提取数学公式

PEFT

  1. 2023-05-18 梯度视角下的 LoRA
  2. 2023-04-16 PEFT 工具
  3. 2023-04-05 综述:PEFT(Parameter-Efficient Fint-Tuning)
  4. 2023-03-29 大模型时代下做科研的四种思路
  5. 2023-03-17 BitFit:只微调 Bias Term 的轻量化微调方法

Prompt

  1. 2023-04-11 SAM:Segment Anything Model
  2. 2023-03-29 大模型时代下做科研的四种思路
  3. 2023-03-27 nn.Embedding() 和 nn.Parameter() 的使用
  4. 2023-03-17 MaPLe:Multi-modal Prompt Learning

Prompt Tuning

  1. 2023-03-16 论文:Modular and Parameter-Efficient Multimodal Fusion with Prompting
  2. 2023-03-16 论文:Prompt Tuning for Generative Multimodal Pretrained Models
  3. 2023-03-14 P-Tuning

PyTorch

  1. 2023-03-27 nn.Embedding() 和 nn.Parameter() 的使用
  2. 2023-03-08 学习率衰减策略
  3. 2023-02-20 PyTorch 中关于实验可复现的设置

Quantization

  1. 2024-06-19 综述:神经网络量化(Quantization)

RLHF

  1. 2023-03-15 RLHF(Reinforcement Learning from Human Feedback)
  2. 2023-03-15 《Fine-Tuning Language Models from Human Preferences》

RoPE

  1. 2024-06-02 RoPE-Tie(RoPE for Text-image)

SSM

  1. 2024-04-30 Mamba 的代码实现
  2. 2024-04-28 The Survey of Vision Mamba
  3. 2024-04-26 Vision Mamba
  4. 2024-04-22 State Space Model
  5. 2024-04-22 Mamba 的代码实现
  1. 2023-01-10 Search In Static Blog

Transformer

  1. 2024-06-02 RoPE-Tie(RoPE for Text-image)
  2. 2024-04-16 更长上下文的 Transformer
  3. 2023-12-13 Flash-Attention
  4. 2023-05-16 Transformer 的各种位置编码方式
  5. 2023-04-29 DeepNet:成功训练 1000 层的 Transformer

Vector DB

  1. 2024-04-14 ChromaDB:开源的向量数据库
  2. 2024-01-06 向量数据库:LLM 的检索增强剂

Video

  1. 2023-04-12 Prompt-VTG:一些预训练的 Video-Language Model
  2. 2023-04-03 VC-TVG

Windows

  1. 2023-02-17 效率工具 Microsoft PowerToys 的使用
  2. 2023-02-17 Windows 放大镜的使用

eXplainable AI (XAI)

  1. 2023-03-16 积分梯度(Integrated Gradients)

lightweight

  1. 2023-06-03 VanillaNet

multimodal

  1. 2023-03-17 MaPLe:Multi-modal Prompt Learning

paper

  1. 2023-04-25 英文论文 "万金油" 句子收集

video

  1. 2023-12-31 LLM4VG 基准:用于评估 LLM 的视频时刻定位能力

多模态

  1. 2023-05-11 ImageBind:通过 Image 将其他模态的数据进行绑定(bind,对齐)

工具

  1. 2023-04-25 UltraChat 数据集:两个独立 ChatGPT Turbo API 的对话
  2. 2023-03-13 ChatGPT 浏览器插件
  3. 2023-02-26 Tiny Windows 11 系统
  4. 2023-02-17 效率工具 Microsoft PowerToys 的使用
  5. 2023-02-17 Windows 放大镜的使用
  6. 2023-02-12 下载 bilibili 视频的工具
  7. 2023-02-10 IPTV 的使用与资源整理

数据集

  1. 2023-04-25 UltraChat 数据集:两个独立 ChatGPT Turbo API 的对话

论文

  1. 2023-03-17 PaLM-E:多模态具身模型
  2. 2023-03-14 R-Drop:Regularized Dropout for Neural Networks
  3. 2023-03-12 指令微调(Instruction Tuning)