Categories

AI

2024-05-19 KAN 网络
2023-05-11 Google I/O 2023 总结（AI 部分）
2023-04-26 使用 "无知之幕" 的思想来对齐 AI
2023-04-22 LLaMA：Open and Efficient Foundation Language Models
2023-03-17 PaLM-E：多模态具身模型
2023-03-14 R-Drop：Regularized Dropout for Neural Networks
2023-03-12 指令微调（Instruction Tuning）
2023-03-05 ControlNet：为 Stable Diffusion 插上翅膀
2023-02-28 Multimodal-CoT：多模态的 Chain-of-Thought
2023-02-08 视频检索任务论文整理
2023-02-06 AutoCut：基于 Whisper 的视频剪辑工具
2023-01-29 注册 ChatGPT 的步骤

Agent

2024-01-01 LLM-Agent

Blog

2023-01-18 在 Jekyll 博客中添加图片查看器
2023-01-15 在 Jekyll 博客中添加音乐播放器
2023-01-12 在 Jekyll 博客中添加网站分析工具
2023-01-11 Google AdSense In Jekyll's Blog
2023-01-10 Search In Static Blog
2023-01-07 Comment System In Static Blog

CNN

2023-06-03 VanillaNet

CTF

2024-01-11 XSS Game

CV

2023-04-11 SAM：Segment Anything Model

Cesium

2023-06-20 Cesium 加载离线地图

ChatGPT

2023-03-18 一些 ChatGPT 镜像
2023-03-17 关于 ChatGPT 的信息、资讯汇总（不断更新）
2023-03-15 RLHF（Reinforcement Learning from Human Feedback）
2023-03-13 ChatGPT 浏览器插件
2023-03-12 指令微调（Instruction Tuning）

CoT

2023-02-28 Multimodal-CoT：多模态的 Chain-of-Thought

Comment

2023-01-07 Comment System In Static Blog

Diffusion

2023-06-02 Stable-Diffusion-WebUI 初尝
2023-03-05 ControlNet：为 Stable Diffusion 插上翅膀

Foundation Model

2023-04-17 综述：基础模型（Foundation Models）

GPT-2

2023-01-11 Google AdSense In Jekyll's Blog

KAN

2024-05-19 KAN 网络

LLM

2024-06-19 综述：神经网络量化（Quantization）
2024-06-17 LLM 的评价指标：Perplexity（PPL）
2024-06-13 训练一个 Tokenizer
2024-06-12 从零开始构建 NanoGPT
2024-06-02 DeepSeek-V2：更强的开源 MoE 大模型
2024-05-12 YOCO：You Only Cache Once
2024-04-16 更长上下文的 Transformer
2024-04-15 Nougat：从 PDF 论文中提取数学公式
2024-04-14 ChromaDB：开源的向量数据库
2024-01-19 FastChat：基于 FastAPI 构建大模型加载服务
2024-01-06 向量数据库：LLM 的检索增强剂
2024-01-04 Linux 上部署 LangChain-Chatchat
2024-01-02 RoPE：旋转位置编码
2024-01-02 GLM 原理详解
2024-01-01 LLM-Agent
2023-12-31 LLM4VG 基准：用于评估 LLM 的视频时刻定位能力
2023-12-25 Large Language Model 综述
2023-12-24 GPT-2 论文 & nanoGPT 代码
2023-12-17 KV Cache：LLM 推理加速
2023-12-13 Mixtral 8x7B：首个开源 MoE 大模型
2023-04-22 LLaMA：Open and Efficient Foundation Language Models
2023-04-08 Transformer 中 FFN 的记忆功能（Memory）
2023-04-08 大型语言模型的涌现能力
2023-04-03 为什么现在的 LLM 都是 Decoder-only 架构？
2023-04-02 Toolformer：让 LLM 教会自己使用（调用）外部工具

LM

2023-05-30 在小数据集上更稳定地微调 BERT 模型

Linux

2024-01-11 Linux 常用命令

MoE

2024-06-02 DeepSeek-V2：更强的开源 MoE 大模型
2023-12-13 Mixtral 8x7B：首个开源 MoE 大模型

Multimodal

2023-05-28 Multimodal Transformer 综述
2023-03-16 论文：Modular and Parameter-Efficient Multimodal Fusion with Prompting
2023-03-16 论文：Prompt Tuning for Generative Multimodal Pretrained Models

PDF

2024-04-15 Nougat：从 PDF 论文中提取数学公式

PEFT

2023-05-18 梯度视角下的 LoRA
2023-04-16 PEFT 工具
2023-04-05 综述：PEFT（Parameter-Efficient Fint-Tuning）
2023-03-29 大模型时代下做科研的四种思路
2023-03-17 BitFit：只微调 Bias Term 的轻量化微调方法

Prompt

2023-04-11 SAM：Segment Anything Model
2023-03-29 大模型时代下做科研的四种思路
2023-03-27 nn.Embedding() 和 nn.Parameter() 的使用
2023-03-17 MaPLe：Multi-modal Prompt Learning

Prompt Tuning

2023-03-16 论文：Modular and Parameter-Efficient Multimodal Fusion with Prompting
2023-03-16 论文：Prompt Tuning for Generative Multimodal Pretrained Models
2023-03-14 P-Tuning

PyTorch

2023-03-27 nn.Embedding() 和 nn.Parameter() 的使用
2023-03-08 学习率衰减策略
2023-02-20 PyTorch 中关于实验可复现的设置

Quantization

2024-06-19 综述：神经网络量化（Quantization）

RLHF

2023-03-15 RLHF（Reinforcement Learning from Human Feedback）
2023-03-15 《Fine-Tuning Language Models from Human Preferences》

RoPE

2024-06-02 RoPE-Tie（RoPE for Text-image）

SSM

Search

2023-01-10 Search In Static Blog

Transformer

2024-06-02 RoPE-Tie（RoPE for Text-image）
2024-04-16 更长上下文的 Transformer
2023-12-13 Flash-Attention
2023-05-16 Transformer 的各种位置编码方式
2023-04-29 DeepNet：成功训练 1000 层的 Transformer

Vector DB

2024-04-14 ChromaDB：开源的向量数据库
2024-01-06 向量数据库：LLM 的检索增强剂

Video

2023-04-12 Prompt-VTG：一些预训练的 Video-Language Model
2023-04-03 VC-TVG

Windows

2023-02-17 效率工具 Microsoft PowerToys 的使用
2023-02-17 Windows 放大镜的使用

eXplainable AI (XAI)

2023-03-16 积分梯度（Integrated Gradients）

lightweight

2023-06-03 VanillaNet

multimodal

2023-03-17 MaPLe：Multi-modal Prompt Learning

paper

2023-04-25 英文论文 "万金油" 句子收集

video

2023-12-31 LLM4VG 基准：用于评估 LLM 的视频时刻定位能力

多模态

2023-05-11 ImageBind：通过 Image 将其他模态的数据进行绑定（bind，对齐）

工具

2023-04-25 UltraChat 数据集：两个独立 ChatGPT Turbo API 的对话
2023-03-13 ChatGPT 浏览器插件
2023-02-26 Tiny Windows 11 系统
2023-02-17 效率工具 Microsoft PowerToys 的使用
2023-02-17 Windows 放大镜的使用
2023-02-12 下载 bilibili 视频的工具
2023-02-10 IPTV 的使用与资源整理

数据集

2023-04-25 UltraChat 数据集：两个独立 ChatGPT Turbo API 的对话

论文

2023-03-17 PaLM-E：多模态具身模型
2023-03-14 R-Drop：Regularized Dropout for Neural Networks
2023-03-12 指令微调（Instruction Tuning）

Search

Blog Categories