归档

2024 (24)

  1. 06-19 综述:神经网络量化(Quantization)
  2. 06-17 LLM 的评价指标:Perplexity(PPL)
  3. 06-13 训练一个 Tokenizer
  4. 06-12 从零开始构建 NanoGPT
  5. 06-02 RoPE-Tie(RoPE for Text-image)
  6. 06-02 DeepSeek-V2:更强的开源 MoE 大模型
  7. 05-19 KAN 网络
  8. 05-12 YOCO:You Only Cache Once
  9. 04-30 Mamba 的代码实现
  10. 04-28 The Survey of Vision Mamba
  11. 04-26 Vision Mamba
  12. 04-22 State Space Model
  13. 04-22 Mamba 的代码实现
  14. 04-16 更长上下文的 Transformer
  15. 04-15 Nougat:从 PDF 论文中提取数学公式
  16. 04-14 ChromaDB:开源的向量数据库
  17. 01-19 FastChat:基于 FastAPI 构建大模型加载服务
  18. 01-11 XSS Game
  19. 01-11 Linux 常用命令
  20. 01-06 向量数据库:LLM 的检索增强剂
  21. 01-04 Linux 上部署 LangChain-Chatchat
  22. 01-02 RoPE:旋转位置编码
  23. 01-02 GLM 原理详解
  24. 01-01 LLM-Agent

2023 (64)

  1. 12-31 LLM4VG 基准:用于评估 LLM 的视频时刻定位能力
  2. 12-25 Large Language Model 综述
  3. 12-24 GPT-2 论文 & nanoGPT 代码
  4. 12-17 KV Cache:LLM 推理加速
  5. 12-13 Mixtral 8x7B:首个开源 MoE 大模型
  6. 12-13 Flash-Attention
  7. 06-20 Cesium 加载离线地图
  8. 06-03 VanillaNet
  9. 06-02 Stable-Diffusion-WebUI 初尝
  10. 05-30 在小数据集上更稳定地微调 BERT 模型
  11. 05-28 Multimodal Transformer 综述
  12. 05-18 梯度视角下的 LoRA
  13. 05-16 Transformer 的各种位置编码方式
  14. 05-11 Google I/O 2023 总结(AI 部分)
  15. 05-11 ImageBind:通过 Image 将其他模态的数据进行绑定(bind,对齐)
  16. 04-29 DeepNet:成功训练 1000 层的 Transformer
  17. 04-26 使用 "无知之幕" 的思想来对齐 AI
  18. 04-25 英文论文 "万金油" 句子收集
  19. 04-25 UltraChat 数据集:两个独立 ChatGPT Turbo API 的对话
  20. 04-22 LLaMA:Open and Efficient Foundation Language Models
  21. 04-17 综述:基础模型(Foundation Models)
  22. 04-16 PEFT 工具
  23. 04-12 Prompt-VTG:一些预训练的 Video-Language Model
  24. 04-11 SAM:Segment Anything Model
  25. 04-08 Transformer 中 FFN 的记忆功能(Memory)
  26. 04-08 大型语言模型的涌现能力
  27. 04-05 综述:PEFT(Parameter-Efficient Fint-Tuning)
  28. 04-03 为什么现在的 LLM 都是 Decoder-only 架构?
  29. 04-03 VC-TVG
  30. 04-02 Toolformer:让 LLM 教会自己使用(调用)外部工具
  31. 03-29 大模型时代下做科研的四种思路
  32. 03-27 nn.Embedding() 和 nn.Parameter() 的使用
  33. 03-18 一些 ChatGPT 镜像
  34. 03-17 PaLM-E:多模态具身模型
  35. 03-17 MaPLe:Multi-modal Prompt Learning
  36. 03-17 关于 ChatGPT 的信息、资讯汇总(不断更新)
  37. 03-17 BitFit:只微调 Bias Term 的轻量化微调方法
  38. 03-16 积分梯度(Integrated Gradients)
  39. 03-16 论文:Modular and Parameter-Efficient Multimodal Fusion with Prompting
  40. 03-16 论文:Prompt Tuning for Generative Multimodal Pretrained Models
  41. 03-15 RLHF(Reinforcement Learning from Human Feedback)
  42. 03-15 《Fine-Tuning Language Models from Human Preferences》
  43. 03-14 P-Tuning
  44. 03-14 R-Drop:Regularized Dropout for Neural Networks
  45. 03-13 ChatGPT 浏览器插件
  46. 03-12 指令微调(Instruction Tuning)
  47. 03-08 学习率衰减策略
  48. 03-05 ControlNet:为 Stable Diffusion 插上翅膀
  49. 02-28 Multimodal-CoT:多模态的 Chain-of-Thought
  50. 02-26 Tiny Windows 11 系统
  51. 02-20 PyTorch 中关于实验可复现的设置
  52. 02-17 效率工具 Microsoft PowerToys 的使用
  53. 02-17 Windows 放大镜的使用
  54. 02-12 下载 bilibili 视频的工具
  55. 02-10 IPTV 的使用与资源整理
  56. 02-08 视频检索任务论文整理
  57. 02-06 AutoCut:基于 Whisper 的视频剪辑工具
  58. 01-29 注册 ChatGPT 的步骤
  59. 01-18 在 Jekyll 博客中添加图片查看器
  60. 01-15 在 Jekyll 博客中添加音乐播放器
  61. 01-12 在 Jekyll 博客中添加网站分析工具
  62. 01-11 Google AdSense In Jekyll's Blog
  63. 01-10 Search In Static Blog
  64. 01-07 Comment System In Static Blog