PEFT(Parameter-Efficient Fint-Tuning)的综述
为什么现在的 LLM 都是 Decoder-only 架构?
VC-TVG
通过调用外部工具的 API,将外部工具返回的结果插入到文本序列中,并且使用自监督的方式,实现 LLM 能够自主的选择、调用外部工具,包括:Question Answering、Calculator、Wikipedia Search、Machine Translation System 以及 Calendar,从而完成对 LLM 的扩展。
nn.Embedding() 和 nn.Parameter() 的使用
一些 ChatGPT 镜像
使用多模态具身模型 PaLM-E 来控制机器人:将连续的传感器数据直接整合到语言模型里,从而使得语言模型能够做出更有根据的推理。由于使用了 2022 年谷歌发布的 PaLM 作为预训练语言模型,因此命名 PaLM-E(PaLM Embodied)
Multi-modal Prompt Tuning
List the News or Information about ChatGPT