paper - 2023-05-15:论文速递

2023-05-15:论文速递

Cuttlefish: Low-Rank Model Training without All the Tuning

Cuttlefish:无需微调的低秩模型训练

《Cuttlefish: Low-Rank Model Training without All the Tuning》

  • URL:https://arxiv.org/abs/2305.02538

  • Official Code:https://github.com/hwang595/Cuttlefish

  • 会议:MLSys 2023

  • 单位:CMU & University of Wisconsin-Madison & Sony Group Corporation

  • 动机:低秩神经网络训练可以有效地减少可训练参数的数量,加速端到端的速度,但需要调整多个额外的因子分解超参数,本文旨在解决这一挑战。

  • 方法:提出一种自动化的低秩训练方法 Cuttlefish,通过观察神经网络层稳定秩的变化,自适应选择每层的秩和完全秩热身训练时间,不需要调整因子分解超参数。

  • 优势:Cuttlefish 自动化地选择因子分解超参数,不需要多次试验进行调整,生成的模型比完全秩模型小 5.6 倍,同时保持可比较的准确性,比其他低秩模型训练方法和基线方法表现更好。

参考

文档信息

Search

    Table of Contents