2023-05-15:论文速递
Cuttlefish: Low-Rank Model Training without All the Tuning
Cuttlefish:无需微调的低秩模型训练
《Cuttlefish: Low-Rank Model Training without All the Tuning》
URL:https://arxiv.org/abs/2305.02538
Official Code:https://github.com/hwang595/Cuttlefish
会议:MLSys 2023
单位:CMU & University of Wisconsin-Madison & Sony Group Corporation
动机:低秩神经网络训练可以有效地减少可训练参数的数量,加速端到端的速度,但需要调整多个额外的因子分解超参数,本文旨在解决这一挑战。
方法:提出一种自动化的低秩训练方法 Cuttlefish,通过观察神经网络层稳定秩的变化,自适应选择每层的秩和完全秩热身训练时间,不需要调整因子分解超参数。
优势:Cuttlefish 自动化地选择因子分解超参数,不需要多次试验进行调整,生成的模型比完全秩模型小 5.6 倍,同时保持可比较的准确性,比其他低秩模型训练方法和基线方法表现更好。
参考
文档信息
- 本文作者:Bookstall
- 本文链接:https://bookstall.github.io/wiki/2023-05-15-paper-list/
- 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证)