コンテンツにスキップ

Learn From Model Beyond Fine-Tuning: A Survey


序論

本論文は、従来のファインチューニングを超えた「Learn From Model(LFM)」アプローチについて包括的にレビューします。LFMは、既存の大規模言語モデル(FM)を活用し、新しいタスクへの適応や性能向上を図る手法です。

モデルチューニング

ファインチューニング

ファインチューニングは、既存のモデルに新しいデータで再訓練を行い、特定のタスクに適応させる方法です。これにより、モデルのパフォーマンスを向上させることができますが、計算コストが高く、過学習のリスクもあります。

アダプターチューニング

アダプターチューニングは、モデルの内部パラメータを固定し、追加のトレーニング可能なパラメータ(アダプター)を挿入して、特定のタスクに適応させる方法です。これにより、計算コストを削減しつつ、性能を維持します。

プロンプトチューニング

プロンプトチューニングは、モデルのパラメータを固定し、最適なプロンプトを設計してモデルの性能を引き出す方法です。ホワイトボックスとブラックボックスの設定があり、後者はモデルのパラメータにアクセスできない状況でも効果を発揮します。

インストラクションチューニング

インストラクションチューニングは、モデルに命令形式でデータを提供し、特定のタスクを実行する能力を向上させる方法です。これにより、見たことのないタスクにも対応できる汎用性が向上します。

モデル蒸留

モデル蒸留は、大規模な教師モデルから小規模な生徒モデルへ知識を移転し、計算リソースが限られた環境でも高性能を維持する手法です。

モデル再利用

モデル再利用は、複数のモデルの予測を組み合わせて全体の性能を向上させる方法です。これにより、個々のモデルの強みを活かしつつ、弱点を補完します。

メタラーニング

メタラーニングは、新しいタスクに迅速に適応できるモデルを設計する手法です。これにより、連続的な学習や複数タスクの同時処理が可能になります。

モデル編集

モデル編集は、モデルの知識を直接調整して性能を向上させる方法です。これにより、再訓練のコストを抑えつつ、モデルの適応性を高めます。

結論

LFMは、データ中心の学習を超え、既存の大規模モデルを活用する新しいパラダイムです。これにより、計算コストの削減、データプライバシーの保護、モデルの汎用性の向上が期待されます。