ML Wiki

Tag: fine-tuning

12 items with this tag.

Apr 25, 2026
Learning to Summarize from Human Feedback
Apr 20, 2026
BART: Denoising Sequence-to-Sequence Pre-training
Apr 18, 2026
Code Generation
Apr 18, 2026
Evaluating Large Language Models Trained on Code (Codex)
Apr 17, 2026
Instruction Following
Apr 17, 2026
QLoRA: Efficient Finetuning of Quantized LLMs
Apr 17, 2026
Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer (T5)
Apr 11, 2026
Transfer Learning
Apr 10, 2026
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
Apr 10, 2026
Training language models to follow instructions with human feedback (InstructGPT)
Apr 05, 2026
LoRA (Low-Rank Adaptation)
Apr 05, 2026
LoRA: Low-Rank Adaptation of Large Language Models