Skip to main content
Overview

Tuning degli hyperparameter

August 22, 2021
1 min read

Tuning degli hyperparameter

Hyperparameter

Valori che lo sviluppatore deve impostare manualmente:

  • learning rate
  • dimensione del modello
  • tipo di optimizer
  • epoch
  • ecc…

Panoramica

  • Tra modello, dati e hyperparameter, i valori degli hyperparameter sono i meno importanti.
    • Il modello è il più importante, ma i buoni modelli sono generalmente ben noti.
    • Quindi i dati tendono a essere la priorità.
    • Non investire troppo sforzo negli hyperparameter.
  • Detto questo, se si insegue l’ultimo 0.01 di prestazione, è indispensabile.
  • Recentemente, i modelli NAS basati su AutoML gestiscono il tuning degli hyperparameter automaticamente.
  • Recipe: quando il modello stesso prescrive come tunare i propri hyperparameter.

Metodi

  • Grid: ricerca a intervalli fissi
  • Random: ricerca casuale
  • Recentemente si usano anche metodi bayesiani (BOHB)

Ray

  • Modulo multi-nodo e multi-processing.
  • Originariamente progettato per ML/DL, ma è diventato un modulo di parallelizzazione generico per Python.
  • Durante il tuning degli hyperparameter, fa pruning anticipato delle configurazioni poco promettenti.
Loading comments...