Probit multinomiale
In statistica e apprendimento automatico, il modello probit multinomiale è una generalizzazione del modello probit per problemi con più di due categorie possibili per la variabile dipendente [1]. Quindi esso rappresenta un'alternativa al modello logit multinomiale da utilizzare per problemi di apprendimento supervisionato multi-classe. Non va però confuso con il modello probit multivariato, utilizzato per modellare casi con risultati binari correlati per più variabili indipendenti.
Specifica generale
modificaSi suppone di avere una serie di osservazioni Yi, per i = 1... n, dei risultati di scelte fra K valori tratte da una distribuzione categorica di dimensione K (ci sono K > 2 scelte possibili). A ciascuna osservazione Yi è associato un vettore di m valori osservati x1,i, ..., xm,i di variabili esplicative (note anche come variabili indipendenti, variabili predittive, caratteristiche, ecc.). Alcuni esempi:
- I risultati osservati potrebbero essere "ha la malattia A, ha la malattia B, ha la malattia C, non ha nessuna delle malattie" per un insieme di malattie rare con sintomi simili, e le variabili esplicative potrebbero essere caratteristiche dei pazienti ritenute pertinenti (sesso, razza, età, pressione sanguigna, indice di massa corporea, presenza o assenza di vari sintomi, ecc.).
- I risultati osservati sono i voti delle persone per un dato partito o candidato in un'elezione con più di 2 opzioni e le variabili esplicative sono le caratteristiche demografiche di ciascuna persona (ad esempio sesso, razza, età, reddito, ecc.).
Il modello probit multinomiale è un modello statistico utilizzabile per predire il probabile esito non osservato di un esperimento multifattoriale, date le variabili esplicative associate. Nel processo, il modello cerca di spiegare l'effetto relativo di diverse variabili esplicative sui diversi esiti.
Formalmente, i risultati Yi possono essere descritti come dati distribuiti categoricamente, in cui ogni valore di risultato h per l'osservazione i si verifica con una probabilità non osservata pi,h specifica per l'osservazione i in questione perché determinata dai valori delle variabili esplicative associate a tale osservazione. Vale a dire:
o equivalentemente
per ciascuno dei K possibili valori di h.
Modello con variabili latenti
modificaIl probit multinomiale è spesso scritto in termini di modello con variabili latenti:
dove
allora
ossia,
Si noti che questo modello consente una correlazione arbitraria tra le variabili di errore, quindi non rispetta necessariamente la proprietà di indipendenza delle alternative irrilevanti.
Quando è la matrice identità (tale che non vi sia correlazione o eteroschedasticità), il modello viene detto probit indipendente.
Stima
modificaPer i dettagli su come vengono stimate le equazioni[2], si veda la voce Modello Probit.
Note
modifica- ^ Luiz Paulo Fávero e Patrícia Belfiore, Chapter 14 - Binary and Multinomial Logistic Regression Models, Academic Press, 2019, pp. 539–615, DOI:10.1016/b978-0-12-811216-8.00014-8, ISBN 978-0-12-811216-8.
- ^ (EN) Yosef Sheffi, Randy Hall e Carlos Daganzo, On the estimation of the multinomial probit model, in Transportation Research Part A: General, vol. 16, n. 5-6, 1982-09, pp. 447–456, DOI:10.1016/0191-2607(82)90071-1.
Riferimenti
modifica- William H. Greene, Econometric Analysis, Seventh, Pearson Education, 2012, pp. 810–811, ISBN 978-0-273-75356-8.