Corso di
TRASPORTI E TERRITORIO e TEORIA E TECNICA DELLA
CIRCOLAZIONE
Calibrazione dei modelli di utilità
aleatoria ed esempi di modelli di
scelta del percorso
DOCENTI Agostino Nuzzolo (nuzzolo@ing.uniroma2.it)
Antonio Comi (comi@ing.uniroma2.it)
Pierluigi Coppola (coppola@ing.uniroma2.it)
Umberto Crisalli (crisalli@ing.uniroma2.it)
1
Introduzione
• Costruzione di un modello di domanda:
-
Definizione della forma funzionale (ad es. Logit)
Attributi (funzione utilità media o sistematica)
Stima dei parametri (beta)
Validazione
Capacità di riprodurre le scelte effettuate dal campione (test informali e test
statistici)
• E’ un processo iterativo trial-and-error
Specificazione
Validazione
Stima dei
parametri
2
Specificazione del modello
• Scegliere la forma funzionale
- trattabilità computazionale
Logit, Nested-Logit vs. Probit, Mixed-Logit, etc.
- modelli utilizzati in casi analoghi (es. modelli di scelta
modale)
- aspettative a priori sulla “indipendenza” o meno dei residui
aleatori (matrice varianza-covarianza)
AUTO
BUS
TRAM
3
Matrice varianza-covarianza
• E’ una matrice (simmetrica) che riporta sulla diagonale la varianza dei
residui aleatori delle diverse alternative e nelle altre celle i valori della
covarianza tra i residui aleatori di coppie di alternative
• A seconda dell’ipotesi sulla matrice varianza-covarianza dei residui
aleatori, possiamo avere diverse forme funzionali del modello, ad es.
Modello Logit: omoschedastico e a covarianza nulla 
2
0
 0
0
2
0
0
0
2
Modello Nested-Logit: si introduce una covarianza tra gruppi di
2
0
alternative, ad es. tra i modi di trasporto collettivo
  0
0
0
 2  COL
 COL  2
Modello Probit: si introduce l’eteroschedasticità e la covarianza tra tutte
2
alternative
 Auto
 AB  AT
   AB
 AT
2
 Bus
 COL
2
 COL  TRAM
4
Specificazione del modello
• definire gli attributi, Xk, del modello:
– Tipologia di attributi
o Attributi di livello di servizio, socio-economici, del sistema di attività,…
o Attributi specifici o generici
o Attributi Specifici dell’Alternativa (Alternative Specific Constant, ASC)
– evitare correlazione tra attributi (collinearità) !
– attenzione all’applicazione e agli usi del modello
– attributi non lineari (es. funzione di utilità sistematica lineare a
tratti)
V
2
1
se X k  s
 1  X k
V 
  1  s   s  ( X k  s ) se X k  s
5
Soglia «s»
Xk
Metodo dei minimi quadrati
• S’individua il vettore di parametri che minimizza il quadrato
delle differenze tra probabilità da modello e percentuali
osservate:
 LSM  arg min LSM (  )  arg min  j=1...J p ( j )  pˆ ( j )
i
i
2
essendo:
j
J
pi(j)
pˆ i
la generica alternativa di scelta
il numero di alternative disponibili
la probabilità da modello dell’alternativa j per l’utente i
la percentuale con cui l’alternativa j è scelta nel campione dall’utente i
• Tale vettore dei beta massimizza la capacità del modello di
riprodurre le percentuali aggregate osservate nel campione
6
Metodo della massima verosimiglianza
• Funzione di Likelihood (verosimiglianza)
L() =i=1...n pi[j(i)](Xi,)
-
n, numerosità del campione
i, utente generico del campione
p[j(i)], probabilità (da modello) dell’alternativa j(i) scelta
effettivamente dall’utente i (nel campione)
• S’individua il vettore di parametri che massimizza il valore
della funzione di verosimiglianza:
 ML  arg max ln L(  )  arg max i=1...nln pi  ji Xi ,  
• Tale vettore dei beta massimizza la probabilità di osservare
tramite il modello le scelte effettuate dal campione
7
Metodo della massima verosimiglianza
Esempio
n=3
utente
1
2
3
L   
p  A 
j=A,B
j(i)
A
A
B
C Ai
3
2
4
exp  C A 
exp  C A   exp  C B 
C Bi
5
1
3
exp  3   
exp  2   
exp  3   


exp  3     exp  5    exp  2     exp    exp  3     exp  4   
8
VALIDAZIONE DI UN
MODELLO DI DOMANDA
• test, informali sui coefficienti di un modello
• test, formali sui coefficienti di un modello
• test sulla bontà di interpolazione o (“goodness of
fit”)
• analisi dell’elasticità (risposta del modello in fase di
applicazione)
9
VALIDAZIONE DI UN
MODELLO DI DOMANDA
TEST INFORMALI SUI COEFFICIENTI DI UN MODELLO
• verifica della “ragionevolezza” dei segni dei coefficienti
(es. <0 per tempi o costi monetari >0 per la disponibilità di automobili
nell’utilità del modo “auto” di un modello di scelta modale o per la
quantità di esercizi commerciali nel modello di scelta della destinazione).
• verifica dei rapporti fra i coefficienti di attributi diversi
(es. t/c =VOT -«Value of Time» - può essere confrontato con risultati di
altre calibrazioni e aspettative sulla disponibilità a pagare degli utenti,
valore delle ASC, …)
• verifica del valore relativo di alcuni coefficienti
(es. |tempo a piedi| > |tempo a bordo|)
10
VALIDAZIONE DI UN
MODELLO DI DOMANDA
TEST FORMALI SUI COEFFICIENTI DEL MODELLO
TEST T-STUDENT SUI SINGOLI COEFFICIENTI : serve a rigettare l’ipotesi che i valori
stimati dei beta siano statisticamente
uguali da zero
A)
IPOTESI NULLA:
STATISTICA UTILIZZATA:
H0: k =0
t
 kML
Var (  kML )1 / 2
t_student con n-k gradi di libertà
con
n= numerosità del campione
k= n° dei coefficienti stimati
(per n >30 t student  normale standardizzata)
Se t è maggiore di 1,96 l’ipotesi può
essere rigettata con una probabilità
di errore del 5%, e quindi il valore
stimato è considerato significativo
11
TEST FORMALI SUI COEFFICIENTI DEL MODELLO
Esempi
Se |t| > 1,96  la probabilità che l’ipotesi nulla H0 sia vera è del 5%
Se |t| > 1,29  la probabilità che l’ipotesi nulla H0 sia vera è del 20%
Tavola della variabile normale standard
z
12
VALIDAZIONE DI UN
MODELLO DI DOMANDA
STATISTICHE E TEST SULLA BONTÀ DELL’ACCOSTAMENTO
DEL MODELLO (GOODNESS OF FIT)
%_RIGHT
n
% _ right 

i 1
n
i
i
1 se j (i )  jmax
i  
i
0
j
(
i
)

j
max

essendo:
n
jimax
j(i)
la numerosità del campione
l’alternativa di massima utilità da modello, per l’utente i
l’alternativa scelta effettivamente dall’utente i
13
VALIDAZIONE DI UN
MODELLO DI DOMANDA
STATISTICHE E TEST SULLA BONTÀ DELL’ACCOSTAMENTO
DEL MODELLO (GOODNESS OF FIT)
STATISTICA RHO_QUADRO
ML
ln
L
(

)
 2  1
ln L(0)
ln L(  )  N 
2
  1
ML
ln L(0)
con N è il numero dei coefficienti 
Tale statistica misura la bontà del modello nel riprodurre le scelte
fatte dal campione:
 2  1 Perfetta capacità riproduttiva del modello
 2  0 Capacità riproduttiva del modello nulla
14
INDAGINI RP E INDAGINI SP
Indagini RP (Revealed Preference o Preferenze Rivelate)
• indagini sui comportamenti effettivi (rivelati) dagli utenti in un
contesto reale
• Si rilevano le scelte che gli utenti hanno realmente effettuato (Ad
esempio quale percorso o quale modo di trasporto hanno scelto per
spostarsi su una determinata relazione OD)
Indagini SP ( Stated Preference o Preferenze Dichiarate)
• indagini sui comportamenti dichiarati dagli utenti in contesti ipotetici
• Si sottopongono all’intervistato alcune alternative di viaggio e si
chiede di scegliere qual è per lui la migliore
15
Esempio di indagine RP
FINALITÀ DELL’INDAGINE
stima della domanda interna
METODOLOGIA D’INDAGINE
indagine telefonica
T.M.T Pragma S.r.l. – Pragma S.r.l. – Studio Market Selector S.a.s
QUESTIONARIO INDAGINE TELEFONICA – 7.00 / 9.00
___________________________________________________________________________________
___
Buongiorno/sera sono della…….. Il nostro Istituto sta svolgendo un‘indagine per conto del
Comune di Roma sugli spostamenti in città. Potrei parlare con una persona della sua famiglia
di…(sesso) e di età compresa tra… e…?
Le preciso che in base alla legge 675 sulla tutela della privacy, lei è libero di accettare l’intervista o
di interromperla nel momento in cui lo ritenga opportuno. Le garantisco che qualsiasi
informazione ci verrà data, verrà trattata in forma strettamente riservata e senza l’uso dei dati
personali.
__________________________________________________________________________________
D. 1
SESSO
1
2
D. 2
Uomo
Donna
QUAL E’ LA SUA ETA’?
|__|__| anni
D. 3
NELLA GIORNATA DI IERI LEI ERA A ROMA ?
1
2
Si
No
(passare a dom. 8)
D. 3.1 E SEMPRE NELLA GIORNATA DI IERI LEI HA EFFETTUATO SPOSTAMENTI IN
CITTA’ CHE ABBIANO AVUTO INIZIO O TERMINE TRA LE ORE 7.00 E LE ORE
9.00?
1
2
D. 4
Si
No
(passare a dom. 8)
DA QUANTE PERSONE E’ COMPOSTA LA SUA FAMIGLIA (LEI COMPRESA/O) ?
|__|__| N ° persone
D. 5
TRA LE PERSONE DELLA SUA FAMIGLIA QUANTE HANNO LA PATENTE DI
GUIDA?
|__|__| persone
D. 6
E LEI IN PARTICOLARE HA LA PATENTE DI GUIDA ?
1
2
Si
No
Esempio di indagine RP
FINALITÀ DELL’INDAGINE
stima della domanda interna
METODOLOGIA D’INDAGINE
indagine telefonica
PENSANDO SEMPRE NELLA GIORNATA DI IERI ALLA FASCIA ORARIA TRA LE ORE
7.00 E LE ORE 9.00, VORREI RICOSTRUIRE I SUOI SPOSTAMENTI. PER SPOSTAMENTO
S’INTENDE OGNI VOLTA CHE SI E’ MOSSO PER UNO SCOPO SPECIFICO.
D.7
A CHE ORA HA AVUTO INIZIO IL PRIMO SPOSTAMENTO?
|___|___| : |___|___|
ora
minuti
D.7.1 DA QUALE INDIRIZZO HA AVUTO INIZIO QUESTO SPOSTAMENTO (indirizzo per
esteso comprensivo di numero civico)
Comune :
1
Roma
2
Fuori Roma ___________________
(registrare il Comune per gli spostamenti successivi al primo)
Via/Piazza/Largo_____________________________________ N° civico: ____________
D.7.2 IN QUALE COMUNE ED INDIRIZZO HA AVUTO TERMINE QUESTO
SPOSTAMENTO? (comune ed indirizzo per esteso comprensivo di numero civico)
Comune :
1
Roma
2
Fuori Roma ___________________
(Non registrare l’indirizzo se lo spostamento ha avuto termine fuori Roma)
Via/Piazza/Largo_____________________________________ N° civico: ____________
D.7.3 A CHE ORA E’ GIUNTO A DESTINAZIONE (nel comune e/o all’indirizzo citato a dom.
7.2)?
|___|___| : |___|___|
ora
minuti
D. 7.4 QUALE ERA IL MOTIVO DI QUESTO SPOSTAMENTO?
1
2
3
4
5
6
7
8
9
10
11
12
Andare al posto di lavoro
Visita a clienti/affari consegne
Andare a scuola
Acquisti, commissioni personali
Visita a parenti/amici
Visite mediche/cure personali
Svago (tutti escluso culturale), Sport (spettatore e/o praticante)
Svago culturale (cinema, teatro, museo)
Accompagnamento/prelevamento persone
Parrucchiere, barbiere, estetica
Ritorno all’abitazione abituale
Altri motivi
D.7.5. CON QUALE FREQUENZA EFFETTUA QUESTO SPOSTAMENTO ?
|___|___| volte alla settimana
|___|___| volte al mese
|___|___| volte all’anno (codificare con 1 volta all’anno lo spostamento occasionale/ prima volta)
Esempio di indagine RP
FINALITÀ DELL’INDAGINE
stima della domanda interna
METODOLOGIA D’INDAGINE
indagine telefonica
D.7.6. QUALE MEZZO/I HA UTILIZZATO PER EFFETTUARE QUESTO SPOSTAMENTO
? SE HA USATO PIU’ DI UN MEZZO LI INDICHI IN SEQUENZA
1°mezzo
2°mezzo
3°mezzo
4°mezzo
|___|___|
|___|___|
|___|___|
|___|___|
1
A piedi
2
Bicicletta
3
Motocicletta ciclomotori (conducente)
4
Motocicletta ciclomotori (passeggero)
5
Auto privata (conducente)
6
Auto privata (passeggero)
7
Veicolo merci ad uso promiscuo
8
Taxi
9
Autobus (ATAC,COTRAL)
10
Tram
11
12
Metropolitana
Altro mezzo (treno FS, aereo)
D.7.7. (Per tutti coloro con cod.3, 5 e 7 a dom. 7.6, eccetto quando a dom.7.2 la risposta è uguale
a 2 (fuori Roma) e a dom. 7.6 è stato citato solo cod. 3 o 5 o 7)DOVE HA
PARCHEGGIATO?
1
Strada o area pubblica gratuita
2
Strada o area pubblica a pagamento
3
Posto auto privato di proprietà
4
Posto auto privato a pagamento
5
Posto auto privato gratuito o riservato azienda
6
Autorimessa
D.7.8. (Se ha usato più mezzi) IN QUALE INDIRIZZO HA PRESO IL SECONDO MEZZO? ED
IL TERZO ?
Indirizzo per esteso secondo mezzo
Via/Piazza/Largo_____________________________________ N° civico: ____________
Indirizzo per esteso terzo mezzo
Via/Piazza/Largo_____________________________________ N° civico: ____________
ATTENZIONE PORRE LE DOM. DA 7 A 7.8 PER OGNI SPOSTAMENTO EFFETTUATO
SUCCESSIVAMENTE AL PRIMO CONTROLLANDO CHE L’INDIRIZZO DI ORIGINE
COINCIDA CON QUELLO DI DESTINAZIONE DELLO SPOSTAMENTO PRECEDENTE
Esempio di indagine SP
CAMPIONI INDIVIDUALI E COLLETTIVI
Le osservazioni che costituiscono il campione con cui si calibra un
modello, possono essere relative a:
•Uno stesso individuo che effettua le proprie scelte ad esempio su una
stessa relazione Origine-Destinazione in giorni diversi (Campioni
individuali)
•Più individui che effettuano le proprie scelte, ad esempio su relazioni
OD diverse e in giorni diversi (Campioni collettivi)
20
Corso di
TRASPORTI E TERRITORIO e TEORIA E TECNICA DELLA
CIRCOLAZIONE
Esempi di modelli di scelta del
percorso
DOCENTI Agostino Nuzzolo (nuzzolo@ing.uniroma2.it)
Antonio Comi (comi@ing.uniroma2.it)
Pierluigi Coppola (coppola@ing.uniroma2.it)
Umberto Crisalli (crisalli@ing.uniroma2.it)
21
Example of path alternatives
Frascati-Rome with Desired Arrival Time at 9:30 am
Path 1
Attributes
waiting time
on board time rail and metro
on board time bus
access and egress walking time
late arrival time
early arrival time
number of transfers
total travel time
min
8
48
23
16
18
0
3
100
values [min]
max
18
56
28
16
30
0
3
112
average
14
52
25
16
25
0
3
107
Path 2
Attributes
waiting time
on board time rail and metro
on board time bus
access and egress walking time
late arrival time
early arrival time
number of transfers
total travel time
min
7
37
41
8
18
0
3
100
values [min]
max
19
46
50
8
30
0
3
112
average
13
41
45
8
25
0
3
107
Path 3
Attributes
waiting time
on board time rail and metro
on board time bus
access and egress walking time
late arrival time
early arrival time
number of transfers
total travel time
min
10
55
24
14
26
0
3
108
values [min]
max
33
60
32
14
55
0
3
137
average
22
58
27
14
38
0
3
120
Path 4
Attributes
waiting time
on board time rail and metro
on board time bus
access and egress walking time
late arrival time
early arrival time
number of transfers
total travel time
min
5
44
43
6
29
0
3
111
values [min]
max
27
50
53
6
49
0
3
131
average
18
47
47
6
36
0
3
118
Frascati
Railways station
Train
Capannelle
Railways station
Bus
Cinecittà
Metro station
Ciampino
Railways station
Metro A
Bus
Sempione
Bus stop
Piazza
Sempione
Termini
Metro station
Bus
Anagnina
Metro station
Tor Vergata
University of Rome
Foot
Metro A
Metro B
Conca D’Oro
Metro station
Foot
22
Path choice behaviour assumption
The user compares the alternative paths using a personal
path utility function, for example:
t
ékù = b × ED + b × AE + å [ b
VOD
×TWm,k + bOB,m ×OBm,k + bCFW ,m ×CFWm,k + b NT ,m × NTm,k ]
,t TT ë û
ED
k
AE
k
TW ,m
i
m
where:
V is the Path Utility of path k for user i
EDk is the Early or Late arrival time
(i.e. the difference between the desired and the actual arrival time);
AEk is the sum of access and egress times;
TWm,k is the waiting time of transit service m;
OBm,k is the on-board time;
CFWm,k is the average on-board crowding degree;
NTm is the number of transfers;
i are the personal model parameters.
Tor Vergata
University of Rome
23
Which performances are required to the
individual path choiche models?
• t-student test: H0 : k = 0;
• rho-squared :
 kML
t
1/ 2
Var  kML 
ln L(  ML )
 1
lnL(0)
2
• adjusted rho-squared
ln L ML   N 
  1
ln L(0)
2
N number of model parameters
• %-of- right = percentage of observations for which the choosen
alternative is the one of maximum utility ( or the second best)
Tor Vergata
University of Rome
24
Example of Multinomial logit parameters
estimated with 150 SP observations
• Esempio di questionario
EXP
1
1
1
2
2
2
3
3
3
Ora
Partenza
500
500
500
500
500
500
500
500
500
Ora
Arrivo
571
562
571
576
565
569
621
565
586
T_
Viaggio_Tot
71
62
71
76
65
69
121
65
86
Tor Vergata
University of Rome
Tempo
Piedi
9
14
6
9
14
6
9
14
6
Attesa_
Bus
2
4
6
2
1
8
1
1
6
Viaggio
Bus
48
29
34
45
38
31
83
38
35
Viaggio
Metro
0
0
15
0
0
15
0
0
16
Tempo
Trasb_Bus
12
15
3
20
12
1
28
12
13
Tempo
Trasb_Metro
0
0
7
0
0
8
0
0
10
N
N
SCELTA
Trasb_Bus Trasb_Metro
2
0
0
1
0
0
1
2
0
2
0
0
1
0
0
1
2
0
2
0
0
1
0
0
1
2
0
25
Example of Multinomial logit parameters
estimated with 150 SP observations
USER
Waiting
Model type time (total)
βwaiting
User A
User B
User C
User D
User E
User F
Average
On-board On-board
On-board Early and late
%-of-right (1st)
time
time
time (bus) arrival time %-of-right incl. 1st+2nd
(metro)
(train)
best
βrailway
βmetro
βbus
βΔ(early/late)
logit
( = 0.71)
logit
2
( = 0.67)
logit
2
( = 0.60)
logit
2
( = 0.90)
logit
2
( = 0.79)
logit
2
( = 0.69)
-0.44
t =-4.06
-1.22
t =-5.50
-0.073
t =-3.31
-0.773
t =-3.65
-0.497
t =-5.24
-0.105
t =-1.71
-0.08
t =-1.3
-0.43
t =-3.12
-
-0.34
t =-1.64
-0.83
t =-2.80
-
-
-
logit
( = 0.51)
-0.219
t = -11.59
2
2
Tor Vergata
University of Rome
-0.43
t =-3.24
-0.59
t =-3.31
-0.265
t =-6.81
-1.10
t =-3.24
-0.261
t =-4.90
-0.516
t =-6.40
-0.026
t =-0.14
-0.29
t =-3.41
-0.57
t =-3.27
-0.081
t =-2.58
-0.074
t =-0.67
-
-0.179
t =-1.73
-0.169
t =-2.90
84%
97%
81%
98%
64%
100%
95%
100%
88%
100%
90%
96%
-0.062
t = -3.96
-0.08
t = -1.58
-0.18
t = -6.29
-0.036
t = -2.29
76%
90%
26
Performances
models
of
Multinomial
Personal model
Applied to…
User A
User B
User C
User D
User E
User F
%-of-right
(1st)
84%
81%
64%
95%
88%
90%
Tor Vergata
University of Rome
%-of-right
(2nd)
97%
98%
100%
100%
100%
96%
logit
Average model
%-of-right
(1st)
83%
51%
65%
91%
79%
85%
%-of-right
(2nd)
98%
77%
89%
100%
95%
96%
27
Example of path alternatives
Urban O-D pair
Path 1
Attribute
Waiting time the first bus (minutes)
On board (bus; minutes)
On board metro minutes)
Bus Transfer Time (minutes)
Metro Transfer Time (minutes)
Number of transfer bus
Number of transfer metro
On foot Time (minutes)
Total Travel time (minutes)
min
1
33
0
9
0
2
0
9
62,00
Path 3
Attribute
Waiting time the first bus (minutes)
On board (bus; minutes)
On board metro minutes)
Bus Transfer Time (minutes)
Metro Transfer Time (minutes)
Number of transfer bus
Number of transfer metro
On foot Time (minutes)
Total Travel time (minutes)
min
1
13
9
1
5
1
2
6
52
values [min]
Path 2
Max Average
Attribute
8
3
Waiting time the first bus (minutes)
83
43
On board (bus; minutes)
0
0
On board metro minutes)
41
22
Bus Transfer Time (minutes)
0
0
Metro Transfer Time (minutes)
2
2
Number of transfer bus
0
0
Number of transfer metro
9
9
On foot Time (minutes)
121,00
76,47
Total Travel time (minutes)
values [min]
min Max Average
1
7
3
22 38
27
0
0
0
0
27
13
0
0
0
1
1
1
0
0
0
14 14
14
40 72
57
values [min]
Max Average
29
9
73
30
16
13
22
10
16
9
1
1
2
2
6
6
121
76
Tor Vergata
University of Rome
28
Example of Multinomial logit parameters
estimated with 150 SP observations
Urban O-D pair
Attributes
Travel time
(total)
Parameter
User A
-0.199
User B
Average
-0.235
-0.062
(-5.11)
-0.151
(-1.78)
-0.187
-2.558
(-5.24)
-1.175
(-10.67)
-0.339
(-6.24)
0.85
75%
(2.10)
0.46
72%
(-2.31)
0.41
70%
100%
94%
94%
(-7.86)
Time on foot
On-board and
transfer time
ASA (metro)
2
%-of-right
%-of-right
including the
1st+2nd best
Tor Vergata
University of Rome
29
Performances of Multinomial logit
models
Urban O-D pair
Personal model
Applied to…
User A
User B
Tor Vergata
University of Rome
%-of-right
(1st)
75%
72%
%-of-right
(2nd)
100%
94%
Average model
%-of-right
(1st)
74%
62%
%-of-right
(2nd)
97%
94%
30