Prevedere pochi è diverso: Parte 2

Blog

Prevedere pochi è diverso: Parte 2

Questa è una storia in due parti sulla gestione delle previsioni di vendita che riguardano sia gli articoli in rapida che in lenta evoluzione. Trova la Parte 1 qui.

Quanto può essere precisa una previsione di vendita?

Il meccanismo di annullamento delle fluttuazioni assicura che le previsioni granulari su bassa scala siano più imprecise, rumorose e incerte di quelle aggregate e a grana grossa su larga scala: siamo migliori (in termini relativi) nel prevedere il numero totale di pretzel per un'intera settimana che per un singolo giorno.

Finora, abbiamo sostenuto qualitativamente questa relazione, ma possiamo fare un'affermazione quantitativa sul livello di precisione che possiamo idealmente aspettarci, per i diversi tassi di vendita previsti? Per fortuna, questo è davvero possibile, in modo universale e indipendente dal settore. Nel nostro precedente post sul blog sul bias del senno di poi nella valutazione delle previsioni abbiamo sostenuto che le previsioni deterministiche e perfettamente certe non sono realistiche: consideriamo la nostra previsione di 5 pretzel di cui sopra. A livello di singoli clienti, una previsione deterministica di 5 si traduce in 5 clienti che, qualunque cosa accada, acquisteranno un pretzel il giorno previsto. Ma non solo daremmo per scontato di conoscere questi 5 clienti estremamente bene (forse meglio di quanto conoscano loro stessi, chi non ha deciso spontaneamente di accaparrarsi o non accaparrarsi un pretzel?), ma escludiamo anche totalmente la possibilità che qualsiasi altro cliente acquisti un pretzel. Un tale grado di certezza è chiaramente impossibile. Lasciando un po' di incertezza, diciamo, 6 clienti con una probabilità di 5/6=83,3% ciascuno di acquistare un pretzel, si ottiene quella che i matematici chiamano una distribuzione binomiale nel numero totale di pretzel venduti: la probabilità di vendere 6 pretzel è (5/6)^6, la probabilità di non vendere nessuno è (1/6)^6, la probabilità di vendere tra uno e cinque contiene i rispettivi coefficienti binomiali. Tuttavia, conoscere 6 clienti che acquisteranno con alta probabilità non è ancora realistico. Anche ipotizzare 10 clienti con il 50% di probabilità di acquistare un pretzel ciascuno è una sfida. Possiamo andare avanti e aumentare ulteriormente il numero di potenziali clienti diminuendo la loro probabilità di acquistare un pretzel, seguendo il percorso verso la distribuzione di Poisson limitante: Nel limite di Poisson, assumiamo una base clienti illimitata, in cui ogni cliente ha una probabilità di acquisto infinitamente piccola, mentre abbiamo il controllo sul prodotto del numero di clienti e della probabilità di acquisto: il tasso di vendita. La distribuzione di Poisson scala in modo coerente: se le vendite giornaliere seguono una distribuzione di Poisson di media 5, le vendite settimanali seguono una distribuzione di Poisson di media 35. La distribuzione di Poisson è il "gold standard" per le previsioni di vendita: supponiamo di conoscere tutti i fattori che influenzano le vendite di un determinato prodotto, ma non abbiamo accesso ai dati dei singoli clienti che ci permetterebbero di fare affermazioni più forti sul comportamento di acquisto dei singoli clienti. Quando la precisione della previsione è buona come previsto dalla distribuzione di Poisson, in genere si è raggiunto il limite di ciò che è possibile.

Una distribuzione di Poisson acquisisce solo un singolo parametro, il tasso di vendita; L'ampiezza della distribuzione, la diffusione dei risultati probabili intorno alla media, è completamente determinata dalla sua forma funzionale, che riflette l'autoconsistenza. In altre parole, il grado di precisione raggiungibile dipende solo dal tasso di vendita previsto all'interno dell'intervallo di tempo considerato: le vendite di 5 pretzel previsti al giorno seguono la stessa distribuzione delle vendite di 5 torte di compleanno previste a settimana, 5 panini previsti all'ora o 5 torte nuziali previste a trimestre. In altre parole: l'errore relativo ottenibile nel miglior caso è determinato in modo completo e univoco dal valore previsto stesso!

Perché gli slow seller ultrafresh non possono essere offerti in modo sostenibile

Tenendo presente questa intuizione sulla scala degli errori, torniamo alla domanda sul perché il cetriolo di mare fresco non viene offerto ovunque nel mondo: mostriamo la distribuzione prevista delle vendite al giorno per una perfetta previsione di Poisson di un cetriolo di mare al giorno:

forecasting-few-is-different-part-2-body-01

Sperimenteremo il 37% dei giorni senza alcuna domanda, il 37% dei giorni vedrà un appassionato di frutti di mare desideroso di acquistare un cetriolo di mare crudo e nel 26% dei giorni vedremo una domanda di due o anche di più. Quanti cetrioli di mare terremo in magazzino, visto che alla fine della giornata dobbiamo buttarli via se nessuno li compra? Se abbiamo un pezzo in magazzino, dovremo buttarlo via nel 37% dei giorni, mentre nel 26% dei giorni avremmo clienti insoddisfatti che non saranno in grado di acquistare il cetriolo di mare che intendevano. Con due pezzi in magazzino, dobbiamo buttare via almeno un pezzo dopo il 74% dei giorni: che spreco, dato che i cetrioli di mare sono protetti in molti luoghi! Chiaramente, un modello di business che mira a soddisfare la piccola domanda di cetriolo di mare crudo non è praticabile e potrebbe essere sostenuto solo se il margine fosse estremamente ampio: le persone che acquistano il cetriolo di mare crudo devono sovvenzionare tutti i giorni in cui non viene venduto alcun cetriolo di mare – e queste persone non saranno nemmeno sicure di averne uno se ne vogliono uno! In base a lievi ipotesi sul margine e sui costi di smaltimento, la giusta quantità di stock per un venditore ultra-fresco e super-lento è: zero.

Ancora una volta, tutto questo è dovuto a una scala non proporzionale: la distribuzione prevista delle vendite per una previsione di 100 cetrioli di mare freschi al giorno non è solo una versione gonfiata di quella di cui sopra per 1 cetriolo di mare al giorno, ma ha una forma diversa, proprio come un elefante non sembra un grande impala:

forecasting-few-is-different-part-2-body-02

Cattive notizie per tutti coloro che sperano di ottenere pretzel a Busan o una varietà di frutta più ampia nel nord Europa! C'è, tuttavia, una speranza: quando la domanda supera una certa soglia perché un piatto deperibile diventa alla moda, quel nuovo cibo può affermarsi in nuovi luoghi: si ottiene un buon sushi quasi ovunque sul pianeta.

Riassumendo, a causa della scala non proporzionale dell'errore di previsione, le sovrascorte e le scorte insufficienti di un prodotto - anche ipotizzando una previsione perfetta - aumentano in modo sproporzionato quando il tasso di vendita diminuisce. Di conseguenza, solo al di sopra di un certo tasso di vendita per periodo di validità è possibile offrire un determinato alimento deperibile.

Valutazione dell'errore di previsione

Ora abbiamo capito perché non possiamo aspettarci di trovare prelibatezze fresche straniere a casa, traiamo ora alcune lezioni per i data scientist e gli utenti aziendali incaricati di giudicare la qualità delle previsioni: per alti tassi di vendita previsti, le fluttuazioni casuali che fanno salire o scendere il vero valore delle vendite rispetto alla media prevista non possono essere utilizzate come scusa per qualsiasi deviazione sostanziale, E possiamo attribuire tale deviazione a un errore o a un problema effettivo nella previsione. Le idiosincrasie statistiche di cui abbiamo discusso sopra non hanno importanza. Se si prevedeva una domanda totale di 1'000'000 e un fatturato totale di 800'000, questo errore del 20% non è dovuto a fluttuazioni inevitabili, ma a una previsione distorta.

Per piccoli numeri previsti, non possiamo più attribuire in modo inequivocabile le deviazioni osservate a una previsione errata: data una previsione di uno, è abbastanza probabile che si verifichi l'osservazione 0 (che è sfatata del 100%) (con probabilità del 37%), e così è l'osservazione 2 (che è anche scontata del 100%). Giudicare se una previsione è buona o cattiva diventa molto più difficile, perché la linea di base naturale, il rumore inevitabile, è predominante.

Divideremo allora le nostre previsioni in "venditori veloci", per i quali attribuiamo le deviazioni osservate all'errore di previsione, e "venditori lenti", per i quali siamo più benevoli? Sconsigliamo questo: che dire del caso intermedio, una previsione, di, diciamo 15? Dov'è il confine tra "lento" e "veloce"? Se un prodotto diventa leggermente più popolare, cosa succede se supera quel limite e il suo giudizio di qualità previsto fa un salto improvviso? C'è una transizione continua tra "veloce" e "lento" che non mostra alcun confine naturale, come possiamo vedere in questo grafico dell'errore relativo atteso di una previsione in funzione del valore previsto (si noti la scala logaritmica sull'ascissa e che calcoliamo l'errore atteso utilizzando lo stimatore puntuale ottimale, che non è la media ma la mediana della distribuzione di Poisson):

forecasting-few-is-different-part-2-body-03

A causa di questa transizione continua, consigliamo una valutazione stratificata in base al tasso previsto, il che significa raggruppare le previsioni in contenitori con un valore previsto simile e valutare le metriche di errore separatamente per ogni contenitore. Il nostro precedente post sul blog sul bias del senno di poi spiega perché questo binning dovrebbe essere fatto in base al valore previsto e non alle vendite osservate, anche se quest'ultima sembra più naturale della prima. Per ciascuno di questi contenitori, giudichiamo se la precisione della previsione è in linea con l'aspettativa teorica (mostrata nel grafico sopra) o se si discosta in modo sostanziale. Le nostre aspettative su una previsione dovrebbero dipendere dal tasso previsto: per valori estremamente piccoli (inferiori a 0,69), la maggior parte delle vendite effettive osservate sono 0 e siamo essenzialmente "sempre completamente fuori posto" con un errore del 100% - inevitabilmente. Per un tasso di vendita previsto di 10, dovremo convivere con uno spaventoso errore relativo del 25% – nel migliore dei casi! Quando prevediamo 100=10^2, ci aspettiamo ancora un errore relativo di circa l'8%, per un tasso di 1'000=10^3, l'errore scende al 2,5%. Chiedere, ad esempio, una soglia di errore del 10% per tutti i tassi di vendita è, quindi, controproducente: la stragrande maggioranza dei venditori lenti violerà tale soglia e impegnerà le risorse per scoprire perché "la previsione è sbagliata", mentre un certo miglioramento potrebbe ancora essere possibile per i venditori veloci che rispettano la soglia e quindi non ricevono alcuna attenzione.

In pratica, lo scostamento dalla linea ideale che abbiamo tracciato sopra dipenderà dall'orizzonte di previsione (è per domani o per il prossimo anno?) e sul settore (stiamo prevedendo un noto prodotto alimentare non stagionale, o un vestito squisito non convenzionale al limite tra la moda e l'insapore?). Tuttavia, tenere conto della scala universale non proporzionale dell'errore di previsione è l'aspetto più importante che la tua metodologia di valutazione delle previsioni dovrebbe soddisfare!

Evita l'ingenua trappola del ridimensionamento, accetta e affronta strategicamente il rumore dei venditori lenti

Oltre a mettere le visite ai ristoranti locali nella lista delle cose da fare per la tua prossima vacanza, quali conclusioni dovresti trarre da questo post del blog?

Assicurarsi che la scala di aggregazione temporale impostata nella valutazione corrisponda alla scala temporale delle decisioni aziendali: poiché le fragole e i cetrioli di mare durano solo un giorno, sono pianificati per un giorno ed è appropriata una valutazione a livello giornaliero. Non è possibile compensare la domanda di fragole di oggi con le scorte eccessive di ieri o viceversa. Per gli articoli che durano più a lungo, la scala su cui si materializza realmente un errore in una decisione aziendale non è certo un giorno: se una camicia non è stata acquistata il lunedì, forse lo sarà il martedì, o due settimane dopo, non è importante per lo stock di camicie che viene ordinato ogni mese. Se nella tua valutazione incontri molti articoli con piccoli numeri previsti (<5), ricontrolla che quest'ultimo sia davvero quello rilevante, su cui viene presa una decisione di acquisto, rifornimento o altro.

Non fissare obiettivi costanti per la precisione delle previsioni su tutto il tuo portafoglio di prodotti, né in termini assoluti né in termini relativi: i tuoi venditori veloci raggiungeranno facilmente errori relativi bassi, i tuoi venditori lenti sembreranno avere difficoltà. Invece, dividi le tue previsioni in bucket con un valore di previsione simile e giudica ogni bucket separatamente. Imposta un obiettivo realistico e dipendente dalla tariffa di vendita.

Per i venditori lenti, è imperativo essere consapevoli della natura probabilistica delle previsioni e tenere conto strategicamente del grande rumore inevitabile, sia attraverso l'euristica delle scorte di sicurezza nel caso di articoli non deperibili, sia attraverso strategie di produzione su ordinazione, ad esempio per le torte nuziali.

Sebbene l'inevitabilità dell'errore di previsione nei venditori lenti possa essere irritante, è incoraggiante che i limiti della tecnologia di previsione possano essere stabiliti quantitativamente in modo rigoroso, in modo da poterne tenere conto strategicamente nelle nostre decisioni aziendali.