martedì 28 aprile 2026

Token Budget 2.0

Mi chiedo spesso cosa spinga i grandi Guru dell’AI, i multimiliardari che guidano le aziende più potenti del pianeta, a rilasciare dichiarazioni e interviste con una frequenza quasi quotidiana. Podcast, conferenze, keynote, panel, salotti televisivi, apparizioni pubbliche di ogni tipo. Una presenza costante che contrasta in modo curioso con la narrazione che amano fare di sé stessi, uomini interamente assorbiti dal lavoro, impegnati sette giorni su sette, dodici o quattordici ore al giorno, interamente votati alla costruzione del futuro.

Quello che colpisce non è tanto l’annuncio di nuove funzionalità, di sistemi sempre più intelligenti e dell’AGI dietro l'angolo.  Ma la loro dedizione a formulare scenari sociali, a prefigurare mondi possibili, a descrivere traiettorie inevitabili di un domani che, peraltro, cambia ogni settimana e da tempo dimostra di essere molto meno governabile e prevedibile di quanto loro cerchino di farci credere.

In una delle ultime dichiarazioni, Jensen Huang CEO di NVIDIA, al GTC 2026 ha voluto sorprendere con la sua tipica umile saggezza con una teoria che merita attenzione. Secondo Jensen se si assegna agli ingegneri un “token budget”, cioè un plafond di accesso ai modelli AI, questi (gli ingegneri) diventano più produttivi. Il suo suggerimento, per farla semplice, è di ampliare il pacchetto di assunzione, non solo con benefit tradizionali, ma anche con una quota di capacità computazionale personale, per far felice il dipendente che avrà a disposizione strumenti per lavorare meglio, ovvero essere più efficiente.

Ma se un ingegnere, grazie a quegli strumenti, produce il doppio, riduce i tempi, accelera i processi e aumenta la qualità dell’output, chi è che beneficia realmente di quel salto di produttività? Il lavoratore, che forse termina prima il proprio compito, oppure l’azienda, che ottiene più valore dalla stessa persona, nello stesso tempo, con lo stesso stipendio?

Ma i token sono un benefit o uno strumento di lavoro?

Il trapano non è welfare, è mezzo di produzione. Una cazzuola migliore non è una forma di partecipazione agli utili. Uno strumento che incrementa la produttività è, prima di tutto, un investimento dell’impresa, anzi quasi un dovere a favore del proprio business.

Ma con l’AI tutto cambia, o meglio con l’AI tutto si può giustificare, anche trasformare ciò che serve all’azienda in ciò che viene concesso al dipendente. Non ti aumento lo stipendio, ma ti assegno un plafond, non ti riconosco una quota del maggior valore creato, ma ti concedo con generosità accesso a risorse che userai per crearne ancora di più. Converto salario in permesso d’uso degli strumenti, guadagni di meno, ma fatichi di meno.

Il paradosso è che l’idea, in sé, non sarebbe nemmeno sbagliata. Semplicemente è applicata al soggetto meno interessante e meno interessato.

Per uno studente brillante un budget AI può valere molto più di un piccolo contributo monetario. Per una startup in fase iniziale, mille euro di capacità computazionale possono essere più utili del pari valore in finanziamento.

In tutti questi casi, il valore percepito da chi riceve è altissimo, mentre il costo è relativamente marginale per chi eroga il servizio. Sarebbe una forma intelligente di sostegno al talento, all’innovazione diffusa, alla mobilità tecnologica.

Ma questa ipotesi, naturalmente, è molto meno scenografica del raccontare il token budget come nuovo benefit executive per knowledge worker già assunti e perfettamente integrati nel sistema.

Ma fermiamoci un attimo e facciamo un salto indietro nel tempo, corsi e ricorsi storici si ripresentano.

Fine anni Settanta, secolo scorso, un altro mondo. Io studente di informatica, curioso, tanta voglia di scoprire, di sperimentare, di imparare facendo.

Con il mio pacco di schede perforate ingombrante e pesante, tenuto insieme da un elastico, con la paura che si aprisse, per non dover mettere di nuovo in sequenza centinaia di schede. Dentro quelle scatole di cartone c’erano programmi scritti in FORTRAN IV, non prompt nè agenti conversazionali, ma semplici programmi, formule e istruzioni.

E sempre alla ricerca di un ente, un centro di calcolo, un professore disponibile, ma soprattutto di un dipartimento o un corso che mi consentisse di usare per qualche minuto il mainframe. Ciò che oggi chiamiamo “compute”, allora si chiamava “tempo macchina”, e non era né abbondante né gratuito, anzi una risorsa preziosissima e poco disponibile per chi studiava.

Il debug era un lusso, non esisteva l’idea del “provo, vedo cosa succede e poi correggo”. Si ragionava sull’algoritmo, si verificavano le istruzioni, si ricontrollavano i dati e le relative strutture, si cercavano errori di sintassi con attenzione quasi artigianale. E solo dopo si perforavano le schede, si preparava il mazzo e lo si consegnava agli operatori con il camice bianco.

E dopo una attesa di qualche ora arrivava il listing su carta continua, con quell’odore inconfondibile di inchiostro e cellulosa riscaldata. Talvolta il responso consisteva in una sola riga crudele: “Syntax Error” alla scheda XXX". Altre volte il job era terminato in errore ancora prima di cominciare “ABEND” (lo ricordo ancora)

Così come ricordo bene quelle righe iniziali di controllo, quasi formule liturgiche di un’epoca tecnica:

Contenuto dell’articolo

Il GO.SYSIN DD era come il ciak del cinema e quell’X4Y76 il codice di addebito del tempo di CPU (quello prezioso, centellinato)

Siamo tornati lì, al costo computazionale erogato come gesto di generosità.

E’ divertente questo presente dove ci viene raccontato come frontiera innovativa il ritorno di un principio molto antico: consumo misurato, accesso contingentato, produttività contabilizzata a gettone.

Nel 1978 l’errore di una virgola costava tempo macchina, nel 2026 l’errore di un prompt costa token. Passa il tempo, cambiano i termini, ma resta il contatore.

Se un’azienda degli anni Ottanta avesse detto a un candidato: “La nostra offerta prevede stipendio competitivo e 1.200 secondi di CPU al mese”, sarebbe sembrata una caricatura. Oggi si può proporre un pacchetto composto da RAL, bonus e milioni di token, e la cosa viene presentata come innovazione manageriale.

La verità è probabilmente più semplice e meno epica. Ogni epoca inventa il lessico con cui rende desiderabile, quasi un privilegio quello che in realtà è uno strumento di lavoro. Utile per chi lo utilizza ma di estremo valore per chi lo concede.

Ho passato la giovinezza a cercare minuti di CPU per imparare qualcosa. Non immaginavo che mezzo secolo dopo la “token economy” avrebbe riesumato la mia vecchia “CPUtime economy” arricchendola di quel fascino da far dimenticare la RAL.

What’s next?