E-Mail: [email protected]
- Qwen 3.5 ha 397 miliardi di parametri totali.
- Attiva solo 17 miliardi di parametri per passaggio (architettura MoE).
- Copertura linguistica ampliata da 119 a 201 lingue.
- Vocabolario ampliato a 250.000 parole per codifica efficiente.
- Punteggio di 76.5 in IFBench per il ragionamento.
## Qwen 3.5: Alibaba Ridefinisce i Confini dell’IA Multimodale
Alibaba ha recentemente svelato la famiglia Qwen 3.5, segnando un’evoluzione significativa nel panorama dei modelli di intelligenza artificiale. Dopo aver introdotto Qwen3-Coder-Next, focalizzato sull’assistenza alla codifica, e Qwen Image 2.0, che ha elevato la qualità della generazione di immagini, l’azienda presenta ora Qwen 3.5, con due nuovi modelli: *Qwen3.5-397B-A17B, il primo modello open-weight, e Qwen3.5-Plus.
Il modello di punta, Qwen3.5-397B-A17B, si distingue per la sua architettura Mixture-of-Experts (MoE)*. Pur avendo 397 miliardi di parametri, ne attiva solo 17 miliardi per ogni passaggio, ottimizzando l’efficienza computazionale. Questa caratteristica permette al modello di gestire compiti complessi mantenendo velocità e costi contenuti. Un altro aspetto cruciale è la sua natura di modello vision-language nativo, progettato per elaborare testo e immagini simultaneamente.

## Architettura e Funzionalità di Qwen 3.5
Qwen 3.5 si distingue per la sua architettura eterogenea, che separa l’elaborazione di componenti visivi e linguistici. Questo approccio consente di gestire input di testo, immagini e video in modo più efficiente, raggiungendo un throughput di training vicino al 100% anche con dati multimodali misti. L’efficienza è ulteriormente incrementata dalle attivazioni sparse e da una pipeline FP8 nativa, che riduce la memoria di attivazione del 50% migliorando la velocità.
Alibaba ha inoltre sviluppato un framework di reinforcement learning asincrono scalabile per affinare continuamente il modello. Separando i carichi di lavoro di training e inferenza, il sistema migliora l’utilizzo dell’hardware, bilancia dinamicamente il carico e si riprende rapidamente dai guasti. Tecniche come la decodifica speculativa, il rollout replay e il multi-turn rollout locking migliorano ulteriormente il throughput e la stabilità, soprattutto per i workflow in stile agent.
## Performance e Versatilità
Qwen 3.5 è stato pre-addestrato con un focus su potenza, efficienza e versatilità. È stato addestrato su un mix significativamente più ampio di dati visivi e testuali rispetto a Qwen 3, con una maggiore copertura multilingue, STEM e di ragionamento. Nonostante attivi solo 17 miliardi di parametri alla volta, il modello eguaglia le prestazioni di sistemi molto più grandi. L’architettura si basa sul design Qwen3-Next, combinando MoE a maggiore sparsità con meccanismi di attenzione ibridi. La copertura linguistica è stata ampliata da 119 a 201 lingue e dialetti, mentre un vocabolario più ampio di 250.000 parole migliora l’efficienza di codifica e decodifica tra le lingue.
I benchmark mostrano che Qwen3.5-397B-A17B offre prestazioni competitive in termini di ragionamento, workflow agentic, codifica e comprensione multimodale. In particolare, ha ottenuto punteggi elevati in IFBench (76.5) e GPQA Diamond (88.4), indicando una forte comprensione e un ragionamento strutturato. Inoltre, eccelle in compiti guidati da agenti, come dimostrato dai punteggi in BFCL v4 (72.9) e Terminal-Bench 2 (52.5). La sua capacità di comprensione multimodale è evidenziata dai punteggi in OmniDocBench v1.5 (90.8) e VITA-Bench (49.7).
## Qwen 3.5: Un Nuovo Paradigma per l’Automazione
Qwen 3.5 non si limita a eccellere in una singola categoria, ma dimostra una forza equilibrata in termini di ragionamento, esecuzione agentic, codifica e comprensione multimodale. Questo equilibrio è fondamentale perché i moderni carichi di lavoro di IA non sono problemi a singolo compito. Coinvolgono strumenti, documenti, immagini, codice e workflow multi-step, e Qwen 3.5 sembra essere costruito proprio per questa realtà.
Alibaba ha ufficialmente lanciato la serie Qwen 3.5 con l’open-sourcing del primo modello, denominato ‘Qwen3.5-397B-A17B’. Questo modello, con i suoi 397 miliardi di parametri totali, utilizza un’architettura Mixture-of-Experts (MoE) che attiva solo 17 miliardi di parametri per passaggio, garantendo efficienza e velocità. Inoltre, è un modello vision-language nativo, progettato per gestire testo e immagini insieme.
## Verso un Futuro di IA Versatile e Scalabile
La famiglia Qwen 3.5 rappresenta un passo avanti verso un sistema di IA più capace e unificato. Con la sua architettura MoE ibrida, il design multimodale nativo, la copertura linguistica ampliata e le solide prestazioni in termini di ragionamento, codifica e comprensione dei documenti, Alibaba si sta chiaramente ottimizzando per i carichi di lavoro del mondo reale. Ciò che risalta maggiormente è l’equilibrio. Invece di eccellere in un compito ristretto, Qwen 3.5 mostra una forza coerente in termini di workflow agentic, ragionamento multimodale ed efficienza su vasta scala. Mentre l’IA si sposta dalle interfacce di chat ai sistemi guidati dall’esecuzione, i modelli costruiti per la versatilità e il throughput diventeranno sempre più importanti.
Amici, parliamoci chiaro: l’automazione non è fantascienza, ma una realtà che plasma il nostro presente. Pensate a un semplice script che automatizza l’invio di email: è un piccolo passo, ma dimostra come l’IA possa liberarci da compiti ripetitivi. Ora, immaginate Qwen 3.5, un gigante capace di orchestrare processi complessi, interagire con immagini e testo, e persino scrivere codice.
Ma non fermiamoci qui. L’automazione avanzata, quella che Qwen 3.5 promette, va oltre la semplice esecuzione di compiti. Si tratta di creare sistemi intelligenti capaci di adattarsi, imparare e prendere decisioni autonome. Un esempio? Un sistema di gestione della supply chain che ottimizza i flussi in tempo reale, prevedendo la domanda e adattandosi alle interruzioni.
La vera sfida, però, è capire come integrare queste tecnologie nel tessuto sociale ed economico. Dobbiamo assicurarci che l’automazione sia uno strumento per migliorare la vita di tutti, non solo per aumentare i profitti di pochi. E questo richiede una riflessione profonda sul ruolo dell’uomo nel mondo del lavoro e sulla necessità di investire in nuove competenze.
- Pagina ufficiale del modello Qwen3.5-397B-A17B con pesi e configurazione.
- Pagina ufficiale di Qwen, utile per approfondire modelli e architetture.
- Blog ufficiale di Qwen che descrive Qwen3-Coder-Next, utile per approfondire il modello.
- Annuncio ufficiale di Alibaba su Qwen3.5 con dettagli tecnici e funzionalità.








