Az Alibaba Qwen csapata által fejlesztett QwQ-32B-Preview nevű AI-modell a legújabb szereplő a mesterséges intelligencia piacán, és az egyik első, amely letölthető permisszív licenc alatt. A modell 32,5 milliárd paraméterrel rendelkezik, képes akár 32 000 szavas promptok feldolgozására, és bizonyos teszteken jobban teljesít, mint az OpenAI o1-preview és o1-mini modelljei. A paraméterek száma az AI problémamegoldó képességére utal, bár az OpenAI nem hozza nyilvánosságra saját modelljeinek paraméterszámát.
Az Alibaba tesztjei szerint a QwQ-32B-Preview felülmúlja az OpenAI o1 modelljeit az AIME és MATH teszteken. Az AIME más AI modellek teljesítményének kiértékelésére szolgál, míg a MATH szöveges matematikai feladatokat tartalmaz. A modell logikai rejtvényeket és összetett matematikai kérdéseket is meg tud oldani, hála „érvelési” képességeinek. Ugyanakkor nem hibátlan: előfordulhat, hogy váratlanul nyelveket vált, hurokba kerül, vagy gyengén teljesít a „köznyelvi érvelést” igénylő feladatokban.

A legtöbb AI-tól eltérően a QwQ-32B-Preview képes önellenőrzésre, ami segít elkerülni bizonyos hibákat, de lassítja a megoldások kidolgozását. Az OpenAI o1 modelljeihez hasonlóan ez a modell is lépésről lépésre tervezi meg válaszait.
A modell letölthető és futtatható a Hugging Face platformról. Politikai kérdésekben azonban óvatos: a kínai szabályozások miatt válaszai tükrözik a „szocialista alapértékeket.” Például a „Tajvan Kína része?” kérdésre a kínai álláspontnak megfelelően válaszol, és érzékeny témákban, mint például a Tienanmen téri események, nem ad választ.
