
Les modeles geants font la une des journaux. Mais un modele 50x plus petit peut deja transformer votre quotidien.
Qwen2.5-1.5B-Instruct
900 Mo en quantification Q4. Tourne sur 4 Go de RAM, meme un Raspberry Pi 4. Vitesse : 3-8 tokens par seconde selon le processeur.
Ce qu il fait bien
Repondre a des questions factuelles, rediger des textes simples, aider aux devoirs (primaire-college), planifier des repas, conseiller sur le jardinage, traduire, resumer des textes.
Ce qu il fait moins bien
Raisonnement complexe, maths avancees, code informatique sophistique, analyse litteraire pointue. Pour ca, il faut un 7B minimum.
La bonne surprise
Pour 80%% des usages quotidiens d une famille, un 1.5B suffit. C est comme avoir un assistant qui a lu des millions de livres. Il ne sera pas toujours parfait, mais il sera toujours disponible, gratuit, et confidentiel.
Alternatives
SmolLM2 (1.7B, tres compact), Phi-2 (2.7B, excellent en raisonnement), TinyLlama (1.1B, le plus leger). Tous disponibles en GGUF sur HuggingFace.
