Prompting, RAG, fine-tuning : ces trois approches repondent a des problemes differents, mais on les confond sans cesse. Le reflexe couteux est de vouloir fine-tuner alors qu'un bon prompt ou un RAG suffirait. La regle d'ingenierie est simple : commencez par le moins cher, montez en complexite seulement si le besoin l'exige.
Prompting : le point de depart, presque gratuit
Le prompt engineering consiste a bien formuler la demande et le contexte donnes au modele. C'est rapide, peu couteux et souvent suffisant. Si votre besoin est de reformuler, classer, extraire ou generer du texte a partir d'instructions claires, commencez ici. Budget typique : quelques jours d'ingenierie, cout d'usage seul ensuite.
- Idéal pour : redaction, classification, extraction, synthese a la demande
- Delai : quelques jours a deux semaines
- Cout build : faible (1 a 5 k EUR selon le perimetre)
- Limite : le modele ne connait pas vos donnees internes ni vos cas tres specifiques
RAG : donner vos donnees au modele
Le RAG (generation augmentee par recuperation) connecte le modele a votre base de connaissances : documents, fiches produit, historique. A chaque question, le systeme retrouve les passages pertinents et les fournit au modele. C'est la bonne reponse quand le probleme est un probleme de connaissance, pas de comportement. La grande majorite des projets PME relevent du RAG, pas du fine-tuning.
Quand le modele doit savoir ce que vous savez, vous voulez du RAG. Quand il doit se comporter autrement, vous pensez fine-tuning.
- Idéal pour : support sur vos docs, recherche interne, assistant metier sourcé
- Delai : deux a huit semaines selon la qualite des donnees
- Cout build : moyen (8 a 30 k EUR), domine par la preparation des donnees
- Avantage cle : mise a jour facile, reponses sourcees et verifiables
Fine-tuning : le dernier recours, le plus cher
Le fine-tuning reentraine un modele sur vos exemples pour modifier son comportement : un ton tres specifique, un format de sortie rigide, une tache de niche repetee a tres grand volume. Il exige un jeu de donnees d'exemples de qualite, un travail d'evaluation serieux et une maintenance a chaque evolution du modele de base. Sans volume eleve et stable, il est rarement rentable.
- Idéal pour : style/format tres specifique, tache de niche a tres haut volume, latence/cout a optimiser a l'echelle
- Delai : plusieurs semaines a plusieurs mois
- Cout build : eleve (a partir de 25 a 30 k EUR), plus une dette de maintenance
- Prerequis : un jeu de donnees d'exemples propre et un protocole d'evaluation
L'arbre de decision en pratique
Notre demarche est toujours la meme : on essaie le prompting d'abord. Si le modele a besoin de vos connaissances, on passe au RAG. On ne considere le fine-tuning que si, RAG en place, il reste un probleme de comportement ou d'echelle que rien d'autre ne resout. Neuf fois sur dix, on s'arrete avant le fine-tuning, et le budget s'en trouve divise par trois ou quatre.
On challenge, puis on construit : le bon choix technique est celui qui resout le probleme au cout le plus bas, pas le plus sophistique.
Une combinaison est souvent la meilleure reponse : un RAG solide avec un prompting soigne couvre la quasi-totalite des besoins B2B en 2026. Vous hesitez sur l'approche pour votre cas ? On la cadre avec vous, budget a l'appui, avant d'ecrire la moindre ligne de code : contact@nexus-os.fr.