PrestaShop Intelligence Artificielle

Détecteur de Topic Clusters

Cartographie sémantique de votre catalogue et détection des pillar pages manquantes

Le module analyse votre catalogue par clustering sémantique pour faire émerger les vrais regroupements thématiques. Pour chaque cluster orphelin de page-mère, il génère un brouillon de pillar page complet : titre, slug, méta description, plan H2 et score de priorité.

PrestaShop 8 & 9 Multilingue 5 langues IA + TF-IDF
  • Remboursement 30 jours
  • 12 mois de mises à jour
  • Support 24h
www.datafirefly.com/
Détecteur de Topic Clusters
v1.0.0 · mis à jour 2026-05-27
Ce que ça fait

La version courte.

01

Clustering sémantique réel

K-means sphérique avec init k-means++ sur vecteurs normalisés L2. Vous voyez les regroupements thématiques effectifs de vos produits, pas votre arborescence de catégories officielle.

02

3 modes au choix

TF-IDF local et gratuit, ou embeddings OpenAI text-embedding-3-small, ou embeddings Mistral pour catalogues francophones. Basculez en un clic.

03

Détection des pillar pages manquantes

Le module croise chaque cluster détecté avec vos pages CMS et catégories existantes. En dessous du seuil de match, le cluster est marqué pillar gap.

04

Brouillon SEO prêt à publier

Pour chaque gap, génération du titre, du slug, de la méta description, du plan H2 markdown complet et des mots-clés cibles. Score de priorité basé sur la taille et la cohésion du cluster.

05

5 langues natives

Analyse indépendante par langue avec stop-words français, anglais, espagnol, allemand et italien intégrés, plus un dictionnaire de bruit e-commerce (taille, couleur, livraison, prix...).

06

Cache d'embeddings

Les vecteurs sont mis en cache par hash de texte pour éviter de re-facturer les appels API entre deux runs.

La version longue

Tout ce que vous voudriez savoir avant d'installer.

Un regard détaillé sur le fonctionnement de Détecteur de Topic Clusters, pourquoi nous l'avons conçu ainsi, et la réflexion derrière les fonctionnalités ci-dessus.

§ 01

Pourquoi un Détecteur de Topic Clusters ?

Votre catalogue est une mine d'or sémantique souvent inexploitée. Vos produits forment naturellement des regroupements thématiques que les moteurs de recherche cherchent à comprendre. Sans pillar page-mère structurante pour chaque cluster, Google peine à identifier votre expertise sur le sujet, et vos pages produits se cannibalisent mutuellement sur les requêtes informationnelles. Le Détecteur de Topic Clusters identifie ces opportunités automatiquement.

§ 02

Comment fonctionne le clustering sémantique ?

Le module extrait pour chaque produit un texte pondéré (nom triple poids, meta double, catégories double, description simple), le tokenise avec stop-words par langue, le vectorise en TF-IDF ou en embeddings denses, normalise les vecteurs en L2, puis applique un k-means sphérique avec initialisation k-means++. Les clusters émergent des vraies similarités sémantiques, pas de votre arborescence de catégories.

§ 03

Quel mode choisir : TF-IDF ou embeddings ?

Le TF-IDF est gratuit, instantané, sans appel API, et excellent pour les catalogues lexicalement homogènes (un domaine, un vocabulaire). Les embeddings OpenAI ou Mistral capturent une sémantique plus riche, comprennent les synonymes et les variantes lexicales, et excellent sur les catalogues diversifiés ou aux descriptions narratives. Vous pouvez tester les deux et comparer.

§ 04

Comment sont détectées les pillar pages manquantes ?

Le module récupère vos pages CMS publiées et vos landing pages catégorie (avec descriptions). Pour chaque cluster, il calcule un score de match fuzzy entre les top-termes du cluster et les contenus existants (titre poids 1.0, méta 0.5, body 0.2). En dessous du seuil configuré (0.45 par défaut), le cluster est marqué pillar gap : vous avez la matière produit mais pas la page-mère structurante.

§ 05

Que contient le brouillon généré pour chaque gap ?

Pour chaque pillar page manquante, le module génère un titre H1, un slug URL-safe, une méta description, un plan H2 complet en markdown (introduction, qu'est-ce que, comment choisir, comparatif, meilleurs produits, cas d'usage, erreurs à éviter, FAQ, CTA), une liste de mots-clés cibles et un score de priorité combinant taille du cluster et cohésion sémantique.

§ 06

À qui ce module s'adresse-t-il ?

Aux e-commerçants qui investissent dans le SEO long-tail, aux responsables contenu en charge de stratégies pillar/cluster, aux consultants SEO en mission d'audit, aux marques avec un large catalogue mal couvert éditorialement. Le module est aussi un outil de diagnostic pour identifier les chevauchements de catégories ou les opportunités de maillage interne.