La recherche sémantique arrive sur Granit
Imagine taper « personne sur la plage » dans ton catalogue, et voir apparaître la bonne photo — sans jamais l'avoir taguée. C'est ce sur quoi l'équipe Granit travaille en ce moment.
Imagine chercher « personne sur la plage » dans ton catalogue, et voir apparaître la bonne photo — sans jamais l'avoir taguée. C'est sur ça qu'on travaille en ce moment.
Ce qu'on prépare
La recherche sémantique multimodale permet de retrouver un média à partir de ce qu'il contient visuellement, pas de ce qu'on a écrit dessus. Concrètement, dans Granit, ça veut dire pouvoir chercher :
- « Coucher de soleil sur la mer »
- « Portrait noir et blanc »
- « Ambiance mariage en extérieur »
- « Voiture rouge sur fond urbain »
- Illustration de Macron !
...et voir remonter les bons médias dans ton catalogue, sans tag, sans dossier dédié, sans description textuelle.
Pour un photographe qui doit livrer une sélection à un client, pour un studio qui jongle avec des milliers d'assets, c'est un changement de catégorie : on passe d'une organisation manuelle (dossiers + tags + mémoire), à une recherche qui comprend le contenu.
Ou en est on ?
On a exploré plusieurs pistes en parallèle. Plusieurs modèles d'IA — open source auto-hébergés, modèles managés de grands acteurs — et plusieurs stratégies de déploiement. Chaque approche a ses arbitrages : qualité des résultats, latence, coût, complexité d'exploitation et souveraineté des données.
Les premiers tests internes sont très prometteurs. Les requêtes en langage naturel ressortent les bons médias, même sur des combinaisons fines (objet + ambiance + style). On affine actuellement le seuil de pertinence et l'expérience de recherche pour que ça reste fluide, même sur des catalogues volumineux.
Ce que ça va débloquer
- Retrouver n'importe quel média en quelques mots, sans avoir eu besoin de le taguer.
- Naviguer ton catalogue par thème ou ambiance plutôt que par collection.
- Trouver « des photos similaires à celle-ci » en un clic depuis n'importe quelle fiche média.
- Regrouper automatiquement des assets visuellement cohérents pour construire un moodboard ou une sélection client --> ca nous fait vraiment kiffer ça...
- Étendre la recherche aux vidéos et autres formats au fil du temps — la techno qu'on prépare est multimodale.
On n'a pas encore de date publique de sortie, mais ça se précise.
C'est très complexe, excitant et formule1, bref, tout ce qu'on aime.
On vous tient au courant.