🔒 100% Local possible
🇫🇷 Édité en France
🛡️ RGPD-friendly

Interrogez votre bibliographie avec l'IA

RefChat est l'assistant de recherche pour vos PDF scientifiques. Recherche hybride, détection automatique du mode de requête, multilingue, OCR intégré. Au choix : 100 % en local ou cloud sécurisé.

Pourquoi RefChat ?

Un assistant de recherche pensé pour la rigueur scientifique et la souveraineté des données.

🔒

Confidentialité absolue

Vos documents ne quittent jamais votre machine en mode local. Mode cloud disponible si vous préférez décharger les calculs sur nos serveurs européens.

🎯

Recherche hybride précise

Recherche sémantique multilingue (E5-large), keyword BM25 et reranking cross-encoder. Résultats plus pertinents qu'un RAG basique, sources citées explicitement.

🧠

5 modes intelligents

RefChat détecte automatiquement ce que vous voulez : question, résumé, liste de références, recherche par auteur, fact-check.

📄

OCR & parsing avancé

PDFs scannés ? Anciens rapports image ? EasyOCR + GROBID extraient texte, métadonnées et structure scientifique.

🗂️

Thématiques automatiques

Clustering BERTopic pour organiser votre bibliothèque en thèmes cohérents. Renommez, fusionnez, divisez selon votre vision.

🌍

Multilingue natif

Posez une question en français sur un article en anglais (ou inversement) — RefChat retrouve le contenu pertinent quelle que soit la langue.

Deux modes d'utilisation, votre choix

Vous gardez le contrôle. Décidez à tout moment si vos données restent chez vous ou bénéficient de la puissance du cloud.

🔒 Mode 100% Local

Indexation et LLM sur votre machine. Aucune donnée envoyée sur Internet.
  • Confidentialité absolue : aucun envoi de données vers Internet
  • Aucun serveur externe utilisé pour le traitement
  • LLM local via llama.cpp (modèles GGUF Mistral, Llama, etc.)
  • Indexation locale (embeddings + BM25 + reranking)
  • Idéal pour données sensibles (industrie, juridique, médical)
  • PC moins puissant : indexation et requêtes plus lentes
  • Recommandé : 16 Go RAM minimum, GPU NVIDIA pour de bonnes performances
Inclus dans toutes les licences

☁️ Mode 100% Cloud

LLM en ligne, indexation sur nos serveurs européens. Performances optimales.
  • LLM en ligne (API Mistral) : qualité de réponse maximale
  • Indexation déportée sur nos serveurs OVHcloud (France)
  • Pas de contrainte matérielle côté utilisateur
  • Vitesse d'indexation et de requête fortement accélérée
  • Données chiffrées en transit (TLS) et hébergées en UE
  • Idéal pour gros volumes, configurations légères, équipes distribuées
Nécessite un forfait supérieur

Trois étapes, c'est tout

De votre dossier de PDFs à votre assistant de recherche personnel, en quelques minutes.

1

Pointez votre bibliothèque

Indiquez votre dossier Zotero, Mendeley, ou n'importe quel dossier contenant vos PDFs.

2

Indexation intelligente

Pipeline multi-threadé : parsing GROBID, OCR, chunking sémantique, embeddings, BM25, thématiques.

3

Discutez avec vos articles

Posez vos questions en langage naturel. Réponses sourcées avec citations cliquables.

5 modes de requête détectés automatiquement

ModeDéclencheurComportement
Question(par défaut)Réponse narrative avec citations sourcées
Résumé« résume », « synthèse »Synthèse d'un ou plusieurs articles
Références« quelles publications »Liste d'articles pertinents avec explications
Auteur« articles de », « travaux de »Recherche par auteur via OpenAlex
Fact-check« vérifie », « est-ce correct »Vérification d'affirmations contre votre bibliographie

RefChat en images

Un aperçu de l'interface — du chat sourcé à l'exploration thématique de votre bibliothèque.

💬 Capture : chat avec citations cliquables

Conversation sourcée

Chaque réponse cite les passages exacts des articles, avec liens directs vers le PDF.

🗂️ Capture : carte thématique BERTopic

Cartographie thématique

Visualisez les grands axes de votre bibliothèque, regroupés automatiquement par sujet.

⚙️ Capture : indexation en cours (GROBID + OCR)

Indexation transparente

Progression détaillée du parsing GROBID, OCR, embeddings et thématiques.

Pour qui ?

Conçu pour des environnements exigeants où la confidentialité et la rigueur priment.

🔬 Recherche R&D et académique

Synthèse d'état de l'art, croisement de centaines d'articles. Accélérez vos revues de littérature.

📊 Veille technologique

Rapports sectoriels, brevets, publications. Posez des questions stratégiques sans risque de fuite.

📚 Capitalisation industrielle

Retrouvez l'information enfouie dans des décennies de rapports internes (OCR + RAG).

🏛️ Cabinets et expertises

Idéal pour les structures qui manipulent des documents sensibles (juridique, médical, géoscience).

Tarifs

Trois forfaits adaptés à votre usage. Tarifs indicatifs HT — un devis personnalisé est fourni après échange.

Solo Local

Chercheur ou expert indépendant — tout reste sur votre machine.

10 €/mois
  • Indexation 100% locale
  • LLM local (llama.cpp / GGUF)
  • Aucune donnée envoyée sur Internet
  • 1 poste utilisateur, bibliothèque illimitée
  • Mises à jour & support email 48 h
Demander une licence

Solo Cloud

Chercheur ou expert — performances optimales, sans contrainte matérielle.

20 €/mois
  • Indexation sur nos serveurs OVHcloud (France)
  • Interaction IA via l'API Mistral
  • Pas de configuration GPU requise
  • 1 poste utilisateur, bibliothèque illimitée
  • Données chiffrées (TLS), hébergées en UE
Demander une licence

Entreprise

Besoins spécifiques, environnements sensibles, volumes importants.

sur étude

Chaque demande est étudiée au cas par cas : installation sur vos serveurs avec accompagnement, adaptation à vos volumes, formation de vos équipes. Parlons de votre besoin.

Nous contacter

Essai possible sur un échantillon de votre bibliothèque avant engagement. Conditions détaillées dans les CGV.

Questions fréquentes

Les questions qui reviennent le plus souvent. Une autre interrogation ? Écrivez-nous.

Quelle configuration matérielle pour le mode 100% local ?

Minimum confortable : 16 Go de RAM, CPU récent (4+ cœurs), 10 Go d'espace disque pour l'index.

Recommandé : 32 Go de RAM et un GPU NVIDIA (8 Go VRAM+) pour des LLM locaux fluides (Mistral 7B, Llama 3 8B). Sans GPU, les requêtes restent possibles mais plus lentes (10–30 s par réponse).

Sur Mac Apple Silicon (M1/M2/M3), Metal est utilisé automatiquement — pas besoin de GPU NVIDIA.

Combien de PDFs RefChat peut-il indexer ?

Aucune limite logicielle. En pratique, des bibliothèques de 5 000 à 20 000 articles sont gérées sans difficulté. L'indexation d'un PDF typique prend 2 à 8 secondes selon le mode (avec ou sans OCR) et le matériel.

Pour des volumes supérieurs (50 000+), le mode cloud ou un déploiement on-premise dédié est conseillé.

Zotero et Mendeley sont-ils supportés ?

Oui. RefChat pointe simplement votre dossier de stockage Zotero (`storage/`) ou Mendeley. Les métadonnées sont enrichies automatiquement via GROBID et OpenAlex. Pas d'extension à installer côté Zotero.

Quelles langues sont supportées ?

Le modèle d'embedding (E5-large multilingue) couvre une centaine de langues. Les langues les mieux gérées sont français, anglais, allemand, espagnol, italien, portugais, néerlandais. Vous pouvez poser une question en français sur un corpus mixte FR/EN — RefChat retrouve les passages pertinents dans les deux langues.

Mes données restent-elles vraiment confidentielles ?

Mode local : aucune donnée ne sort de votre machine. Vous pouvez même travailler hors ligne après l'installation.

Mode cloud : indexation et LLM sur nos serveurs OVHcloud (Roubaix, France). Données chiffrées en transit (TLS 1.3), suppression sur demande, aucun entraînement de modèle sur vos contenus. Conformité RGPD documentée.

Puis-je tester RefChat avant achat ?

Oui. Sur demande, nous proposons une démo live (30 min) et un essai sur un échantillon de votre propre bibliothèque, sous accord de confidentialité si nécessaire. Demandez une démo.

Quelle différence avec ChatGPT, NotebookLM ou Perplexity ?

RefChat est spécialisé sur les bibliothèques scientifiques (parsing GROBID, OCR EasyOCR, recherche hybride dense+BM25+reranking, détection automatique de mode de requête). Surtout : option 100% locale — vos articles, brevets ou rapports sensibles ne quittent jamais votre machine.

Les solutions cloud généralistes envoient vos documents vers des serveurs aux États-Unis et n'offrent pas le même niveau de citation source ni d'organisation thématique.

Contactez-nous

Demande de licence, démo, question technique : écrivez-nous, nous répondons sous 48 h ouvrées.