Atelier de données

Analyse colonnaire sur vos propres données, depuis le Québec.

Téléversez un fichier CSV, Parquet ou JSON. Exécutez du SQL standard dessus. Obtenez les résultats en quelques millisecondes — sans frais par requête, sans frais de sortie, et sans que vos données quittent le Canada.

Moteur colonnaire DuckDB, exécution vectorisée, 28 cœurs CPU sur la machine.
Pas de frais par requête, pas de frais de sortie, pas de taille minimale, pas de mise en chauffe.
Vos données, à vous. Chaque compte dispose d'ensembles isolés sur des disques physiquement à Montréal.
Inclus dans tous les forfaits Canner — Démarrage compris.

Trois étapes

Les ensembles de données regroupent vos tables — même forme qu'un dataset BigQuery ou un schéma. Chaque ensemble est un seul fichier DuckDB sur le disque, avec les fichiers sources bruts conservés à côté pour la traçabilité.

1. Créez un ensemble

Depuis votre tableau de bord, cliquez sur Atelier de données → Nouvel ensemble de données. Choisissez un identifiant URL; c'est ainsi que vous le référencerez partout.

2. Téléversez un fichier

Glissez un fichier .csv, .parquet, .json ou .jsonl dans l'onglet Téléversements. Le fichier reste intact à côté de votre ensemble — vous pouvez le réingérer plus tard sous un autre nom de table.

3. Exécutez du SQL

Passez à l'onglet Requête. Tapez du SQL. Faites Cmd/Ctrl + Entrée. Les résultats reviennent ; le moteur sous-jacent répartit la requête sur tous les cœurs de la machine.

SELECT region,
       AVG(prix)     AS prix_moyen,
       COUNT(*)      AS commandes,
       SUM(quantite) AS unites
  FROM ventes
 GROUP BY region
 ORDER BY prix_moyen DESC;

Pourquoi c'est rapide

PostgreSQL stocke les données ligne par ligne. SELECT AVG(prix) FROM commandes lit toutes les colonnes de chaque ligne — même si vous n'avez demandé qu'une seule colonne. Atelier de données utilise DuckDB, qui stocke chaque colonne séparément. Les agrégations ne touchent que les colonnes référencées par la requête, souvent 2 à 5 % des octets sur disque.

En plus, DuckDB parallélise une requête unique sur chaque cœur disponible, traite les données en lots vectorisés et prend en charge le pushdown automatique des prédicats dans les métadonnées Parquet. Sur des tables de 10 millions de lignes, vous obtenez une ergonomie de type BigQuery sur une machine hébergée au Québec, sans frais à l'octet scanné.

Ce qu'on ne peut pas faire ici : scanner une table de 10 To sur 5 000 travailleurs. Pour ça, BigQuery reste le bon outil. Atelier de données est pour la longue traîne des tableaux de bord, de l'analyse ad hoc et des pipelines BI qui tiennent confortablement dans quelques dizaines de gigaoctets — les charges qui ne justifient pas un entrepôt mais qui dépassent Postgres + agrégation manuelle.

Isolé par construction

Chaque requête s'exécute avec l'accès au système de fichiers local désactivé — read_csv_auto('/etc/passwd') et autres appels hors base retournent une erreur claire, vérifié sur le moteur en fonctionnement. Une requête ne peut atteindre que les données que votre propre compte possède ; les bases d'un autre client ne sont jamais accessibles. Chaque requête reçoit un plafond de mémoire borné par un cgroup, un délai limite et son propre sous-processus ; une agrégation hors de contrôle est tuée par OOM dans son propre scope, jamais sur la machine hôte.

Formats et SQL pris en charge

L’ingestion accepte .csv, .parquet, .json et .jsonl / .ndjson. Les types sont inférés par un balayage complet à l’ingestion, donc les colonnes parsent proprement même quand les 1 000 premières lignes se ressemblent. Les requêtes utilisent le SQL DuckDB — un sur-ensemble compatible avec Postgres incluant les fenêtres, CTE, opérateurs de chemin JSON complets et types tableaux. Le SQL ANSI standard fonctionne.

Forfaits

Inclus dans tous les forfaits Canner. Démarrage suffit pour des tests réels ; Live et Dédié montent à des charges BI sérieuses.

StockageRequêtes/jourDélai par requêteMémoire par requête

Starter100 MB50 / day5 s256 MB

Live25 GBunlimited5 min1 GB

Dedicated50 GBunlimited10 min2 GB

Où vos données résident

Sur disque à Montréal, détenues par l'utilisateur de déploiement sur le même VPS qui exécute vos projets. Aucun plan de données tiers. Aucune télémétrie sur le contenu de vos requêtes — uniquement des décomptes agrégés (succès / échec / délai) pour la facturation. Le journal des requêtes vous montre quel SQL a été exécuté et quand ; les lignes de résultat elles-mêmes ne sont jamais conservées au-delà de la réponse.

Prochaines étapes

Les requêtes SQL planifiées sont en ligne : exécutez du SQL selon une planification cron sur vos bases de projet, en lecture et en écriture, en les nommant — cumuls nocturnes et rapprochements sans outil ETL externe. L'export CSV/Parquet de toute requête et les jeux de données isolés par compte sont déjà livrés ; vient ensuite une sous-commande CLI canner workshop pour rediriger les résultats vers un terminal.

Ouvrez le tableau de bord et essayez.

Démarrage est gratuit et inclut Atelier de données. Téléversez un CSV en moins d'une minute.

Commencer gratuitement