Dropbase peut vous aider à transformer votre feuille de calcul désordonnée en base de données SQL interrogeable

Il n’est pas rare qu’une entreprise technologique soit née par accident. Célèbre, Slack a été créé en tant que sous-produit d’une société de jeux aujourd’hui disparue. De même, lorsque les fondateurs de Dropbase Jimmy Chan et Ayazhan Zhakhan étaient dans le Lot Y Combinator Hiver 20ils testaient le produit qu’ils avaient construit à l’époque et sont tombés par hasard sur la chose qui allait devenir Dropbase.

Les deux fondateurs avaient du mal à déplacer les données de la feuille de calcul dans une base de données SQL où ils pourraient travailler avec. Même s’ils étaient des techniciens, ils ne pouvaient pas tout faire fonctionner sans beaucoup de bricolage. Ils ont créé un outil pour faciliter le glisser-déposer d’un fichier .csv sur une base de données Postgres et commencer à l’interroger.

Chan dit que c’était une sorte d’eureka pour eux, car ils ont réalisé que s’ils avaient du mal à faire cela, beaucoup d’autres personnes le seraient aussi, et ils ont changé de vitesse pour créer Dropbase.

«Nous pensions qu’il devrait y avoir un moyen plus simple de le faire. Je veux juste faire glisser et déposer un fichier .csv directement dans une base de données SQL. Et c’est à ce moment-là que nous avons trouvé le nom Dropbase, car vous pouvez le faire glisser dans une base de données Postgres, et nous vous donnons simplement des informations d’identification pour la base de données et ainsi vous auriez instantanément accès à ce fichier .csv dans votre base de données cloud hébergée. C’est ainsi que nous avons commencé avec cela », a déclaré Chan à TechCrunch.

Ils ont dû surmonter de gros obstacles que toute personne travaillant avec des données connaîtrait, comme la réconciliation des différences dans les mêmes données qui peuvent perturber un filtre de conversion. « Après avoir fait glisser et déposer un fichier .csv, il y a généralement encore beaucoup de problèmes avec le fichier. Parfois, différentes parties du monde encodent les fichiers .csv différemment. Par exemple, en France, ils utilisent des points-virgules au lieu de virgules. Et donc tout d’abord, nous faisons de l’inférence. Nous examinons un échantillon de données et nous essayons de deviner quelle est la meilleure façon d’ouvrir le fichier », a-t-il déclaré.

Il a dit qu’un autre problème est que les données ne sont pas toujours dans le format que vous attendez qu’elles soient dans le tableau, alors comment les rendre cohérentes ? Ils ont proposé la notion de vérifications pour s’assurer que les données sont dans le bon format pour passer les filtres de conversion, mais Chan dit que cela va au-delà de simples vérifications syntaxiques.

Table de base de données Dropbase avec des chèques indiquant l'adresse e-mail dans un format incorrect.

Crédits image : Dropbase

« Ce sont en fait des vérifications sémantiques. Donc, ce que je veux dire par là, c’est que nous ne vérifions pas seulement si votre code postal est d’un certain format, mais nous pouvons vérifier si vos dates se situent dans une plage donnée, ou si elles sont après une certaine heure ou avant une certaine heure , ou si vos chiffres doivent être au minimum de quelque chose. donc c’est un peu plus [sophisticated] vérification », a-t-il expliqué.

Il dit qu’une fois qu’ils ont montré les problèmes à l’utilisateur, ils peuvent nettoyer tous les problèmes restants, puis charger la base de données et elle est disponible pour l’interrogation en SQL. « L’avantage d’avoir des données dans une base de données SQL est que vous pouvez les interroger rapidement. C’est la première chose. La deuxième chose est que vous pouvez le connecter à un outil en aval comme un outil de BI ou un autre outil de données de manière plus simple. Et vous pouvez créer plus d’ensembles de données historiques au fil du temps », a-t-il déclaré.

Les fonctionnalités les plus récentes du produit incluent un nouvel outil appelé Dropmail, qui permet aux utilisateurs d’envoyer par e-mail un fichier .csv pour le transformer en une base de données SQL, et la possibilité d’héberger vos propres données avec l’intégration de Snowflake.

La société a jusqu’à présent levé un tour de pré-amorçage de 1,75 million de dollars dirigé par Gradient Ventures de Google, avec la participation de YC et d’autres.

A lire également