Ancestry avait l’habitude d’avoir besoin de 9 mois pour scanner les enregistrements de recensement et établir des connexions pour les utilisateurs. L’IA l’a coupée à moins de 9 jours.

Ancestry avait l'habitude d'avoir besoin de 9 mois pour scanner les enregistrements de recensement et établir des connexions pour les utilisateurs. L'IA l'a coupée à moins de 9 jours.

Dire que la base de données d’Ancestry est vaste serait un euphémisme.

« Nous avons collecté plus de 65 milliards de dossiers dans 80 pays et plus », a déclaré à Trading Insider Sriram Thiagarajan, directeur de la technologie de la société et vice-président exécutif des produits et de la technologie. « Juste pour donner une échelle, c’est environ 10 000 téraoctets de données sur notre plateforme que nous utilisons pour fournir des découvertes à nos utilisateurs. »

La société de généalogie basée à l’Utah, fondée en 1983, collecte des dossiers pour aider les gens à dénicher leurs racines familiales.

Ces dossiers comprennent la naissance, la mort, le mariage, le recensement, l’armée, la terre, l’immigration et les journaux. Ancestry, qui propose également des kits de test ADN grand public, collabore avec des institutions comme la National Archives and Records Administration pour collecter ces données.

Il y a cependant une mise en garde intimidante avec un trow de cette taille: l’organiser.

Thiagarajan a déclaré que l’ascendance exploite l’IA et l’apprentissage automatique pour faciliter la tâche herculéenne.

Rationalisation avec la vision de l’ordinateur

Lorsqu’il a rejoint l’équipe d’Ancestry en 2017, Thiagarajan a déclaré que la société venait de commencer à explorer l’IA et l’apprentissage automatique.

« Nous essayions de trouver un moyen efficace et efficace de numériser le contenu que nous acquérons du monde entier », a déclaré Thiagarajan.

Ancestry a utilisé pour scanner les enregistrements, puis externaliser les opérations pour indexer manuellement et clés des champs pertinents. Cette information a été téléchargée dans la base de données d’Ancestry avant que les logiciels n’établissent des relations entre les personnes, les lieux ou d’autres catégories.

« Il y a environ 15 ou 20 ans, lorsque nous avons numérisé le recensement de 1940, il nous a fallu environ neuf mois pour le faire de manière manuelle à 10 fois le coût », a déclaré Thiagarajan.

Cela a envoyé l’équipe d’ascendance à la recherche de réponses.

« Nous avons dit: » Pourquoi n’appliquons-nous pas les techniques de vision informatique pour numériser automatiquement le contenu sans intervention manuelle?  » Thiagarajan a déclaré.

Thiagarajan a déclaré que l’ascendance a depuis élargi cette technologie pour traiter d’autres types de records, mais a déclaré que les humains examinent toujours les résultats de l’IA « au besoin ».

« Nous avons construit des contrôles et des systèmes automatisés qui réduisent certainement le temps que nous devons passer à vérifier », a-t-il déclaré. « Nous voulons être très prudents en nous assurant que ce que nous produisons en utilisant l’IA est ancré dans la vérité. Faits à la terre. »

Thiagarajan a ajouté que « la mesure dans laquelle nous le faisons maintenant contre il y a quelques années s’est certainement améliorée ».

« En fin de compte, lorsque les consommateurs viennent sur notre plateforme à la recherche d’histoires sur leurs ancêtres, nous voulons les connecter avec les dossiers que nous trouvons », a-t-il déclaré.

Ancestry est la version bêta d’une nouvelle fonctionnalité d’IA

En plus de mettre en œuvre l’IA dans le backend, Ancestry a déployé plusieurs fonctionnalités pour les utilisateurs, y compris son outil de reconnaissance de l’écriture manuscrite. Il a commencé à tester un assistant d’IA en 2024.

Plus récemment, Thiagarajan a déclaré à Trading Insider qu’Ancestry a commencé Beta testant une fonctionnalité alimentée par l’IA intitulée Audio Stories qui permet aux utilisateurs de transformer les enregistrements en un audio narratif.

« Notre IA peut comprendre le contexte entre le matériel imprimé, l’image et le récit manuscrit, et attacher tout cela dans une histoire », a déclaré Thiagarajan.

Bien qu’il n’y ait pas encore de date de lancement officielle pour les histoires audio, Ancestry pense déjà au-delà de l’audio.

« En bas de la route, nous voulons pouvoir ajouter des contes de vue, de son, de mouvement et de vidéo », a déclaré Thiagarajan.

A lire également