OCR dans Google Documents pour la reconnaissance de caractères en ligne

Publié le 11 juillet 2010 par Stéphane Leprince
Les logiciels OCR (optical character recognition) souvent fournis gratuitement avec un scanner vous évitent de resaisir un document numérisé en fichier texte plus ou moins riche (avec des images, tableaux...) et transforme le document en fichier éditable dans un traitement de texte.

Google fournit désormais ce service dans sa version française de Google Documents.

Rien de fantastique pour l'instant, si vous souhaitez passer à la reconnaissance de caractères des documents complexes, il faudra préférer  la solution logicielle. Mais si vous souhaitez récupérer du texte rapidement sans rien avoir à installer sur la machine sur laquelle vous travaillez, la solution Google Documents est un outil simple et rapide.

Attention, rien n'est magique non plus, il faudra surveiller la reconnaissance réalisée par Google, car des fautes de conversion seront à corriger. Les documents sont également limités à ce jour à une taille de 2 Mo et seules les 10 premières pages sont analysées par Google Docs.

Sources:
Yooztic par Stéphane Leprince - Blog d'actus sur les TIC et leurs utilisations dans l'enseignement, l'éducation et la formation professionnelle