Ce magnifique article n’a pas été (totalement) écrit par une machine

Publié le 04 janvier 2013 par Editoile @editoile

Ne serait-il pas merveilleux de n’avoir qu’à cliquer sur une icône pour produire un article au lieu de devoir négocier âprement avec un singe évolué pour qu’il daigne aligner quelques mots sans prétendre faire de la littérature ? Graal informatique, le générateur de textes marie la programmation à la syntaxe. Pour rire, il engendre le Pipotron. Mais existe-t-il réellement des outils capables de produire ces contenus que votre présence en ligne requiert ?

Génération magique

La dernière « bulle » de générateurs de contenus date de 2004-2005. Elle consiste en une race d’outils assez similaires mélangeant plusieurs approches plus anciennes : des crawlers capables d’agréger des contenus accessibles en ligne, des spinners simplifiant la reformulation de textes et des jugglers faits pour faciliter la recomposition des idées en paragraphes. La promesse produit d’un truc comme le « Instant Article Wizard » et ses clônes vaut le coup d’œil. Dans une interface unique, vous allez pouvoir invoquer tous les moteurs de recherche sur un ou plusieurs sujets, sélectionner les notions connexes attachées à ces sujets, choisir parmi les milliers d’articles trouvés ou, mieux, laisser faire le « wizard » lui-même.

SpinnerChef, une des moulinettes à textes disponibles.

Votre article, telle la créature du docteur Frankenstein, sera un produit assemblé, shooté aux synonymes, riche en rappels du sujet, mais cette approche industrielle du poncif n’est pas aussi inefficace qu’on voudrait l’espérer. Engendré par les moteurs de recherche, la rédaction semi-automatique produit, au mieux, du texte pour moteurs de recherche. Avec un peu de réécriture, un pigiste inspiré pourra en faire un brouet lisible mais, sauf miracle, c’est de fond que manquera cette tambouille parfois utile au recyclage des contenus.

Si vous êtes tenté par l’expérience, je conseille la lecture de cet article très complet sur le web content spinning.

Taylorisme en ligne

Le « turc mécanique » lancé par Amazon en 2005 a quelque peu mis à mal le modèle des générateurs de textes dont nous venons de nous souvenir en leur substituant la promesse de « vrais » rédacteurs corvéables à merci. L’argument en faveur de la génération automatisée de contenus est économique. Le « turc » d’Amazon est désormais utilisé pour la réécriture, la traduction, la classification et la curation pour des coûts difficiles à battre. On peut même lui demander des petits dessins. Certes, il y a du déchet et la « commande » doit rester simple mais, après quelques essais, il est possible de lui confier le soin de contrebalancer le manque de contenus générés par les utilisateurs. Et, au train où va l’emploi, il est clair que la sous-traitance « distante » de cette nature est amenée à se structurer. Comment ?

Coopérative textuelle

Si le Web parvient à se parer d’une couche sémantique, allons-nous assister à une optimisation sévère de la production de contenu ? Pas avant… un certain temps. A cela plusieurs raisons : la quantité de contenu non indexé, le besoin réel en textes étiquetés et, enfin, le gain encore très nébuleux en terme de capacités d’exploitation.

Pour les producteurs de contenus, la seule véritable évolution semble provenir des travaux universitaires menés autour de CrowdForge. De quoi s’agit-il ? CrowdForge reprend le travail là ou le turc mécanique d’Amazon l’a laissé. Au lieu de confier des tâches distinctes à un groupe de participants, il organise leur travail de façon à ce que chaque contribution participe à l’ouvrage commun final. L’analogie avec le système de suivi de version Git apprécié des programmeurs n’est pas surfaite. La différence réside dans l’intelligence initiale nécessaire pour pré-organiser le travail contributif. On imagine que cette approche offre une souplesse inférieure au travail d’un rédacteur un tant soit peu efficace mais elle s’applique particulièrement bien à la production de documents étoffés comme des scripts pour des documentaires vidéo ou des contenus à sujets multiples type  »dossier ».

Conclusion (500 signes max.)

Pour réécrire, recycler, décliner des articles existants, un dictionnaire de synonymes et un sens du control-C control-V devraient encore s’avérer plus efficaces que la majorité des moulinettes magiques. Comme la trottinette, la réécriture s’apprend.

Je laisse la conclusion à un expert : « Dans le but de pallier à (sic) l’inertie de l’époque actuelle, il est préférable de caractériser l’ensemble des ouvertures pertinentes, parce que nous ne faisons plus le même métier. Pour réagir face à la dégradation que nous constatons, je n’exclus pas de se remémorer la somme des options draconiennes, pour le futur. » (Pipotron)