Encyclopédie Atypique Incomplète
Incomplète, car toujours en construction au gré des jours, avec sérieux, curiosité et humour.
Atypique, car toujours dans l'esprit de la connaissance par l'observation et la pratique.
Incomplète, car toujours en construction au gré des jours, avec sérieux, curiosité et humour.
Atypique, car toujours dans l'esprit de la connaissance par l'observation et la pratique.
mercredi 17 juin 2009
Petit générateur de phrases aléatoires, qui ne veulent rien dire, mais cela de manière très professionnelle...
Vous êtes là, à trois heures du matin et plus que quatre heures pour terminer ce rapport pour avant-hier dernier délai... et accessoirement prendre du repos.
Le projet est bien avancé et il ne reste pratiquement plus que l’introduction et la conclusion à parachever, seules parties de l’ouvrage sûres d’être lues.
Mais voilà, l’inspiration a disparu avec les derniers rayons du soleil et ce n’est pas cette mixture verdâtre vendue pour du café qui va être d’un grand secours.
Heureusement, il existe un remède à ce problème cyclique : Le Pipotron.
Son fonctionnement est simple : soit on sélectionne manuellement des bouts de phrase, soit on laisse le Pipotron agir . . .
La petite application ci-dessous a 18x22x17x18x30x15x17x21x25 possibilités différentes de vous fournir une phrase passe-partout, soit encore quelques 486’673’110’000 manières différentes de vous en sortir pour votre dossier !
Un générateur automatique de phrases (parfois appelé « pipotron ») est un programme qui génère des phrases à partir d’un corpus bien défini.
Il s’agit d’une supercherie dont le but est la vraissemblance d’un texte inventé par le programme.
Quelqu’un qui utilise une telle matrice sera étonné de la cohérence du propos pourtant composé de toutes pièces par assemblage au hasard de morceaux de phrases.
Comment un programme peut-il créer un discours entier qui ait du sens ?
En réalité un générateur de phrases ne donne que l’illusion de créer du sens.
Une analyse des isotopies du texte généré montre qu’il n’a en fait quasiment aucun sens, et que le locuteur (le générateur de phrase) disserte sur un thème donné sans jamais entrer dans le vif du sujet, par supercherie, à la manière d’un locuteur qui parle la « langue de bois ».
Comment se passe la génération des phrases ?
Il suffit de demander au programme de générer des phrases sur un thème (linguistique) précis. Le programme sélectionne le champ lexical correspondant à ce thème, puis il assemble au hasard les termes du champ lexical de façon à former des phrases.
Le champ lexical en question doit être assez vaste pour que les mêmes termes ne reviennent pas trop souvent, de façon à donner l’illusion d’une variété dans le propos.
Chaque terme du champ lexical, placé au hasard dans la phrase générée, doit pouvoir faire partie de toute phrase générée sans qu’il y ait d’incohérence grammaticale.
Certains termes sont donc exclus de la base de donnée lexicale, car ils sont, dans les phrases naturelles, placés dans un endroit précis de la phrase.
On peut cependant conserver ces termes dans la base lexicale en obligeant le générateur à les placer dans une phrase ou dans un texte à l’endroit où ils sont d’habitude : le terme premièrement, par exemple, sera placé quelques phrases avant le terme deuxièmement. Le texte généré gagne ainsi en complexité donc en vraisemblance.
La base lexicale ne doit pas comporter trop de termes, sous peine d’un plus grand risque d’incongruité.
Les thèmes abordés par le générateur automatiques de phrases doivent être des thèmes où l’on croise ordinairement des termes techniques et inhabituels : par exemple, la philosophie kantienne ou la théorie de la superfluidité.
De cette façon, d’une part, les termes inconnus par le lecteur renforcent l’impression d’un discours réfléchi donc naturel, et d’autre part ils peuvent plus facilement faire partie d’un champ lexical plus serré donc présentant moins de risque d’incongruité.
Un générateur automatique de phrase est parfois très étonnant et peut servir de test ludique pour savoir si un professionnel d’un domaine précis (par exemple la philosophie) peut détecter ou non la supercherie.
Mais surtout, il est un objet de réflexion pour l’étude de la sémantique et des langages artificiels.
Un exemple de phrase générée n’ayant aucun sens mais qui, pour le non-spécialiste, peut passer pour vraisemblable :
“L’organisation rousseauiste de la continuité découle d’une représentation universelle de l’objectivisme.
Le paradoxe de l’antipodisme rationnel illustre, par là-même, l’idée selon laquelle l’objectivisme n’est ni plus ni moins qu’une immutabilité morale.
Il est alors évident que Kierkegaard interprète l’analyse synthétique de la continuité.”
On remarquera l’outil par là-même, servant à relier d’une manière faussement savante deux idées sans aucun rapport l’une avec l’autre.
Mais le lecteur essaie de construire un rapport, comme il en a l’habitude ; tous les mots de la philosophie ayant au moins entre eux un point commun, qui est d’appartenir au champ de la philosophie, le lecteur croit comprendre au moins une chose, c’est qu’il s’agit, dans ce texte, de philosophie, ou du moins de sciences humaines.
Cela peut parfois suffire à la vraisemblance du propos, surtout si un contexte ou un cotexte bien choisi vient la renforcer, tel un discours censé être officiel.
Il y en a même certains (vous les avez peut-être déjà rencontrés) qui ont un pipotron intérieur, et qui peuvent se passer de toute assistance de l’informatique pour synthétiser brillamment une situation d’apparence complexe...
J’en connais quelques-uns... et vous ?