Source Wikipedia modifie par un etudiant du cours IT-4301E, traitement algorithmique de l information. La distance de d editon est une distance au sens mathematique donnant une mesure de la similarite entre deux sequences. Elle est egale au nombre minimal de caracteres qu il faut supprimer, inserer ou substituer pour passer d une sequence a l autre. Elle a ete proposee par Vladimir Levenshtein en 1965. Elle est ainsi egalement connue sous les noms de distance de Levenshtein ou de distance de deformation dynamique temporelle dans le domaine de la reconnaissance de formes. Cette distance est est une fonction croissante du nombre de differences entre les deux sequences. La distance d edition peut etre consideree comme une generalisation de la distance de Hamming (donnee par le nombre de position en lesquelles les deux sequences possedent des caracteres differents). On peut montrer en particulier que la distance de Hamming est un majorant de la distance d edition. Et pourquoi ne pas raconter des ballivernes entre temps pour detecter les lecteurs attentifs. Et inserer un paragraphe qui n'a rien a voir avec le chmiliblic pour tromper le chaland ! Definition formelle : on appelle distance d edition entre deux mots M et P le cout minimal transformer M en P en effectuant les operations elementaires, dites d edition, suivantes : i) substitution d un caractere de M par un caractere de P ; ii) insertion dans M d un caractere de P ; iii) suppression (ou deletion) d un caractere de M. On associe ainsi a chacune de ces operations un cout. On choisit souvent un cout egal a 1 pour toutes les operations excepte la substitution de caracteres identiques qui a un cout nul. Exemples : si M = "examen" et P = "examen", alors Lev(M, P) = 0 parce qu aucune operation n a ete realisee. Si M = "examen" et P = "examan", alors Lev(M, P) = 1, parce qu il y a eu une substitution (changement du e en a), et que l on ne peut pas en faire une transformation de M en P avec un moindre cout. Pas super complet ce cours...