Dictionnaire Orthographique
Sujet Précédent  


Lorsqu'on observe de près le texte d'une édition récente de la Flore de Coste, on peut s'apercevoir que certains caractères sont mal imprimés. Pour pouvoir faire de l'OCR de façon efficace, il faut donc travailler sur une version originale (1937 ou avant), mais c'est encore insuffisant. Compte tenu du vocabulaire utilisé par Coste, j'ai été contraint d'intégrer à BotaZiff un dictionnaire spécifique. En principe l'utilisateur n'a pas besoin de ce dictionnaire, puisque toutes les fiches ont été vérifiées. Mais puisque celui-ci existe, j'ai décidé de le laisser.



Utilisation :


L'utilisation du dictionnaire est extrêmement simple: Dans la fenêtre "FloCoste" cliquez sur 'Menu ...', puis sur 'Orthographe' : Une règle avec 6 boutons apparaît.




'Vérif-Ortho-1'


Dans un premier temps,  vous pouvez vous n'utiliser que ce bouton. Il permet de balayer mot par mot la description en cours et de signaler les mots erronés ou absents du dictionnaire.


Les mots litigieux provoquent le message :



1/ Si le mot est correct, il faut répondre 'Oui' : Le mot est alors ajouté au dictionnaire 'CosteDic' et la vérification continue.


2/ Si vous estimez que le mot est incorrect, il faut répondre 'Non' ; ce qui provoque l'affichage d'une fenêtre de correction.



Vous saisissez alors la correction dans la boîte 'Texte Corrigé' puis cliquez sur 'OK'. Le texte affiché est alors modifié, mais le nouveau mot n'est pas enregistré dans le dictionnaire. Il faudra l'enregistrer au prochain passage.


3/ Vous avez aussi la possibilité d'enregistrer la correction dans une table de correction automatique (CorrAuto), il faudra alors cliquer sur AjtCrA. Attention il faut être extêmement prudent et bien réféchir aux conséquences avant de définir des corrections automatiques. Dans le doute, abstenez-vous !


'Vérif-Tout'


Même  fonctionnement que ci-dessus, mais examine successivement toutes les descriptions à partir de celle en cours jusqu'à la description 4354.


'Voir-Dico'


Affiche le dictionnaire 'CosteDic', si Access 2003 est installé sur votre PC. Vous permet de supprimer des définitions. Je déconseille fortement de modifier ou d'ajouter des mots au dictionnaire !


'Ajt-CorAuto'


Permet d'ajouter des définitions au correcteur automatique. La aussi prudence !


'Voir-CorAuto'


Affiche le dictionnaire 'CorAuto', si Access 2003 est installé sur votre PC. Vous permet de supprimer des définitions dans le dictionnaire. Je déconseille fortement de faire des modifications manuelles !


'Stop'


Termine prématurément une séquence de correction lancée par 'Vérif-Tout'



Structure de la Base Orthographique :


Base de donnée au Format ACCESS 2003

Nom du fichier : "CorrOrtho.mdb" , situé dans : ..\Botanique\Flo-Coste\DBases


Tables (=dictionnaires) :

(Tous les champs sont de Type String)


CosteDic - Un seul champ : MotExact

CorrAuto - Deux champs : ChaineOrg, ChaineCor

OpOffDic - Un seul champ : MotExact


Nota 1:

CosteDic: est le dictionnaire Coste (13000 mots). Il est exhaustif et contient tous les mots de la flore de Coste.

OpOffDic : est un dictionnaire Français standard issu de 'Open Office' (90.000 mots). Il permet des ajouts automatiques dans le dictionnaire Coste.


Nota 2:

Il y a une différence fondamentale dans le foctionnement de CosteDic et CorrAuto. CosteDic opère uniquement sur des 'mots' alors que CorAuto opère sur des chaînes de caractères. Dans le cas de CorAuto, il faudra donc faire attention à bien définir tous les caractères 'espace'.