outils
Class HyphenationToolkit

java.lang.Object
  extended by outils.HyphenationToolkit

public class HyphenationToolkit
extends java.lang.Object

Classe permettant de mettre en place et de configurer la coupure littéraire à partir de dictionnaires de patterns de coupure (basé sur l'algo de Liang)


Constructor Summary
HyphenationToolkit()
           
 
Method Summary
static boolean fabriqueDico(java.lang.String dico, java.lang.String dicoNat, java.lang.String encodage)
          Construit le dictionnaire de coupure (en xsl) à partir d'un dictionnaire existant au format .dic (Tex)
static boolean fabriqueDicoNat(java.lang.String dico, java.lang.String dicoNat, java.lang.String encodage)
          Construit le dictionnaire de coupure de nat (en xsl) à partir d'un dictionnaire existant au format .dic (Tex)
static java.util.ArrayList<java.lang.String> getRules(java.lang.String dico)
          Renvoie une liste contenant les règles de coupures de nat
static java.util.ArrayList<java.lang.String> getRules(java.lang.String dico, java.lang.String encodage)
          Renvoie une liste contenant les règles de coupures de nat
static java.util.ArrayList<java.util.ArrayList<java.lang.String>> getRulesOrdered(java.lang.String dicoNat)
          Deprecated. a priori ne sert plus car le critère de longueur de règle ne sert pas dans les règles de coupures
static void main(java.lang.String[] a)
          méthode de test
static boolean writeRules(java.util.ArrayList<java.lang.String> rules, java.lang.String dico)
          Ecrit les règles contenus dans rules dans le fichier dico en utilisant l'encodage encodageDefaut.
static boolean writeRules(java.util.ArrayList<java.lang.String> rules, java.lang.String dico, java.lang.String encodage)
          Ecrit les règles contenus dans rules dans le fichier dico en utilisant l'encodage encodage.
 
Methods inherited from class java.lang.Object
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
 

Constructor Detail

HyphenationToolkit

public HyphenationToolkit()
Method Detail

fabriqueDico

public static boolean fabriqueDico(java.lang.String dico,
                                   java.lang.String dicoNat,
                                   java.lang.String encodage)
Construit le dictionnaire de coupure (en xsl) à partir d'un dictionnaire existant au format .dic (Tex)

Adapte les patterns pour les expressions régulières en xsl:

Fabrique le fichier hyphenation.xsl contenant les patterns de coupure

Parameters:
dico - l'adresse du dictionnaire existant au format .dic
dicoNat - adresse de la feuille xsl de coupure
encodage - encodage du dictionnaire dico
Returns:
true si le dictionnaire a été créé correctement, false sinon
Since:
2.0

fabriqueDicoNat

public static boolean fabriqueDicoNat(java.lang.String dico,
                                      java.lang.String dicoNat,
                                      java.lang.String encodage)
Construit le dictionnaire de coupure de nat (en xsl) à partir d'un dictionnaire existant au format .dic (Tex)

Adapte les patterns pour les expressions régulières en xsl:

Fabrique le fichier hyphen.xsl contenant les patterns de coupure

Parameters:
dico - l'adresse du dictionnaire existant au format .dic
dicoNat - adresse de la feuille xsl de coupure
encodage - encodage du dictionnaire dico
Returns:
true si le dictionnaire a été créé correctement, false sinon
Since:
2.0

getRulesOrdered

@Deprecated
public static java.util.ArrayList<java.util.ArrayList<java.lang.String>> getRulesOrdered(java.lang.String dicoNat)
Deprecated. a priori ne sert plus car le critère de longueur de règle ne sert pas dans les règles de coupures

Renvoie une liste double contenant les règles de coupures de nat regroupées par longueur de règle

La liste renvoyée contient des sous-listes dont les règles sont de même longueur pour chaque sous-liste

Parameters:
dicoNat - l'adresse du dictionnaire de coupure
Returns:
la double liste conteannt les règles de coupure
Since:
1.5

getRules

public static java.util.ArrayList<java.lang.String> getRules(java.lang.String dico)
Renvoie une liste contenant les règles de coupures de nat

La liste renvoyée est ordonnée telle que dans le fichier de règle

Adapte les patterns pour les expressions régulières en xsl:

utilise l'encodage par défaut (encodageDefaut)SAUF si un encodage est précisé dans le fichier de règles

Parameters:
dico - l'adresse du dictionnaire utilisé, au format compatible avec l'algorithme de Liang(Tex)
Returns:
la liste contenant les règles de coupure
Since:
2.0
See Also:
getRules(String, String)

getRules

public static java.util.ArrayList<java.lang.String> getRules(java.lang.String dico,
                                                             java.lang.String encodage)
Renvoie une liste contenant les règles de coupures de nat

La liste renvoyée est ordonnée telle que dans le fichier de règles.

Adapte les patterns pour les expressions régulières en xsl:

utilise l'encodage spécifié par encodage ou encodageDefaut si encodage vaut null SAUF si un encodage est précisé dans le fichier de règles à la première ligne

Parameters:
dico - l'adresse du dictionnaire utilisé, au format compatible avec l'algorithme de Liang(Tex)
encodage - l'encodage du fichier de règle. Si null, utilisation de l'encodage par défaut (encodageDefaut)
Returns:
la liste contenant les règles de coupure
Since:
2.0

writeRules

public static boolean writeRules(java.util.ArrayList<java.lang.String> rules,
                                 java.lang.String dico)
Ecrit les règles contenus dans rules dans le fichier dico en utilisant l'encodage encodageDefaut.

Les règles sont sous la forme de regex compatibles avec xsl. Cette fonction remplace:

Parameters:
rules - ArrayList des règles au format xsl-compatible
dico - L'adresse du fichier dictionnaire
Returns:
true si l'écriture dans dico s'est bien déroulée
Since:
2.0
See Also:
writeRules(ArrayList, String, String)

writeRules

public static boolean writeRules(java.util.ArrayList<java.lang.String> rules,
                                 java.lang.String dico,
                                 java.lang.String encodage)
Ecrit les règles contenus dans rules dans le fichier dico en utilisant l'encodage encodage.

Les règles sont sous la forme de regex compatibles avec xsl. Cette fonction remplace:

Parameters:
dico - ArrayList des règles au format xsl-compatible
encodage - Encodage du fichier dico
rules - L'adresse du fichier dictionnaire
Returns:
true si l'écriture dans dico s'est bien déroulée
Since:
2.0

main

public static void main(java.lang.String[] a)
méthode de test

Parameters:
a - unused