Nuvola apps important.png Attention, Ce wiki a été transféré sur le domaine Démo.Istex.

Voir : https://wicri-demo.istex.fr/Wicri/Sic/H2PTM/fr/index.php?title=Accueil

-

H2PTM (1997) Halleb

De H2PTM
Aller à : navigation, rechercher
Hypertextualisation automatique multilingue à partir des fréquences des n-grammes
 
 
 
Titre
Hypertextualisation automatique multilingue à partir des fréquences des n-grammes
Auteurs
Mohammed Halleb (France), Alain Lelu (France)
Affiliations
Université Paris 8
Université Paris 8
2, rue de la Liberté, F-93200 Saint-Denis
  • lelu@cnam.fr
Dans
actes du colloque H2PTM 1997 Paris
publié dans H²PTM97 : Hypertextes et hypermédias; Réalisations, outils et méthodes
Résumé
Nous présentons une méthode de classification thématique de grandes collections de textes, indépendante du langage, permettant de créer des interfaces de navigation hypertextuelles dans ces collections, quelle que soit la langue utilisée. Cette méthode caractérise les textes par leurs fréquences de n-grammes (séquences de n-caractères consécutifs). Plusieurs variantes de construction des vecteurs-textes, et de pondération de ceux-ci, sont présentées et comparées aux résultats obtenus avec une représentation des documents par la fréquence de leurs termes d’indexation. L’analyse de ces données assurée par un modèle neuronal développé (LEL 94).
Mots-clés
classification automatique, n-gramme, recherche d’information, traitement multilingue, modèle neuronal, hypertextualisation, H-coding.
Mots-clés (pascal)
Classification; Classification automatique; Recherche information; Multilinguisme; Réseau neuronal; Hypertexte.
Faits relatifs à H2PTM (1997) Halleb
A pour affiliation auteurUniversité Paris 8 +
A pour affiliation premier auteurUniversité Paris 8 +
A pour auteurAlain Lelu +
A pour pays auteurFrance +
A pour pays premier auteurFrance +
A pour premier auteurMohammed Halleb +
A pour résuméNous présentons une méthode de classificat
Nous présentons une méthode de classification thématique de grandes collections de textes, indépendante du langage, permettant de créer des interfaces de navigation hypertextuelles dans ces collections, quelle que soit la langue utilisée. Cette méthode caractérise les textes par leurs fréquences de n-grammes (séquences de n-caractères consécutifs). Plusieurs variantes de construction des vecteurs-textes, et de pondération de ceux-ci, sont présentées et comparées aux résultats obtenus avec une représentation des documents par la fréquence de leurs termes d’indexation. L’analyse de ces données assurée par un modèle neuronal développé (LEL 94).
par un modèle neuronal développé (LEL 94). +
A pour titreHypertextualisation automatique multilingue à partir des fréquences des n-grammes +
Est dans les actesH2PTM 1997 Paris +