TALN
Follow
Find
959 views | +1 today
TALN
Traitement automatique du langage naturel
Your new post is loading...
Your new post is loading...
Scooped by Didier Sampaolo
Scoop.it!

La plume et l’algorithme

La plume et l’algorithme | TALN | Scoop.it

Réflexion sur l'utilisation de la détection d'auteur, dérivée de la détection de langue, sur Google, et sur ses implications possibles pour le référencement d'un site.

more...
No comment yet.
Scooped by Didier Sampaolo
Scoop.it!

Latent Semantic Indexing et content spinning

Latent Semantic Indexing et content spinning | TALN | Scoop.it

(réponse au billet sur WebContentSpinning)

more...
No comment yet.
Scooped by Didier Sampaolo
Scoop.it!

Petite histoire du Web sémantique | Les petites cases

Petite histoire du Web sémantique | Les petites cases | TALN | Scoop.it

de 1989 à 2010, pas mal du tout.

more...
No comment yet.
Scooped by Didier Sampaolo
Scoop.it!

Cursus TAL de l'Université Paris 3 (Sorbonne)

Cours et TP de l'Institut de Linguistique et Phonétique Générales et Appliquées (ILPGA). De nombreux exemple de code expliqués.

more...
No comment yet.
Scooped by Didier Sampaolo
Scoop.it!

Analyse sémantique latente (Wikipédia)

Analyse sémantique latente (Wikipédia) | TALN | Scoop.it

LSA/LSI selon Wikipedia. Article trop théorique pour être exploité directement mais qui offre de bonnes bases de réflexion.

more...
No comment yet.
Scooped by Didier Sampaolo
Scoop.it!

Centre National de Ressources Textuelles et Lexicales

Portail lexical du Laboratoire ATILF, regroupe des ressources linguistiques et sémantiques (du dictionnaire de synonymes jusqu'au synthétiseur de voix). Le tout, en français.

more...
No comment yet.
Scooped by Didier Sampaolo
Scoop.it!

Latent Semantic Indexing : arme fatale contre le content spinning ?

Cette note fait suite à un commentaire de Laurent Bourrelly dans le billet consacré au content spinning et aux synonymes.
more...
No comment yet.
Scooped by Didier Sampaolo
Scoop.it!

Algorithme de Simhash : Script PHP de calcul de similarité

Algorithme de Simhash : Script PHP de calcul de similarité | TALN | Scoop.it
Script PHP détaillant l'utilisation de l'algorithme de Simhash par calculer la similarité de texte.

 

Mesure de similarité via fingerprint SimHash et distance de Hamming.

more...
No comment yet.
Scooped by Didier Sampaolo
Scoop.it!

Calculer la fréquence des mots d'un texte - PHP

Calculer la fréquence des mots d'un texte - PHP | TALN | Scoop.it
Calculer la fréquence des mots d'un texte, Une fonction qui permet de calculer le nombre d’occurrence des mots dans un texte - PHP...

 

A partir d'un texte, la fonction PHP présentée établit un vecteur en fonction des occurrences de chaque mot.

more...
No comment yet.
Scooped by Didier Sampaolo
Scoop.it!

Le synonyme est le pire ennemi du content spinning – {Content Spinning}

Le synonyme est le pire ennemi du content spinning – {Content Spinning} | TALN | Scoop.it
En matière de content spinning, les synonymes sont les meilleurs amis des moteurs de recherches pour détecter les near-duplicate.

 

Réflexions sur l'emploi des synonymes dans une application de content spinning.

more...
No comment yet.