[ Index ]
 

Code source de LifeType 1.2.4

Accédez au Source d'autres logiciels libres

Classes | Fonctions | Variables | Constantes | Tables

title

Body

[fermer]

/class/bayesian/ -> bayesiantokenizer.class.php (sommaire)

(pas de description)

Poids: 220 lignes (6 kb)
Inclus ou requis:0 fois
Référencé: 2 fois
Nécessite: 0 fichiers

Définit 1 class

BayesianTokenizer:: (9 méthodes):
  BayesianTokenizer()
  tokenize()
  _tokenize()
  _getValidHtmlTags()
  _stripHtmlTags()
  _tokenizeHtmlTags()
  _tokenizeHtmlTag()
  _unquoteToken()
  addContextMark()


Classe: BayesianTokenizer  - X-Ref

\ingroup Bayesian

This class takes care of splitting a valid html source in the different words that
make it up, taking tags into account. The main public method is BayesianTokenizer::tokenize()
BayesianTokenizer()   X-Ref
constructor, it only calls the parent constructor.


tokenize($text, $unique = false)   X-Ref
given an input text, possibly containing HTML tags, it will split it into
all the different words that make it up.

param: text The text to split
param: unique Whether the return array should contain unique items or if the same
return: An array where each item is a word from the text

_tokenize($text)   X-Ref


_getValidHtmlTags($tags)   X-Ref


_stripHtmlTags($text)   X-Ref


_tokenizeHtmlTags($tags)   X-Ref


_tokenizeHtmlTag($tag)   X-Ref


_unquoteToken($token)   X-Ref


addContextMark($tokens, $mark)   X-Ref




Généré le : Mon Nov 26 21:04:15 2007 par Balluche grâce à PHPXref 0.7
  Clicky Web Analytics