Discussion:
Aspirateur de site + identification des pages contenant un bout de code special
(trop ancien pour répondre)
c***@gmail.com
2008-11-17 17:32:51 UTC
Permalink
Bonjour,
je souhaiterai savoir si il est existe un aspirateur de site qui
permettrait d'identifier au sein de toutes les pages aspirer, celles
contenant un bout de code spécifique.

L'idée serait de dire : sur ces 100 pages aspirées, voila celles qui
contiennent mon code (ou ne le contiennent pas). Et justement voila
ces pages.

J'imagine qu'un aspirateur combiné avec un exe perl permettrait de
faire cela, mais je ne connais ces deux choses que de noms.

Merci pour votre aide.
Cédric
Rakotomandimby (R12y) Mihamina
2008-11-23 18:06:11 UTC
Permalink
Post by c***@gmail.com
je souhaiterai savoir si il est existe un aspirateur de site qui
permettrait d'identifier au sein de toutes les pages aspirer, celles
contenant un bout de code spécifique [...] Perl [...]
Je pense que la premiere chose que tu aura à faire est d'échapper les
caractères spéciaux (aux regex) dans le "bout de code".
Ensuite, on peut trouver facilement de quoi faire.
Entre autres, en Perl: http://www.cs.utk.edu/cs594ipm/perl/crawltut.html

Parceque ça semble vouloir parler Perl, je fais suivre sur fr.comp.lang.perl
Loading...