dimanche 14 août 2016

Crawler

dimanche 14 août 2016
Moin zusammen,

ich habe den crawler4j von github soweit Programmiert/implementier das er bei mir läuft und auch alle daten in einer txt Datei abspeichert.
Das Problem ist das mir einfach zuviel Information in der Ausgabe steht, ich brauche nur zwei Daten aus der html/txt und zwar wäre das nur <titel> .... </titel> und <body> .... </body> gibt es hierfür eine Anweisung (System.out.println(...));

Info: Die meisten Internet Seiten die ich mit dem crawler durchforste sind in html geschrieben....

Crawler

Crawler

0 commentaires:

Enregistrer un commentaire

 
◄Design by Pocket