das größte deutschsprachige Java : Crawler

dimanche 14 août 2016

Crawler

dimanche 14 août 2016

Moin zusammen,

ich habe den crawler4j von github soweit Programmiert/implementier das er bei mir läuft und auch alle daten in einer txt Datei abspeichert.
Das Problem ist das mir einfach zuviel Information in der Ausgabe steht, ich brauche nur zwei Daten aus der html/txt und zwar wäre das nur <titel> .... </titel> und <body> .... </body> gibt es hierfür eine Anweisung (System.out.println(...));

Info: Die meisten Internet Seiten die ich mit dem crawler durchforste sind in html geschrieben....

Crawler

Crawler

das größte deutschsprachige Java

dimanche 14 août 2016

Crawler

0 commentaires:

Enregistrer un commentaire

Archives du blog

Labels

Blog Archive

About Me