Ich programmier gerade in Java einen Webwatcher (ein Programm das Internetseiten auf Änderungen überwacht)
Das herunterladen einfacher html Seitenklappt soweit wunderbar.
Komplexere Seiten die Serverseitige Scripte haben klappen aber nicht. Hier unterscheidet sicher der Code jedesmal wenn ich ihn herunterlade:
Beispiel:
1.ter Versuch
HTML
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html dir="ltr">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<meta http-equiv="Content-Style-Type" content="text/css">
<link rel="top" href="./index.php?sid=e4f3304a522842022e126026a12c1535" title="FHDW-Studium Foren-Übersicht" />
<link rel="search" href="./search.php?sid=e4f3304a522842022e126026a12c1535" title="Suchen" />
<link rel="help" href="./faq.php?sid=e4f3304a522842022e126026a12c1535" title="FAQ" />
<link rel="author" href="./memberlist.php?sid=e4f3304a522842022e126026a12c1535" title="Mitgliederliste" />
<link rel="up" href="index.php?sid=e4f3304a522842022e126026a12c1535" title="FHDW-Studium Foren-Übersicht" />
<title>FHDW-Studium :: Forum anzeigen - Allgemeines</title>
<style type="text/css">
.
.
.
Alles anzeigen
2ter Versuch
HTML
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html dir="ltr">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<meta http-equiv="Content-Style-Type" content="text/css">
<link rel="top" href="./index.php?sid=13d1099953a07ce40a286c65d630c85e" title="FHDW-Studium Foren-Übersicht" />
<link rel="search" href="./search.php?sid=13d1099953a07ce40a286c65d630c85e" title="Suchen" />
<link rel="help" href="./faq.php?sid=13d1099953a07ce40a286c65d630c85e" title="FAQ" />
<link rel="author" href="./memberlist.php?sid=13d1099953a07ce40a286c65d630c85e" title="Mitgliederliste" />
<link rel="up" href="index.php?sid=13d1099953a07ce40a286c65d630c85e" title="FHDW-Studium Foren-Übersicht" />
<title>FHDW-Studium :: Forum anzeigen - Allgemeines</title>
<style type="text/css">
Alles anzeigen
Wie ihr seht unterscheiden sich die Daten. Und bei einem String vergleich bekomm ich natürlich die Meldung das sich die Strings unterscheiden.
Wenn ich die Seite im browser herunterlade:
Code
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML dir=ltr><HEAD><TITLE>FHDW-Studium :: Forum anzeigen - Allgemeines</TITLE>
<META http-equiv=Content-Type content="text/html; charset=iso-8859-1">
<META http-equiv=Content-Style-Type content=text/css><LINK
title="FHDW-Studium Foren-Übersicht" href="index.php" rel=up>
<STYLE type=text/css>
Die änderungen dürften mit Serverseitigen Sprachen zusammenhängen, in diesem Fall PhP. Damit kenn ich mich aber nicht aus.
Hab ich eine Chance an die Datei heranzukommen (bzw. den Pfad) so wie sie der Browser runterläd?