Hallo.
Gibt es Möglichkeiten (z.B. spezielle Software) Webseiten die Foren enthalten komplett zu sichern?
Z.B. damals das Hundefeindforum, was ja zumindest unterhaltsam (und entlarvend) war.
Archive.org hat es nicht gesichert, bei der Hauptseite war Schluss.
Und da ich kein Internetausdrucker bin (was hier auch sinnlos wäre), wäre eine technische Möglichkeit gut.
Idealerweise gleich mit der Mögliuchkeit es als Forentypische DB zu sichern.
Man hat zwar keinen direkten Zugriff um die Original-DB zu kopieren, aber eine Software könnte ja alle Seiten scannen und die Forenstruktur wie Kategorien, Unterforen und Stränge/Beiträge in eine DB eintragen.
Wenn ein auf Basis dieses Scans erstelltes Forum dann nicht nur als Archiv genutzt werden sollte, könnten die Nutzernamen ja mit einem Präfix versehen werden. Zum einen sieht man dass es alte Einträge gibt, zum anderen können sie nicht mit Neuanmeldun gen von Nutzern mit den Nutzernamen kollidieren, falls das denkbar wäre. Und drittens würde man auch unterscheiden können zwischen den archivierten Beiträgen, und denen von neuen Nutzern mit gleichen Nick.
P.S.: Es geht hier nicht um eine rechtliche Disskusion .
Grüße,
Tobias Claren
Fremdes Forum komplett sichern?
-
-
Programme, mit denen man Seiten komplett speichern kann, werden Spider genannt. Unter Linux ist dafür wget prädestiniert. Unter Windows und Mac gibt es sicher ähnliches.
-
Unter Linux ist dafür wget prädestiniert.
wget gibt es auch für Windows -
Ja, ich erinnere mich an so etwas noch von vor Jahren. Gab es was bekanntes dass es in einer "Enterprise"-Version gab.
Ich meinte aber, ob es solche Spider gibt die nicht einfach ein HTML-Gerüst erzeugen, sondern die Daten eines Forums in einer Datenbank speichern.
So dass das Forum danach wieder zugänglich gemacht werden kann.
Man kann entweder die Datenbank runterladen und es später woanders einbauen (wenn man Adminzugriff hat), oder man müsste mit einen speziellen Forumsspider die Inhalte die das php-Script aus der Datenbank erzeugt und als HTML ausgibt wieder in eine Datenbank-Backupdatei schreiben.
So dass man diese nach einer Installation des Forums auf eigenem Webspace dot integireren kann.
Vorteil ist natürliches surfen auf der (php)Seite, und die Möglichkeit die Suchfunktion zu nutzen. Und natürlich theoretisch das FOrum weiter zu betreiben und die bestehenden Stränge zu ergänzen.
Ein einfaches HTML-Backup kann das nicht. -
Nein, das geht nicht. Dafür braucht man Zugriff auf die Datenbank selbst, was Du ohne entsprechende Rechte aber nicht kannst.
-
Wir verstehen uns nicht richtig. Ich schireb dass ich weiß dass ich keinen Zugriff auf die DB habe (abgesehen von Hackmöglichkeiten die ich nicht kenne), aber es für einen Software (einen Spider) theoretisch möglich sein muss aus den frei zugänglichen HTML-Seiten (welche das php-Script erzeugt) eine neue Datenbank-Backup-Datei zu erzeugen die man in einem frisch installierten Forum hochladen kann.
Nicht die Original-DB, sondern eine neue DB basierend auf den HTML-gespiderten Daten.
Ich meine keine Original-DB (nochmal ) mit Nutzernamen, passwörtern usw., sondern eine Datenbank in die die Beitraäge eingetragen wird. Von dem Spider, oder notfalls einer Zusatzsoftware die man danach über die HTML-Struktur (im Ordner auf der HDD) laufen lassen kann.
Evtl. verstehen wir uns ja jetzt.
Stellt euch vor da hat Jemand ein geheimes Dokument auf seinem Rechner und ich kann es per Fernglas durchs Fenster sehen. Ich öffne nun bei mir auf dem Rechner die Textverarbeitung und tippe das was ich sehe ab. Am Ende habe ich zwar nicht das Originaldokument, aber eine inhaltliche Kopie die wie das Original editierbar ist.
Da ich im Netz offiziell sehen kann hinkt es ein wenig, aber es dürfte rüberbringen worum es geht.Eine Software bzw. ein Script soll aus den "gespiderten" Daten einfach eine neue DB erstellen. Idealerweise nicht nur für das Forum aus dem es stammt.
Z.B. könnte man ein SMF-Forum spidern und den Inhalt in eine phpBB-DB schreiben.
Damit nach dem hochladen die Seite noch funktiooniert, müsste die Software oder das Script wohl zuvor eine Backup-Datei vom eigenen Forum aufnehmen, damit es die Beiträge aus dem fremden Forum nur hinzufügt. Dann funktioniert die DB noch in dem eigenen Forum, aber die fremden Beiträge sind drin. -
Das habe ich durchaus verstanden. Natürlich könnte man den HTML-Code analysieren und daraus die Inhalte auslesen. Allerdings ist dies unpraktibel, da jedes Forum (und auch jede Forensoftware einen eigenen HTML-Code verwendet und man daraus nicht automatisiert beliebig die Inhalte auslesen kann. Diese müssen schon entsprechend im HTML-Code gekennzeichnet sein.
Natürlich kannst Du dir auf Grundlage von wget etwas programmieren, was dies für genau deinen Fall erledigt. Das Ergebnis obliegt dann deiner Programmierqualität. Das Programm kann dann allerdings auch nur für das von dir anvisierte Forum genutzt werden - höchstwahrscheinlich für kein anderes.
Aus dem Grund gibt es imho auch kein solches Programm.
-
Genau das meinte ich ja.
Keinen 08/15-Spider, sondern einen der die Foren bzw. ihre Strangstruktur usw. kennt.Ich kann nicht glauben dass es kein solches Programm gibt, die ausgeboteten Ex-Forenmitglieder die ein bestehdes Forum komplett kopieren und bei sich im Klon integrieren werden die Seiten ja nicht von Hand kopieren.
Naja, ich frage mal in der Szene wo man solche Fälle kennen könnte. Z.B. in einem Gulli-Klon. -
Mal abgesehen davon, dass das höchst illegal ist, gibt es solche Programme nicht!!
-
Daran ist nichts "höchst illegal".
Da wirkt der Avatar nicht sehr ernst gemeint.Der erste Teil des Satzes sowie die zwei Ausrufezeichen deuten klar auf den Versuch hin, das Thema durch eine unbewiesene Behauptung zu beenden.
Schon das "höchst" vor dem "illegal" zeigt doch den Mangel an jedweder Relation.
Hier wird Mord mit dem herunterladen eines Forums verglichen.
Mehr als "höchst" illegal gibt es nicht.Ich darf mir alles was öffentlich zugänglich ist erst mal sichern.
Um das Hundefeind-Forum ist es echt Schade. Nicht weil man dafür Hunde hassen müsste, die abartigen Hundehalter dort sind (waren) sehr unterhaltsam.Ich hoffe ich habe noch die Möglichkeit meine Frage selbst zu beantworten, falls ich woanders entsprechende Informationen erhalte.
Sich selbst Fragen zu beantworten ist keineswegs seltsam (Kommentaren vorbeugend), gerade in Foren geht es ja auch darum allen die Informationen zu geben. Erhalte ich diese noch, gebe ich sie gerne weiter.Es gab ja eindeutig die Fälle wo ganze Foren kopiert wurden. Also deren Inhalt in ein fremdes Forum übernommen wurde.
Jetzt mal unanbhängig davon ob jemand vorhat Daten zu sichern bevor sie verschwinden (auch auf staatlichen bzw. juristischen Druck), oder sie einfach kopiert um sie selbst als Grundlage eines Forum zu verwenden (z.B. weil sich die Betreiber des Forums korumpieren, wie bei Gulli) usw..
Etwas OT, aber mit Bezug:
Eine andere Basis wäre eine Seite wo es nur darum geht geschlossene Stränge fremder Seiten fortzusetzen. Wenn also der Mod im Forum X einen Strang schließt, kann der Nutzer ins "Metaforum" gehen und dort die Disskusion fortsetzen.
Aber das wäre eine spezielle Anwendung. Wenn auch ein interessantes Webseitenkonzept. Wäre so eine Webseite jedem bekannt, könnte sich das durchsetzen dass die Nutzer z.B. über ein Browserplugin. dort hin gehen. Ein Knopf den man drückt, während man in dem Strang ist. Man gelangt auf die Seite des "Opportunistenforums", wo man gleich die Diskussion fortsetzen kann. Wie das geht? Die Reffererfunktion des Browsers übermittelt die Seite wo man zuvor war, und das fremde Forum erzeugt sofort den Strang bei sich. Ja, das wäre genial.
Was es wohl schon gab, aber leider nie große Verbreitung fand, ist ein Chat und/oder Forum dass Seitenunabhängig über den Browser zur Verfügung gestellt wird.
Suche ich z.B. Shortnews auf, kann ich abseits der Moderatoren dort mit anderen Besuchern der Seite chatten und/oder in Foren schreiben.
So etwas könnte in den Browsern vorintegriert sein. Bei Firefox könnte so etwas sicher schneller durchgesetzt werden. MS könnte es im IE auch unterstützen (da sind die wohl träger). Es sollte aber das gleiche System sein.
So nimmt man den Foren und Seitenbetreibern etwas Kontrolle über die Beiträge die "in ihrem" Forum geschrieben werden. Denn auch die Beiträge in dem offenen System (ähnlich unabhängig wie Wikipedia) sind ja mit ihren Seiten verknüpft.Wäre interessant wie die Seitenbetreiber damit umgingen (die würden das schon aus interesse verfolgen). Ob sie je nach Beiträgen versuchen würden Ärger zu machen. Oder Nutzer bestrafen, die dort etwas machen was im eigentlichen Forum nicht erlaubt ist.
Ein absolut unmoderiertes nicht kontrolliertes Forensystem (ähnlich dem Usenet) dass über den Browser nur auf fremden Seiten erscheint und fernab der Kontrolle der Betreiber der Foren oder Seiten *träum* agiert. Es wäre ja auch auf der Seite jeder Firma zu nutzen die eigentlich kein eigenes Forum hat. Der unzuverlässige Händler böte so ohne etwas dagegen unternehmen zu können eine Plattform für geprellte Kunden, was auch die potentiellen Neukunden sehen können. Die einzige Möglichkeit das zu verhindern wäre die eigene Seite zu schließen .
-
Wenn ich hier Beiträge verfasse und ich diese Beiträge plötzlich in einem anderen Forum wiederfinde, dann ist das illegal. Und man hat nicht das Recht, alles was veröffentlicht wird, sich auf seinem Rechner zu kopieren.
-
Auch wenn das so ist, ist diese Antwort Off-Topic.
Dann begeht auch Archive.org Rechtsbrüche. Ich meine da gibt es aber Gerichtsentscheidungen die das verneinen.Und der Dt. Staat zwingt doch praktisch schon jeden Forenbetreiber dazu seine Beiträge an das Bundesarchiv zu senden. Wer es nicht tut muss Strafe zahlen.
Auch wenn das noch nicht eingefordert wird, das Gesetz gibt es wohl schon.Wenn sie könnten oder wollten, könnten sie selbst auch jedes Forum spidern und archivieren. Und diese Daten sind in so einem Archiv genau so für Jeden zugänglich.
Und was das reine kopieren auf den eigenen Rechner angeht, da ist alles erlaubt!
Ich kann mir wenn ich will auch das ganze Forum hier sichern (wenn ich es für Wert befünde für mich von Interesse zu sein). -
Da hast du schon recht, aber veröffentlichen darfst dus nicht.
UNd wenns sowas gibt, dann eben CMS-entsprechend. Aber sowas ist einfach zu aufwändig, um den geringen Sinn und Zweck, den es erfüllt, zu programmieren. -
Manche Seiten haben auch APIs, also dann ohne das HTML-Gerüst und alles (z.B. die Wikipedia).
-
Was ich wie veröffentlichen dürfte ist nicht unbedingt entscheidend.
Das kommt mir schon vor wie mit den Polizisten die sich rausnehmen zu entscheiden Nutzer eines offenen WLANS zu verfolgen.
Es gab wohl Zeiten da war es schon gefährlich ein Notebook in der Öffentlichkeit zu nutzen.
Es ist juristisch unstrittig dass offene WLANS "allgemeingut" sind. Nein, da brauchen wir auch nicht drüber zu streiten. Die Polizisten die bisher Notebooks einzogen und eine Anzeige machten haben alle verloren. Was leider bisher fehlte sind Strafanzeigen mit Schadenersatz gegen diese. Ausserdem gibt es im Polizeigesetz noch ein Gesetz dass willkürliche Ermittlungen verbietet. Da hätte man denen noch eine richtige vorsätzliche Straftat verpassen können.
Denn ich den Fällen die es gab, gab es nie einen Geschäigten der Anzeige erstattete. Zumal es schwer ist einen Schaden durchzusetzen, da ein offenes WLAN tatsächlich genutzt werden darf. Zum surfen UND sogar um sich freigegebene Dokumente anzusehen und runterzuladen. Auch wenn es private Dokumente sind. Man darf sie nur nicht löschen oder verändern.Was das mit den Foren angeht muss jeder wissen wozu er die Programme einsetzt. Ich kann auch jemand mit einem Küchenmesser abstechen.
Wenn Jemand meint seine Rechte sind verletzt, soll er Anzeige serstatten oder klagen. Aber nicht alles ist generell verboten. Muss er sich evtl. aber auch mit dem US-Recht abgeben. Denn auch ich kann mich hinter das US-Recht stellen.
Jetzt kommen sicher die Wackelzeigefiungerbelehrungen dass ich Dt. Recht unterliege, auch wenn ich in den USA hoste.
Praktisch ist es aber so, dass wenn ich in den USA hoste und nicht im WhoIs stehe die Dt. Justiz absolut machtlos ist. Auch wenn ein Urteil besteht. Machtloser als jemandand privates der den Wahnsinn eingeht dort zu klagen.
Man muss dort 50% der Schadensumme vorstrecken. Wenn man meint, "mir geht es nur ums Prinzip" um die Summe gering zu halten, macht einem der US-Richter einen Strich durch die Rechnung. Der legt dann einfach mal eine 5-stellige Summe fest. Davon sind dann 50% vorzustrecken. Und wenn das angeklagte Unternehmen (der Hoster) wirklich ein wenig zu viel bedrängt wird, kann er einfach auf dem Papier den Firmensitz wechseln. 49 mal den Bundesstaat gewechselt, Gleich 49 neu angefangene Klagen mit neuen Kosten. Wer das für ausgedacht hält, das sagte mir persönlich ein Mitarbeiter eines US-Safehosters am Telefon in nativem Deutsch (deren Auftritt ist nur in Deutsch).
Sich so kundefreundlich zu verhalten ist quasi deren Werbung. Da das deren Geschäft ist, wäre es auch fatal wenn belegbare (die Opfer der Justiz hätte ja Dokumente von Anwälten oder der Justiz) Berichte aufkämen nach denen Kunden verraten worden wären.@ The-User
Das was ausgegebene wird ist aber immer HTML. Ach bei den Foren die eigentlich php-Scripte sind.
Interpretiert wird auf dem Server, ausgegeben wird HTML. Abgesehen von Java oder Flash im Browser, aber das ist doch selten bei Foren. -
@ The-User
Das was ausgegebene wird ist aber immer HTML. Ach bei den Foren die eigentlich php-Scripte sind.
Interpretiert wird auf dem Server, ausgegeben wird HTML. Abgesehen von Java oder Flash im Browser, aber das ist doch selten bei Foren....Was er sagen will, ist dass bei einer Seite mit API die Umsetzung eines Programmes wie due es dir wünscht sehr viel einfacher wäre, egal ob die Ausgabe jetzt in HTML ist oder nicht...
Sorry, zum Thema selbst kann ich leider nichts konstruktives beitragen, die relevanten Informationen stehen ja auch schon da.
-Lukas
-
Eine API kenne ich bei Google Maps oder Youtube.
Man hat direkten Zugriff auf deren Software ohne Umweg über die HTML-Abfrage.
Aber warum sollte ein Forum oder ein Webmaster das anbieten ?
Auch "A-Tube" (PC oder iPhone) greift wohl auf YouTube als Browser getarnt zu (die PC-Version kann auch gut bei den ÖR runterladen). -
Was ich wie veröffentlichen dürfte ist nicht unbedingt entscheidend.
Sagt dir das Wort "Plagiat" etwas?
Wenn du Texte anderer Menschen nimmst und ohne diese zu fragen - nicht im privaten bereich - zugänglich machst, ist das Diebstahl geistigen Eigentums. Auch wenn du die Post-Ersteller dazuschreiben würdest, müsstest diese erst fragen, bevor du diese Beisträge veröffentlichst. Die Posts eines Forums haben normalerweise keine Lizenz (GPL, Creative-Commons, etc.).Dadurch, darfst du, ohne Erlaubnis nicht deren Texte übernehmen und wo anders einbinden.
-
Habe ich dfas bestritten oder etwas anders behauptet?
Das ist OffTopic.