Lesen Sie Artikel hinter Paywalls, indem Sie sich als Googlebot tarnen
- Kategorie: Internet
Das Internet befindet sich an einem Wendepunkt. Der anhaltende Anstieg des Adblocking hat dem Umsatzmodell ein Ende gesetzt, das für den Betrieb von Websites und Unternehmen ausschließlich auf Werbedollar beruht.
Insbesondere Nachrichtenseiten haben begonnen, mit Möglichkeiten zur Diversifizierung der Einkommensquellen zu experimentieren, und eine prominente Option, die Websites wie das Wall Street Journal, die Financial Times, die New York Times, die Zeiten , oder die Washington Post haben das Paywall-System implementiert oder getestet.
Es gibt verschiedene Arten von Paywalls, aber alle haben gemeinsam, dass sie den Zugriff auf Inhalte blockieren. Dies kann direkt geschehen, wenn der erste Artikel geöffnet wird, nachdem eine bestimmte Anzahl von Artikeln vor Ort gelesen wurde, oder als Auszugssystem, das dem Leser den ersten Absatz und darunter die Anmeldeinformationen anzeigt, um den Rest zu lesen.
Bei Paywalls müssen Benutzer möglicherweise nicht immer Geld für den Zugriff bezahlen. Bei einigen Websites müssen sich Benutzer möglicherweise anmelden, um die Website nutzen zu können. Die Benutzer werden jedoch nach der Anmeldung nicht mehr aufgeladen.
Aus geschäftlicher Sicht mag dies sinnvoll und lukrativer sein, als sich mit Benutzern zu messen, die Adblocker ausführen. Dies hat jedoch sowohl für die Paywall-Site als auch für den blockierten Benutzer einen Nachteil.
Websites verlieren einen hohen Prozentsatz an Besuchern, wenn sie ein Paywall-System implementieren. Es ist unklar, wie hoch der Prozentsatz tatsächlich ist, und er variiert wahrscheinlich von Site zu Site, aber er ist wahrscheinlich viel höher als der Prozentsatz der Besucher, die die Site abonnieren, nachdem sie die Wahl haben, den gewünschten Artikel zu abonnieren.
Für Benutzer kann es sehr frustrierend sein, einem Link zu einem interessant klingenden Artikel zu folgen, um ihn nach dem Laden der Ressource nicht mehr lesen zu können. Für viele ist dies Zeitverschwendung, insbesondere wenn vor der Anmeldung oder dem Abonnieren keine Inhalte bereitgestellt werden.
Maskieren Sie Ihren Browser
Es ist kein Geheimnis, dass Nachrichtenseiten den Zugriff auf Nachrichtenaggregatoren und Suchmaschinen ermöglichen. Wenn Sie beispielsweise Google News oder Suche überprüfen, finden Sie Artikel von Websites mit dort aufgeführten Paywalls.
In der Vergangenheit ermöglichten Nachrichtenseiten den Zugriff auf Besucher von großen Nachrichtenaggregatoren wie Reddit, Digg oder Slashdot, aber diese Praxis scheint heutzutage so gut wie tot zu sein. Einige erlauben es möglicherweise noch, aber es ist Versuch und Irrtum, und die Problemumgehung kann jederzeit heruntergefahren werden.
Ein weiterer Trick, den Artikeltitel in eine Suchmaschine einzufügen, um die zwischengespeicherte Geschichte direkt darauf zu lesen, scheint nicht mehr richtig zu funktionieren, und Artikel auf Websites mit Paywalls werden normalerweise nicht mehr zwischengespeichert.
Tipp: Sehen Sie sich das folgende Add-On an, mit dem Sie Paywalls umgehen können:
User-Agent und Referrer
Sie fragen sich wahrscheinlich, wie Websites den Inhalt der Website blockieren oder den Zugriff darauf zulassen. Die Methoden haben sich im Laufe der Jahre verbessert, und es reicht nicht mehr aus, den Verweis des Browsers einfach auf https://www.google.com/ zu ändern, um vollen Zugriff auf den Inhalt einer Website zu erhalten.
Stattdessen verwenden Websites verschiedene Überprüfungen, einschließlich User-Agent, Referrer und Cookies, und manchmal sogar mehr, um die Legitimität des Zugriffs zu bestimmen.
Allgemeine Information
Der wahrscheinlich beste Weg, den Browser zu maskieren, besteht darin, ihn als Googlebot erscheinen zu lassen.
- Referrer: https://www.google.com/
- User-Agent: Mozilla / 5.0 (kompatibel; Googlebot / 2.1; + http: //www.google.com/bot.html)
Beachten Sie, dass die Option auf möglicherweise Websites nicht mehr funktioniert. Es ist möglicherweise besser, sich als von Twitter oder anderen Social-Media-Websites stammend zu tarnen.
Feuerfuchs
Firefox-Benutzer benötigen dafür zwei Browser-Add-Ons: das erste, RefControl, um den Referrer-Wert beim Besuch von Nachrichtenseiten zu ändern, das zweite, User Agent Switcher , um den Benutzeragenten des Browsers zu ändern.
Aktualisieren : RefControl ist nicht mehr verfügbar. Du darfst Versuche dies Alternative stattdessen. Ende
- Laden Sie beide Erweiterungen im Firefox-Webbrowser herunter und installieren Sie sie.
- Tippen Sie auf die Alt-Taste und wählen Sie Extras> RefControl-Optionen.
- Klicken Sie auf 'Site hinzufügen', geben Sie einen Domainnamen unter 'Site' ein, wählen Sie eine benutzerdefinierte Aktion aus und geben Sie https://www.google.com/ als Referrer ein.
- Wiederholen Sie diesen Vorgang für alle Nachrichtenseiten, auf die Sie zugreifen möchten (einige funktionieren möglicherweise nicht, selbst wenn Sie die Änderungen vornehmen. Denken Sie also daran).
- Wenn Sie fertig sind, schließen Sie das Konfigurationsfenster.
- Tippen Sie erneut auf die Alt-Taste und wählen Sie im Menü Extras> Standardbenutzeragent> Benutzeragenten bearbeiten.
- Wählen Sie Neu> Benutzeragent und ersetzen Sie die Zeichenfolge im Feld Benutzeragent durch Mozilla / 5.0 (kompatibel; Googlebot / 2.1; + http: //www.google.com/bot.html). Nennen Sie es Googlebot.
- Verlassen Sie das Menü.
- Bevor Sie auf diese Websites zugreifen, tippen Sie auf Alt und wählen Sie Standardbenutzeragent> Googlebot.
Das ist alles was dazu gehört. Es ist etwas bedauerlich, dass es für Firefox keine Erweiterung gibt, die den Benutzeragenten basierend auf den von Ihnen besuchten Websites automatisch ändert.
Google Chrome
Google Chrome-Nutzer können Erweiterungen wie installieren User Agent Switcher und Referer Control die für den Browser verfügbar sind, um dasselbe zu tun.
Es gibt jedoch eine andere Möglichkeit, nämlich eine benutzerdefinierte Erweiterung zu erstellen, die den Prozess im Browser automatisiert.
Anweisungen finden Sie am Elaineou . Grundsätzlich müssen Sie lediglich ein neues Verzeichnis auf dem lokalen Computer erstellen, die beiden darin enthaltenen Dateien background.js und manifest.json erstellen und den auf der Site gefundenen Code kopieren und in die Dateien einfügen.
Sie müssen den 'Entwicklermodus' für chrome: // extensions / aktivieren und dann 'entpackte Erweiterung laden' auswählen, um den Ordner auszuwählen, in dem Sie die beiden Dateien erstellt haben, um die Erweiterung in Chrome zu laden.
Sie können die Liste der unterstützten Websites ändern, um neue hinzuzufügen.