Neue Beiträge:

Spieglein, Spieglein in dem Netz...

Signal sorgt für ein klares Signal von Facebook:

Facebook is more than willing to sell visibility into people’s lives, unless it’s to tell people about how their data is being used. Being transparent about how ads use people’s data is apparently enough to get banned; in Facebook’s world, the only acceptable usage is to hide what you’re doing from your audience.

Was war geschehen? Signal hat Anzeigen bei Facebook geschaltet, die den Benutzern vor Augen führt, welche Dinge Facebook über sie weiß. Fand Facebook nicht lustig. Aber dass dieser Laden ein unsportlicher Misthaufen ist, war ja schon länger bekannt.

Hinzufügen zur langen Liste von Gründen, warum es sich für jeden Menschen auf diesem Planeten lohnt, Facebook und anderen Datenkraken endlich den Rücken zuzukehren.

Permalink

Kurzgebratenes (10): Gesundheitsdaten, DigitalOcean, Linux-Backdoor, Facebye, Googlebye

Heute mit diesen Themen im Angebot:

Gesundheitsdaten in Nextcloud

Ich bin noch nicht fertig damit zu überlegen, was hier alles an Totalschäden möglich ist: Es gibt Bestrebungen, nach denen man besonders intime Daten in der "eigenen" Cloud (konnektiert zum offenen Internet) hosten soll.

Dafür wurde eine neue App für Nextcloud entwickelt, mit deren Hilfe man seine Gesundheitsdaten verteilen kann - und entscheiden darf, wer die Empfänger sind.

The Kailona app basically does three things:

  • receive data from your doctor, hospital and other medical care providers and store it securely
  • let you view and learn from this data to track and improve your own health
  • allow you to share, 100% on your terms, with health care providers, friends or even medical research organizations

Ich muss dazu noch mal gesondert was schreiben, auf wie vielen Ebenen die Idee hinkt, das braucht etwas Zeit.

Datenpanne bei DigitalOcean

DigitalOcean ist ein sehr bekannter, sehr großer Webhosting-Dienstleister aus den USA. Die haben eine nette Tutorial-Ecke, auf die ich früher ab und zu mal Azubis für kleine Lektionen zum Spielen losgelassen habe.

Es sind ein paar Kundendaten an Stellen gelandet, wo sie nicht hingehören.

An unauthorized user gained access to some of your billing account details through a flaw that has been fixed. This exposure impacted a small percentage of our customers.

The following billing profile information was accessed:

  • Billing Name
  • Billing Address
  • Payment Card Expiration
  • Last 4 Digits of Payment Card
  • Payment Card Bank Name

Auch (oder vielleicht gar erstrecht) bei den großen Hostern, denen man eigentlich von einem besonders hohen Schutzniveau der Daten ausgehen will (aber nicht sollte), sind die eigenen Daten nicht sicher. Schade, aber kann man nix machen, der Algenrhythmus ist schmulz.

Fiese Linux-Malware

Gemeine Backdoor für Linux-Systeme, die schon länger existiert und unbemerkt blieb. Hier noch eine Detailanalyse.

However, the functions built into the malware can be categorized as collecting device information, stealing sensitive information, and managing the plug-ins. The researchers do not yet know how the malware spreads or is delivered.

Aber, aber... *fingernägelkau* ich dachte, Linux sei ein sicheres System, da gibt's keine Viren?!? Also doch? Na dann kann ich auch wieder zu Windows zurück.

Schau, schau, Schu-Schufa in den U-U-SA

In einer (gibt mehrere) amerikanischen Version der Schufa gibt es wohl ein "undokumentiertes Feature", das man als interessierter Nutzer zum Zwecke des Datenabgriffs einsetzen kann. Und zwar scheint es laut Krebs möglich zu sein, eine API anzuzapfen, um an Kreditwürdigkeits-Infos von Leuten zu kommen. Und zwar ohne Authentifizierung.

Entdeckt hat das ein Student, der auf Kreditsuche war.

Demirkapi found the Experian API could be accessed directly without any sort of authentication, and that entering all zeros in the “date of birth” field let him then pull a person’s credit score. He even built a handy command-line tool to automate the lookups, which he dubbed “Bill’s Cool Credit Score Lookup Utility.”

[...]

In addition to credit scores, the Experian API returns for each consumer up to four “risk factors,” indicators that might help explain why a person’s score is not higher.

Also ganz ehrlich - der Schufa würde ich solche Geschäftspraktiken auch zutrauen.

Mit und ohne

Mann, mann. Benutzt man ein Handy, ist das schlecht für die Privatsphäre. Benutzt man keines, ist das auch nicht gut. Wie man's macht...

Noch mehr Facebye

Für diejenigen, die überlegen, mit Facebook Schluss zu machen: Tut es. Hier ein schöner Post, warum. Sowas verlinke ich immer wieder gern.

Googlebye, die Erste

Hat zwar nicht direkt was mit Datenschutz zu tun, aber Argumente gegen Datenkraken sammle ich ja auch gern. Habt ihr eine Android-App im Store? Nutzt ihr Google Ads parallel? Mal schauen, wie lange noch.

Under AdSense/AdMob, Google pays you when users click on your ads; if you click on your own ads, that’s “click fraud.” Google can and frequently does kick people off of AdSense, claiming “click fraud,” without sharing any evidence with the people they’re banning.

Googlebye, die Zweite

Und noch einer zu Google:

The Google Play system has declared DroidScript is Malware and accused us of committing Ad Fraud! Needless to say, we are extremely upset and totally flabbergasted at this shocking allegation.

Man kann ja von DroidScript halten, was man will, aber über das Gebahren von Google kann's eigentlich nur eine Meinung geben.

Permalink

Luca? Nervt.

Mich fragte ein concerned citizen, was ich von der App Luca halte. Gibt schon viele Leute, die direkt was zur App geschrieben haben. Ich will noch was hinzufügen:

Der Fisch stinkt ja vom Kopf her, sagt der Volksmund.

Es fängt schon mal damit an, dass diese App von einer (offensichtlich extra für Luca neu gegründeten) Berliner Hipster-Bude zusammengeklopft wurde, die sich mit dem Backing der Fanta4 und einem wichtigen wissenschaftlichen Hintergrund brüstet. Und dann mit einem Buzzword-Bullshit wie diesem um die Ecke kommt:

...haben das klare Ziel, Sicherheit, Data Privacy, Integration und UX in Produkten zu vereinen. [...] Von unseren Produkten erwarten wir noch mehr: Sie müssen sich um den Menschen herum formen. Der ständige Abgleich des Produkts mit unseren Werten stellt sicher, dass wir dieses Ziel nicht aus den Augen verlieren...

Wenn der Begriff "unsere Werte" (oder "Haltung" oder "Storytelling") fällt, sind wahrscheinlich doch eher Werber in ihren Agenturen die treibende Kraft. Und wenn den Werbern nur noch dieses wolkige Werte-Geschwurbel einfällt, sind ihnen die wirklich werthaltigen USPs für Produkte oder Leistungen ausgegangen. Wenn Werber eine App basteln (lassen), bei der es auf Datenschutz und Datensicherheit ankommt, ist für mich der Zug eigentlich schon abgefahren. Aber ... noch muss der benefit of doubt gelten.

Schauen wir mal weiter:

Man biedert das Produkt auf einem von Dritt-Plugins durchseuchten Wordpress-Gebastel an, schafft es nicht mal, ein eigenes Frontend zu entwickeln und klickt sich stattdessen irgendein Kauf-Theme zusammen.

Man kupfert das Impressum (Screenshot) von einer Generator-Website ab.

Die sind nicht in der Lage, auf ihrer Hauptdomain culture4life.de ein valides SSL-Zertifikat zu installieren, so dass keine Warnmeldungen (Screenshot) erscheinen, wenn man sich mal nach der Firma erkundigen will.

Die laden ungefragt Ressourcen (Screenshot) von Drittdomains auf ihrer Homepage.

Und nach dieser Schlamperei bei den Basics soll ich denen abkaufen, dass sie Datenschutz ernstnehmen? Oder Software-Sicherheit? Denen soll ich anvertrauen, mit wem ich wann und wo unterwegs war? Ggf. meinen Gesundheitsstatus?

Und wir reden hier noch nicht mal von der App selbst. Da verlinke ich noch diese Datenschutz-Einschätzung hier und diesen offenen Brief, verschwende aber meine Zeit ansonsten nicht weiter mit dem Thema. Und versuche auch nicht darüber nachzudenken, dass Abermillionen von Steuergeldern diesen Scheiß tatsächlich kaufen.

Permalink

Wenn die KI entscheidet

Allmählich muss ich eine Liste anfangen mit Beispielen, die mir nur beim Rumsurfen über den Weg laufen: Von Beispielen, warum es zum Teufel noch mal immer wieder, immer öfter, eine völlig hirnentleerte Idee ist, die Entscheidungsfindung (unbeaufsichtigt) irgendwelchen künstlichen "Intelligenzen" zu überlassen.

Hier ist noch eines dieser Beispiele:

Googles KI für die Untersuchung, ob Software für den App-Store geeignet und gut oder böse ist, entscheidet falsch. Aber das ist nicht das eigentliche Problem. Sondern, dass KIs überhaupt die Entscheidung treffen dürfen. Wichtige Entscheidungen, die gravierende Folgen für einzelne oder viele Menschen haben kann.

Man soll mich mal nicht falsch verstehen: Ich mag "KI". In einem guten Computerspiel. Oder in einem lustigen Psychiater-Chatbot. Oder in Form von Sprachassistenzen, die mir harmlose Wünsche erfüllen, zum Beispiel einen Song spielen oder mir helfen neue Musik zu entdecken.

Aber wenn Leute diskriminiert werden, ins Gefängnis müssen, wenn die Demokratie vor die Hunde geht, wenn Menschen unter Generalverdacht gestellt und im schlimmsten Fall erschossen werden, wenn sie über den Haufen gefahren werden, weil eine KI eine falsche Entscheidung getroffen hat, dann...?

Was hat das jetzt alles mit Privatsphäre oder Datenschutz zu tun? Ich bin von der Fahrbahn abgekommen, herrje. Hätte doch nur eine KI die Karre gesteuert.

Permalink

Kurzgebratenes (9): Versteckte Warnungen, Software als Henker, Deepfakes (schon wieder), Facebook

Permalink

KI-Überwachung unerwünscht, außer im Auftrag des Staates

Die EU-Kommission will KI regulieren. Man wünscht sich, dass diese Technik nicht missbräuchlich verwendet wird.

Ebenso soll KI-Überwachung oder Manipulation verboten werden. Hier sind jedoch Ausnahmen für staatliche Stellen geplant, sofern sie der öffentlichen Sicherheit dienen und gesetzlich legitimiert sind.

Und wer schützt uns vor missbräuchlicher Verwendung durch Staatsbedienstete?

Wie gut das funktioniert mit "KI" und Sicherheit und Monitoring von staatlicher/behördlicher Seite, das sehen wir gerade im großen Stil in den USA und anderswo.

Achja: Es soll eine Kennzeichnungspflicht für Deepfakes geben. Lasst mich mal überlegen, zu welchem Zweck Deepfakes besonders interessant und gefährlich sind?

Propaganda und Betrug vielleicht? Und diese Akteure scheren sich ganz bestimmt sehr um eventuelle Pflichten bezüglich Kennzeichnung und Transparenz.

Für den Staat gelten natürlich auch wieder Ausnahmen, was Deepfake-Kennzeichnung angeht.

Meine Fresse, was für eine Farce.

Permalink

Am Daten-Anus geleakt - schon wieder

Also... also, Facebook, das ist schon so ein Verein.

A video circulating on Tuesday showed a researcher demonstrating a tool named Facebook Email Search v1.0, which he said could link Facebook accounts to as many as 5 million email addresses per day. The researcher—who said he went public after Facebook said it didn't think the weakness he found was "important" enough to be fixed—fed the tool a list of 65,000 email addresses and watched what happened next.

Ratet mal, was als nextes happened.

Übrigens möchte Facebook nicht immer allein dastehen als Datenschutz-Verbrecher. Sie würden wohl sehr gerne relativieren und klarstellen, dass die Scraping-Probleme, also das Rauslutschen von personenbezogenen Daten z.B. aus irgendwelchen "legitimen" Schnittstellen oder halboffenen Profilen, selbstverständlich ein industrieweites Problem sind, und man sich als Betroffener damit halt arrangieren muss. Ich zitiere ein belgisches Online-Magazin, das nach eigenen Angaben über eine interne Mail von Facebook verfügt, die folgendes beinhaltet:

Assuming press volume continues to decline, we're not planning additional statements on this issue. Longer term, though, we expect more scraping incidents and think it's important to both frame this as a broad industry issue and normalize the fact that this activity happens regularly.

Auch wenn sich dieses Mail-Leak nicht verifizieren lässt - der verlogenen, verschleiernden Kommunikationstaktik von Facebook entspricht das total, siehe auch und auch und auch und auch und auch...

Permalink

Messaging-Services: Vertrauen ist schlecht, Vermeidung ist besser

Kurzes Vorgeplänkel: Ich bin mal wieder - bedauerlicherweise zurecht - mit dem Vorwurf konfrontiert worden, dass meine "Aufklärungsarbeit" im Blog Leute vor den Kopf stößt. Und zwar genau die Leute, die eigentlich sensibilisiert werden sollen, mehr auf Datenschutz zu achten.

Mir rutschen immer mal wieder unnötig zynische, sarkastische Kommentare durch, die der Sache nicht unbedingt dienlich sind. Das finden zwar vielleicht die Leute lustig, die sich in einer ähnlichen Situation befinden wie ich, aber die anderen nicht unbedingt.

Klargestellt sei: Das hier ist mein Blog, also kann ich grundsätzlich damit fast alles machen, was ich will. Für mich ist das Schreiben hier auch Therapie, da ich jeden Tag aufs Neue sowohl im privaten als auch beruflichen Umfeld mit Datenschutz-Irrsinn konfrontiert werde, und mir einbilde, auch die mittel- bis langfristigen Folgen aktueller Vorgänge insbesondere in den Bereichen Staat und Gesetz abschätzen zu können. Und in dieser Hinsicht graut es mir derzeit vor der Zukunft in Deutschland und Europa.

Mein Wunsch (siehe auch) ist grundsätzlich, Menschen zu informieren und ihnen klar zu machen, dass es von Vorteil ist, wenn private Daten privat bleiben. Und dass die Bürger ihre Kontrollmacht, die tatsächlich immer noch existiert(!), gegenüber Staat und Gesellschaft wahrnehmen und einsetzen sollten. Das ist eine zunehmend mühselige Sisyphos-Arbeit, da es immer weniger interessierte und immer mehr überforderte Menschen gibt. Und ich meine nicht Überforderung im Sinne, dass die Menschen immer dümmer werden, sondern dass das Leben der Menschen unter anderem durch undurchschaubare Technik und Informationsoverkill so komplex geworden ist, dass sie es nicht mehr überblicken können.

Dieser Blog hier ist auch ein Fanal für mich, Druck abzulassen und Frust zu formulieren.

Warum der ganze Rechtfertigungssermon?

Ich hatte vor Kurzem eine Diskussion mit einer Person, die ich davon zu überzeugen versuchte, dass Nachrichten in Messengern, wenn einmal in Umlauf geraten, nicht wieder zurückziehbar sind. Mag sein, dass Whatsapp, Telegram, Signal & Co. Funktionen bieten, mit denen man angeblich auch die eigenen Meldungen bei den Empfängern löschen kann.

Aber: Nein, ihr könnt nix zurückziehen. Ist mal was irgendwohin übertragen, ist die empfangende Stelle in der Lage, die übertragenen Daten zu behalten. Von mir aus mittels Screenshot, Copy&Paste, whatever. Es gibt auch Tools wie dieses hier, das das Speichern von Archivieren von Nachrichten automatisiert - selbst dann, wenn sie vom Sender gelöscht wurden, bevor der Empfänger sie aktiv begutachtet hat.

Heißes Thema auch im Rahmen von Sexting oder solchen Sachen, wenn akut triebgesteuerte Menschen sich ihre Phantasien oder Geschlechtsteile via Snapchat zuschicken und denken, dass das Material ja gleich wieder gelöscht wird.

Diese Diskussion zum Thema "Messages löschen" war sehr anstrengend. Weil die Person blindes Vertrauen in die Technik bzw. den Anbieter setzte. Sie ließ sich zwar durch harte Fakten und einen Live-Beweis überzeugen. Aber besser wär's, wenn man sich als Nutzer vorher mit der Materie beschäftigt und sein Hirn anstrengt, bevor das Kind in den Brunnen gefallen ist; insbesondere dann, wenn es um sensible Daten geht.

Und so einen simplen Gedankengang, dass Daten, die man via Internet an jemand anders weiterreicht, unwiderruflich weitergereicht sind - ganz egal, was die Übermittlungsdienstleister versprechen - muss ich jedem Erwachsenen zutrauen dürfen, der das Internet benutzt (Kindern nicht, die müssen das alles erst lernen).

Solche Erlebnisse sind es, die mir zu schaffen machen und über die an dieser Stelle zu berichten, auch mit manchmal sehr zynischen Spitzen, mir persönlich hilft, weiterzumachen.

Permalink

Spieleplattformen als Angriffsvektor

Ich schrieb vor einer Weile was zum Thema Datenschutz und Computerspiele; dass das ein heikles Thema sei, und so fort und so weiter.

Mindestens genauso heikel ist die Tatsache, dass Spiele, insbesondere, wenn sie online stattfinden und über einschlägige Vertriebsplattformen wie Steam bezogen werden, ein Datensicherheitsproblem darstellen.

Beispiele gibt es seit Jahren, aber mit einem so prominenten Fall hat man es nicht oft zu tun: Offensichtlich hat es jemand geschafft, einen Exploit zu entwickeln, der die Einladungsfunktion von Steam nutzt, um administrative Kontrolle von Rechnern zu ergattern, auf denen gerade Counterstrike Global Offensive läuft. Das ist ein beliebtes Online-Spiel, das im letzten Monat immerhin ungefähr 750.000 Menschen im Tagesdurchschnitt gespielt haben.

Über die Codequalität von Spielen und Spieleplattformen haben sich andere Leute ausgelassen (aktuelles Beispiel), das ist nicht meine Expertise. Aber gegenüber Leuten, die am PC gerne Spiele spielen, darf man nicht müde werden zu empfehlen, dass die Instanz des Betriebssystems, auf dem die Spiele laufen, von datenschutzrelevanten Bereichen des Rechners und ggf. des Heimnetzwerks abgeschottet sein muss.

Und ich will euch, sofern ihr mit der Materie nicht vertraut seid, erklären, warum.

Denken wir den Exploit mit Counterstrike weiter: Wenn jemand administrativen Zugriff auf euren Rechner hat, kann er damit machen, was er will. Zum Beispiel eure Festplatte löschen, oder die Pr0n-Sammlung sichten, giftige Emails in eurem Namen verschicken, was man so halt tut mit einem PC. Aktuell beliebte Gemeinheiten sind Krypto-Schadprogramme, die eure Daten verschlüsseln und Lösegeld erpressen.

Sagen wir weiter, ihr habt ein NAS als Datengrab im Keller stehen, auf dem Milliarden Familienfotos, eure Steuererklärungen, Rechnungen, Korrespondenz, Musiksammlungen, DVD-Rips und all der andere Digitalmüll lagert, den man so über die Jahre sammelt.
Unter meinen Kollegen sind die Synology-NAS beliebt, mit zwei Platten im RAID 1-Verbund, d.h. die Festplatten werden sogar gespiegelt, damit der Ausfall eines Datenträgers nicht den vorzeitigen Datentod bedeutet. Sehr löblich. Ich habe mir aus Bastelwut ein eigenes NAS gebaut. Aber die Synology-Dinger sind für Nutzer ohne Bastelwut nicht verkehrt (wenn man nicht den Wahnsinn betreibt, sie offen übers Internet erreichbar zu machen).

Auf dem NAS sind die Daten in Freigaben verfügbar, inklusive Schreibrechten. Ihr wollt ja in der Lage sein, von eurem Computer aus Daten in den Netzwerkspeicher reinzuschaufeln.

Aber wenn nun jemand administrativen Zugriff auf euren Rechner hat, was kann er dann tun? Genau: eure Daten auf dem NAS löschen, verändern, verschlüsseln, runterladen, whatever. Weil: Euer Computer hat ja Schreibrechte. Und ich gehe davon aus, dass die große Mehrzahl der User (mich eingeschlossen) zu faul ist, eventuell gesetzte Passwörter für die Freigaben immer wieder aufs Neue einzugeben. Daher werden die Zugangsdaten gespeichert und automatisch eingegeben, wenn ihr versucht, auf die Freigabe zuzugreifen. Noch angenehmer für Angreifer ist natürlich, wenn eure NAS-Freigaben überhaupt keinen Schutz haben, sondern für alle Nutzer des Netzwerks offen zugänglich und schreibbar sind.

Benutzt ihr Keypass oder andere Passwort-Speicher? Na klar, dann kann der Angreifer auch dieses Zeug ausleiten. Weitere Potenzielle Katastrophen wie das Kaputtmachen anderer Geräte im Heimnetz, auch der Missbrauch eventuell vorhandener Smarthome-Applikationen (Heizungen, Rollläden, Lichter etc.), will ich gar nicht im Detail ausführen, da vertraue ich auf eure Phantasie.

Das ist ja alles HAARsträubend grausam gemein und niederträchtig, immer will man meine Daten klauen, zerstören, mein Leben ruinieren! Was huhn? Gack, gack!

Zuerstmal sollte man sich einen Überblick verschaffen, was sich da im Heimnetz für Geräte tummeln und welches Risiko besteht, dass die Böses einschleppen.

Ein durchschnittliches Setup dürfte heutzutage folgendermaßen aussehen:

Was kann man nun tun, um wenigstens ein Minimum an Sicherheit zu gewährleisten, damit einem im Falle eines kompromittierten Geräts nicht gleich alles um die Ohren fliegt?
Ich wills nicht übermäßig kompliziert machen, weil sonst alle weniger versierten Nutzer aussteigen.

  1. Euer Router hat sehr wahrscheinlich eine Funktion für Gast-(W)LAN. Der Vorteil eines solchen Gast-(W)LANs ist, dass es zwar den Zugriff aufs Internet gestattet, aber keinen Zugriff auf das interne Netzwerk. Will heißen: Wenn ihr euch auf einem Smartphone was Böses einfangt und damit im Gast-Netz rumsurft, sind die Daten auf dem NAS normalerweise nicht gefährdet. Gilt natürlich auch für kompromittierte Laptops, PCs, iPads & Co.
    Hat aber auch den Nachteil, dass ihr auf Videos, Fotos oder solches Zeug, das auf dem NAS liegt, nicht mit den Geräten im Gast-WLAN zugreifen könnt.
  2. Einen vertrauenswürdigen Rechner bestimmen, der als Einziger Schreibzugriff aufs NAS hat und somit die Verwaltung der Daten übernimmt. Alle anderen Geräten, die unbedingt Dinge vom NAS anschauen müssen, werden dann zwar ins interne Netz gelassen, erhalten aber nur lesenden Zugriff.
    Das lässt sich normalerweise durch verschiedene Freigabe-Accounts auf dem NAS erreichen - ein Account mit Schreibrechten für den vertrauenswürdigen Computer, ein Account mit Leserechten für alle anderen Geräte.
  3. Spiele-PCs, Konsolen etc., die wild im Internet auf Online-Plattformen wie Steam, PSN oder Nintendo marodieren, ist grundsätzlich nur Gastzugang zum Netz zu gewähren. Die haben nix im internen Netz verloren, siehe den eingangs beschriebenen Counterstrike-Fall. Keine Ausnahme, keine Kompromisse, was Gaming-Geräte angeht.

Es gibt jetzt bestimmt Leser, die noch andere, viel komplexere Vorschläge hätten, mit Router-Kaskaden, zwischengeschalteter Firewall, DMZs, etcpp.
Ist aber - so gut diese Lösungen auch sein mögen - an der Realität der großen Masse an Nutzern vorbeigedacht. Ich bin eher dafür, den Menschen ein Whitelisting-Bewusstsein einzuimpfen, als sie mit komplizierten Setups zu überfordern. Denn ein halbwegs vernünftiges Setup kriegt man auch mit einfachen Mitteln hin. Es geht hier nicht um Technik, sondern um Methodik.

Der Grundgedanke muss lauten: Geräten immer nur Zugriff auf das gewähren, was sie unbedingt benötigen. Und schützenswerte Daten so gut es geht schützen.
Euer NAS etwa ist die Schatztruhe, die solltet ihr bestmöglich vergraben (in ein internes Netz), und den Schlüssel (Passwort) sehr gut bewachen.
Andere Geräte sind grundsätzlich erst mal abzuschotten - keine Freigaben, wenns nicht unbedingt sein muss. Und wenn, dann nur durch Passwortschutz.

So leid's mir tut - euer Heimnetzwerk ist kein sicheres Netzwerk.

Permalink

Macht doch mal euer eigenes Spiegel-Mining-Projekt

Überwachung mal andersrum: Wie wäre es denn, wenn wir einen auf David Kriesel machen, um die Online-Historie von Behörden, Unternehmen und anderen Entitäten, die eindeutig einer Überwachung durch die Bürger bedürfen, zu dokumentieren?

Wer David Kriesel nicht kennt: Ein so genannter Data Scientist, sympathischer Kerl mit ein paar spannenden Ideen, unter anderem das Projekt Spiegel-Mining. Er hat über einen längeren Zeitraum die Inhalte der Online-Ausgabe des Spiegel runtergeladen und diverse interessante Dinge herausgefunden, u.a. dass Headlines manipuliert werden, um Klickraten zu optimieren, oder wie es um die Debattenwilligkeit bei kritischen Themen bestellt ist, wer von der Redaktion mit wem ins Bett geht oder in den Urlaub fährt, u.a.

Nun ist das, was der David da getan hat, nämlich Daten runterladen und auswerten, eine eher unhandliche Angelegenheit, wenn man nicht ohnehin schon im Bereich der Data Science unterwegs ist und seine Tools zur Hand hat.

Es gibt eine interessante OpenSource-Lösung, die nennt sich ArchiveBox. Dabei handelt es sich um Grunde um eine Anwendung, die im Wesentlichen das Gleiche tun soll wie das Internet Archive, nämlich in regelmäßigen Abständen Snapshots von Websites oder Webanwendungen zu machen, und diese in einem universellen, möglichst lange (>100 Jahre) nutzbaren Format zu archivieren. Auf Wunsch inklusive eventueller Downloads, Videos etc.

Man gibt einfach eine URL ein oder definiert eine ganze Website mit beliebiger Navigationstiefe und los gehts. Selbstverständlich sollte man - so als Privatnutzer im Kontext des Heimnetzwerks - ein bisschen im Blick behalten, wie viel Speicherplatz das so schluckt, und vielleicht nicht gleich das ganze Web archivieren wollen. Aber für bestimmte Fälle ist das ein interessantes Tool. Werde ich mal ausprobieren und meine Erfahrungen berichten.

Permalink

[Ältere Beiträge im Archiv]