Ein Logbuch:Netzpolitik Spezial zum BogusBazaar
Heute begrüßen wir wieder einmal kantorkel in unserer Runde, da er in den letzten Monaten fleissig Datenklempnerei betrieben hat und ein paar Datenlecks untersucht hat. Am Ende der Recherche stand die Aufdeckung eines riesigen Netzwerks von Fake Shops, die im Netz im großen Stil Luxusgüter feilbieten und die von den Bestellern überwiesenen Zahlungen aber nie mit entsprechenden Lieferungen beantwortet haben. Wir reden darüber, wie kantorkel der Sache auf die Spur gekommen ist und wie diese Netzwerke intern funktionieren und wie schwierig es ist, diesen das Handwerk zu legen.
Dazu gibt es noch etwas Feedback und ein Bonus Datenleck der Gamescom.
Für diese Episode von Logbuch:Netzpolitik liegt auch ein vollständiges Transkript mit Zeitmarken und Sprecheridentifikation vor.
Bitte beachten: das Transkript wurde automatisiert erzeugt und wurde nicht nachträglich gegengelesen oder korrigiert. Dieser Prozess ist nicht sonderlich genau und das Ergebnis enthält daher mit Sicherheit eine Reihe von Fehlern. Im Zweifel gilt immer das in der Sendung aufgezeichnete gesprochene Wort. Formate: HTML, WEBVTT.
Transkript
Verwandte Episoden
Shownotes
Prolog
- de.wikipedia.org: Vatertag – Wikipedia
kantorkel
- logbuch-netzpolitik.de: LNP422 Bundesverdienstcoin
- ccc.de: CCC | CCC erbeutet Biometrie-Datenbank des US-Militärs
- media.ccc.de: Hide and seek ‒ über die Biometrie-Datenbank des US-Militärs
- media.ccc.de: Disclosure, Hack and Back
Feedback
DSGVO vs LLMs
- logbuch-netzpolitik.de: Kommentar von Wiebke
- media.ccc.de: Lass mal das Innere eines Neuronalen Netzes ansehen!
- logbuch-netzpolitik.de: Kommentar von Stefan Thesing
Bezahlkarte
- logbuch-netzpolitik.de: Kommentar von Lipfi
GamesCom Datenleck
golem.de: MÖGLICHE SCHWACHSTELLE ENTDECKT : Plötzlich Zeuge
BogusBazaar
Primärveröffentlichungen
- srlabs.de: BogusBazaar: A criminal network of webshop fraudsters
- zeit.de: Gefälschte Onlineshops: Wie chinesische Betrüger mit Fakeshops Millionen machen
- theguardian.com: Chinese network behind one of world’s ‘largest online scams’ | Scams | The Guardian
- lemonde.fr: Online scams: Behind the scenes of the world’s largest network of fake online retailers
- lemonde.fr: Arnaques en ligne: dans les coulisses du plus grand réseau de faux sites marchands au monde
Betrug- und Kartensicherheit
- verbraucherzentrale.de: Fakeshop-Finder: Prüfen Sie ob ein Online-Shop seriös ist | Verbraucherzentrale.de
- de.wikipedia.org: Payment Card Industry Data Security Standard – Wikipedia
- de.wikipedia.org: Personal Computer Memory Card International Association – Wikipedia
Weitere Berichterstattung
- heise.de: Über 850.000 Opfer: Bande in China steckt hinter zehntausenden Fake-Shops
- heise.de: BogusBazaar: gang in China behind tens of thousands of fake stores
- theregister.com: Fake e-commerce network scams $50M from Euro, Oz, US buyers • The Register
- bleepingcomputer.com: Massive webshop fraud ring steals credit cards from 850,000 people
- tomsguide.com: Over 850,000 people hit with online shopping scam that steals credit cards — how to stay safe | Tom’s Guide
Wenn man in die Definition der DS-GVO bezüglich „Verarbeiten“ schaut, ist tatsächlich auch das „Gegen eine Wand Werfen personenbezogener Daten“ eine Verarbeitung, also wortwörtlich: Verarbeiten ist „jeder […] Vorgang […] im Zusammenhang mit personenbezogenen Daten“ (Art. 4(1)). Der Anwendungsbereich der DSGVO wird nicht eröffnet sein, da sie nur gilt, wenn nicht-automatisch in einem Dateisystem verarbeitet wird, und eine Wand wird kein Dateisystem sein.
Ich stell mir mal vor es werden – von AI oder sonst jemand – Daten über jemanden gefunden, erzeugt, verarbeitet und auf Anfrage veröffentlicht, die leider falsch sind oder persönlicher Natur und nicht für die Öffentlichkeit gedacht.
Da find ich zumindest dringend geboten, daß die AI angeben kann wo sie die Daten her hat, damit eine betroffene Person dagegen vorgehen kann. Und das Recht der AI den Mund zu mir verbieten hätt ich in so einem Fall auch gerne.
Sehr spannend und vor allem schön, dass man sich darauf verlassen kann, zu allen größeren „Datengeschichten“ die Hintergrundinfos direkt in LNP auf die Ohren zu bekommen!
Die Frage, wer überhaupt ein Interesse an Aufklärung hat, musste ich mir neulich auch stellen, als mir so 150 EUR durch ein Expedia-Phishing abhanden gekommen sind, die Expedia dann aber schnell erstattet hat:
https://machteburch.social/@tomkalei/112302910371860915
https://www.mdr.de/nachrichten/deutschland/panorama/betrug-masche-expedia-booking-100.html
Das Interessante hieran war, dass Expedia mich überzeugt hat auf das Phishing hereinzufallen, nachdem ich sie eigentlich auf ihr Sicherheitsproblem hinweisen wollte … lange Geschichte. Aber am Ende wurde mir mein Geld + etwas Entschädigung erstattet und niemand will darüber reden.
25000 Webshops sind natürlich interessant. Auf die gleiche Größenordnung kommt man vielleicht, wenn man irgendwie alle Hotels angreifen könnte, die auf Booking / Expedia inserieren und vielleicht die gleiche Software benutzen, um das abzuwickeln. Wenn die eine Schwachstelle hat, die es erlaubt, den Kunden Nachrichten zu schicken, kann man das gut skalieren und ganz viele kleinere Beträge einsammeln (bzw. einfach Kreditkartendaten).
Zu „Bank erstattet das dann schnell und unkompliziert“ noch der Kommentar, dass diese VISA Debitkarten auch deshalb bei Banken so populär sind, weil da viel weniger versichert und erstattet wird. In meinem Fall habe ich die Betrugstransaktion mit 2. Faktor autorisiert, was bei diesen Webshops/Stripe sicher auch normal wäre. In diesem Fall kommt man an das Geld nicht wieder heran, das steht in den Kartenbedingungen. Alles, was per Visa Secure autorisiert wurde, ist final. Die Bank und der Zahlungsdienstleister haben kein Interesse daran, da irgendwas aufzuklären oder Chargeback auszulösen.
Hallo Linus,
Hallo Tim,
Hallo Kantorkel,
Einen Gedankengang habt Ihr garnicht beleuchtet; wenn die Gang jetzt ihre Webshops und sonstige Infrastruktur wasserdicht und nach dem Stand der Technik aufsetzt – dann stolpert auch kein Kantorkel mehr darüber! Jetzt schon will niemand diese kriminellen Machenschaften verfolgen. Wenn das in Zukunft komplett ins dunkle Netz abtaucht? Was bedeutet das für den Online-Handel oder noch größer: Was bedeutet das für das INTERNET ??
Ich verstehe überhaupt nicht, wie man sich so verrenken kann, um zu sagen, dass LLMs die Daten nicht speichern. Natürlich speichern sie die. Ob man neuronale Netze mit einer Datenbankvergleichen kann? Natürlich sind sie eine Datenbank. Die Daten werden zwar in einer irreversiblen Art komprimiert, aber das ist alles andere als neu in der IT.
Was ist mit JPEG und Co? Da werden aus Pixeldaten irgendwelche Kurven, die dann mit mathematischen Parametern abgespeichert werden. Ist ein JPEG von einem Bild deshalb nicht mehr das Bild? Die relevanten Informationen sind im JPEG vorhanden, selbst wenn man von den Rohdaten auf wenige Prozent Dateigröße kommt. Jeder würde sagen, es ist dasselbe Foto.
Was ist mit anderen Medienbrüchen? Was ist, wenn man eine Schallplatte auf Magnetband überspielt? Und das Magnetband dann abspielt und als MP3 speichert? Ist das dann nicht mehr dasselbe Lied? Gilt dann das Urheberrecht nicht mehr? Und selbst wenn man aus vielen Medien eins macht, das nicht mehr reversibel ist, dann ist es ein abgeleitetes Werk. Dafür spielt es nichtmal eine Rolle, ob man das Original heraushört.
Was ist mit Schwarzweißfotos von farbigen Gemälden? Was ist mit abfotografierten Texten? Am besten als JPEG gespeichert. Was ist mit Fotos von Skulpturen? Das erfasst auch nicht die Gesamtheit des dreidimensionalen Objekts. Dasselbe gilt ja dann auch für Fotos von Personen.
Mein Punkt ist: Die relevante Information für Urheberrecht und Datenschutz ist in vielen Fällen enthalten. Ob man sie wieder originalgetreu herausbekommt oder nicht, ist unerheblich. Die Vorstellung, dass mit LLMs irgendwas anders ist als mit anderen Medienbrüchen, finde ich nicht nachvollziehbar.
Ich bin auch der Meinung, dass das Urheberrecht mit Jahrzehnten nach dem Tod des Urhebers nicht zeitgemäß für das Internet ist. Ich bin auch ein absoluter Fan von freier Software, Wikikultur und Creative Commons. Aber das hat alles mit LLMs nichts zu tun. Erst recht nicht, wenn Vertreter der Copyright-Mafia wie Microsoft jetzt auf einmal vom Urheberrecht nichts wissen wollen.
Ein schönes Bespiel ist auch Code Whisperer vs. Copilot. Ersterer ist von Amazon und nennt bei jedem Codevorschlag Herkunft und Autor des Codes und die Lizenz. Laut den Klageschriften gegen Copilot war das bei OpenAI früher auch so, wurde aber absichtlich entfernt. Es wurde sogar extra Aufwand getrieben, um Autorenkennzeichnungen im Werk selbst zu entfernen.
Es gibt zumindest eine Möglichkeit aus ChatGPT den richtigen (zumindest laut Wikipedia, eventuell steht ja hier auch was falsches) Geburtstag zu finden. Wenn man es bittet im Internet danach zu suchen: https://chat.openai.com/share/036a384d-98af-4053-bec2-8c4d9b06ed5a
Ich hab’s beim Hören der Sendung auch direkt ausprobiert, aber einfach nur „Wann hat Tim Pritlove Geburtstag?“ gefragt. Interessanterweise kam ChatGPT bei mir von alleine auf die Idee, im Internet zu suchen. Vielleicht haben sie das im 4o-Modell getuned und fallen bei solchen Anfragen eher auf eine Internetsuche zurück.
Die „Herrentag“-Tradition haben Berliner Brauer anscheinend als verkaufsfördernde Maßnahme initiiert https://www.tagesspiegel.de/berlin/als-die-sohne-saufen-lernten-3627148.html
Hmm, jetzt wo ihr das mit dem Bogus Basar so erzählt. Ich glaub ich bin vor ein paar Jahren auch mal auf so einen Fake Shop reingefallen. Zu lange her für die Details, aber passt sehr gut. (In dem Fall hab ich ein Brillenmodell gesucht, was es wo anders nicht mehr zu kaufen gab).
Eine kleine Volksethymologie zum Vatertag:
An Christi Himmelfahrt fährt Christus auf zum Herrn. Deshalb wird der Tag unter Christen auch „Tag des Herrn“ (Jesus wird auch selbst der Herr genannt – es ist kompliziert mit der Dreifaltigkeit).
Von „Tag des Herrn“ ist es nicht weit zum „Herrentag“. Da viele Herren auch Väter sind und Gott der Herr auch Gott-Vater ist und Jesus der Herr gern Wein herbeizaubert, ist es ganz klar, dass das der Tag des Vaters ist, an dem jüngergleiches Umhervagabundieren und wunderhaftes Besäufnis aus väterlicher Güte geborenes göttliches Gebot ist.
Wir Christen fügen uns demütig in dies Schicksal.
Euer Link zu kantorkels Twitter-Account liefert von X die Meldung, dass dieser Account (@kantorkel) nicht existiert.
Die verlinkte Website zu ihm besagt zudem, er arbeite nicht mehr in der Arbeitsgruppe, die die Website hostet.
Nur als Hinweis, vielleicht gibt es ja aktualisierte Verweis bzgl. Eures Gastes…
Outdated information. Hab’s aktualisiert.
Ich bin erstaunt, dass euch bei dem dem Begriff „obtainen“ nicht direkt noch eine andere Wortassoziation gekommen ist. Wenn man weggeworfenes, aber noch essbares Obst und Gemuese containern gehen kann, dann kann man schlecht (oder garnicht) gesichterte Daten im Netz obtainern gehen. Ich dachte ehrlich gesagt bei Linus‘ erster Erwaehnung des Begriffs, dass es darauf hinauslaeuft :)
Tolle Folge, sehr spannend. Und an dieser Stelle mal ein Gesamtlob fuer eure Arbeit. Ich glaube nur LNP hat es bisher geschafft, mich laut zum Lachen zu bringen, und mich gleichzeitig intellektuell so anzuregen. Dabei sind es meist garnicht die Themen an sich, sondern die Exkurse ueber Moral, und eure differentierte Analyse der besprochenen Ereignisse.
Danke.
Ratespiel IT-Abkürzungen:
PCMCIA = People Can’t Memorize Computer Industry Acronyms
Ich lolte, thx.
Re Chongqing, einer der größten Städte der Welt – ich meine sogar die bevölkerungsreichste Stadt der Welt aktuell – lohnt sich da mal n Abend Internet reinzuinvestieren. Ungefähr jedes youtube video zu Chongqing trägt den Titel „This is CRAZY“ und es ist unterhaltsam
#roboterkellner
https://youtube.com/shorts/Tjss7uFrYmg?si=3kkIurhN4Y2YQb0K
#wievielte stock https://youtube.com/shorts/AORnSbXYot0?si=8L5V6ppQ3x1xbIso
#Autobahn
https://m.youtube.com/watch?v=YEEKl6gGtRM&pp=ygUSY2hvbmdxaW5nIG92ZXJwYXNz
#landstraße
https://youtube.com/shorts/l9A7pOAd468?si=ko6DvI740_ZE-VWo
#sightseeing
https://youtube.com/shorts/gxh__zOpw3g?si=6wTYWPKZTqpkjOX
#schaukeln
https://youtube.com/shorts/bV2mOLXbsvw?si=JhbbGHldLxLfduoZ
#amusement
https://m.youtube.com/watch?v=VyYS8cHHBn0&pp=ygUjQ2hvbmdxaW5nIG9yZG92aWNpYW4gYW11c2VtZW50IHBhcms%3D
Rechtstheoretische Fußnote zur Meta-Diskussion um OpenAI und DSGVO bzw. Feedback zum Feedback: die von Stephan so bezeichnete Unterscheidung von „oberer Ebene“ und „Meta-Ebene“ heißt im Fachvokabular „de lege lata“ (zu deutsch: „geltendes Recht“) und „de lege ferenda“ (deutsch: „zu schaffendes Recht“). Bei juristischen Aussagen de lege lata geht es darum, ob das Recht richtig angewendet wurde. Bei dieser Frage, so Tim selbst vor einiger Zeit, versucht ihr letztlich „in einem Code zu lesen, den wir nicht verstehen“. Das ist keine Kritik, sondern soll nur unterstreichen, dass für den Podcast die Musik in der Diskussion „de lege ferenda“, man kann auch sagen, in der Rechts-Politik spielt (sagt ja schon der Name: Logbuch Netz-(Rechts-)Politik). Das sind dann Fragen wie: Ist die DSGVO, die KI-Verordnung, die NIS-2-Richtlinie sinnvoll? Welche Änderungen an den Gesetzen sind wünschenswert? Auch: Ist ein Urteil in seinen Folgen richtig? Aber eben nicht: Ist das Urteil als-solches, also rechtlich richtig? Die beiden Sphären werden methodisch über die richterliche Rechtsfortbildung – im Gegensatz zur Rechtsanwendung, auf die Richterinnen aus Gründen der Gewaltenteilung ansonsten beschränkt sind – gekoppelt, aber das nur am Rande. Euer technisches Wissen führt euch regelmäßig zu sehr interessanten rechtspolitischen Aussagen, u. a. deshalb höre ich diesen Podcast so gerne. Für Aussagen zur Rechtsanwendung gilt das leider nicht immer (vgl. die Urteilsbesprechung zu Quad9 oder Tims mit Blick auf Artikel 4 Nr. 1 DSGVO doch eher mittelmäßige Ausführungen zum Begriff der Verarbeitung). Da gibt es auch andere Podcasts dazu. Insofern würde ich mir vor und bei der Diskussion der Rechtsthemen eine kurze Reflexion zu dieser Kategorien-Differenz UND eine Fokussierung auf die Aussagen de lege ferenda wünschen. Ganz liebe Grüße, macht immer weiter! Philipp
Die c’t hat gerade einen ganzen Podcast zum Thema LLMs (bzw. KI) vs DSGVO gemacht. Dort besprechen sie die neue „Orientierungshilfe“ zum Umgang mit generativer KI.
Die ist aber anscheinend ziemlich realitätsfern. Z.B. sollen vor- bzw. nachgeschaltete _Filter_ eine Lösung sein, aber das ist wohl auch nicht praktikabel. Ebenso wie die meisten anderen Vorschläge dort.
Fazit: Es gibt ein rechtliches Vakuum, welches vermutlich erst einige Zeit nach der EU-Wahl angegangen werden wird.
Wobei es dann noch den hamburgischen Datenschutzbeauftragten gibt, der die Position vertritt, dass die DSGVO bei LLMs gar nicht anwendbar ist…
https://www.heise.de/hintergrund/Auslegungssache-109-Das-KI-DSGVO-Dilemma-9721822.html
Zu der Frage, ob die „Franchise-Nehmer“ wissen, ob das Betrug ist. Wurde die Möglichkeit beleuchtet, ob das vielleicht als Dropshipping verkauft wird? So nach dem Motto „Hier kannst du das große Geld machen, in dem du deinen eigenen Online-Shop erstellst. Wir kümmern uns um die Infrastruktur und den Versand.“ In dem Fall wüssten die wahrscheinlich nicht, dass die Produkte nie geliefert werden. Das wäre doch die Gelegenheit, direkt beide Seiten abzuziehen. Das könnte ggf. auch erklären, warum die so viele IP Adressen haben. Womöglich bekommt halt jeder „Kunde“ aus irgend einem Grund eine eigene IP. Und das zahlen dann halt auch die Franchise-Nehmer.
Es gibt wenn ich das richtig sehe auf Amazon eine ähnliche Masche.
Es wird z.B. weiße Ware 10-20% billiger von Stores auf Amazon angeboten. Man führt die Zahlung z.B. mit Paypal und mit Angabe von Adressdaten durch.
Kurze Zeit später wird alles storniert. Mein Eindruck war, dass dort nur Daten abgezogen wurden. Da es bei mehr als einem Shop das selbe Prozedere war.