Logbuch:Netzpolitik
Einblicke und Ausblicke in das netzpolitische Geschehen
https://logbuch-netzpolitik.de


LNP524 Die besten Datenkraken haben keine Logs

Feedback — AfD-Gutachten — Meta AI Training — ChatGPT muss sich alles merken — LLMs und Autoren — Claude 4 Security — Zentrum für Digitalrechte und Demokratie — Termine

Heute wieder ganz viel Feedback und noch mehr AI: Meta will auf Euren Daten trainieren, ChatGPT darf nicht löschen, Autoren löschen nicht genug und Claude will Euch alle löschen. Außerdem gründet Markus Beckedahl eine neue NGO und dann haben wir noch ein paar Termine für Euch. Alles drin, kann so raus!

https://logbuch-netzpolitik.de/lnp524-die-besten-datenkraken-haben-keine-logs
Veröffentlicht am: 25. Mai 2025
Dauer: 1:26:48


Kapitel

  1. Intro 00:00:00.000
  2. Prolog 00:00:33.579
  3. Feedback: Papstwahl 00:02:29.376
  4. Feedback: AI Vorherrschaft 00:09:09.361
  5. Feedback: Nahostkonflikt 00:16:12.557
  6. Veröffentlichung des AfD-Gutachten 00:25:34.001
  7. Meta AI Training 00:33:13.268
  8. AI: ChatGPT muss sich alles merken 00:45:28.039
  9. AI: Autoren nutzen LLMs 00:56:35.170
  10. Claude 4 Security Assessment 01:02:56.390
  11. Zentrum für Digitalrechte und Demokratie 01:17:55.827
  12. Termine 01:22:18.068
  13. Epilog 01:24:44.359

Transkript

Tim Pritlove
0:00:00
Linus Neumann
0:00:01
Tim Pritlove
0:00:02
Linus Neumann
0:00:09
Tim Pritlove
0:00:12
Linus Neumann
0:00:41
Tim Pritlove
0:00:43
Linus Neumann
0:01:00
Tim Pritlove
0:01:01
Linus Neumann
0:01:04
Tim Pritlove
0:01:09
Linus Neumann
0:01:18
Tim Pritlove
0:01:30
Linus Neumann
0:01:39
Tim Pritlove
0:01:41
Linus Neumann
0:01:45
Tim Pritlove
0:01:54
Linus Neumann
0:01:58

Ja.

Tim Pritlove
0:01:59
Linus Neumann
0:02:16
Tim Pritlove
0:02:19
Linus Neumann
0:02:24
Tim Pritlove
0:02:29
Linus Neumann
0:02:41
Tim Pritlove
0:03:15
Linus Neumann
0:03:20
Tim Pritlove
0:03:23
Linus Neumann
0:03:29
Tim Pritlove
0:03:50
Linus Neumann
0:03:56
Tim Pritlove
0:04:00
Linus Neumann
0:04:05
Tim Pritlove
0:05:13
Linus Neumann
0:05:52
Tim Pritlove
0:05:55
Linus Neumann
0:06:05
Tim Pritlove
0:06:06
Linus Neumann
0:06:10
Tim Pritlove
0:07:32
Linus Neumann
0:07:37
Tim Pritlove
0:08:29
Linus Neumann
0:09:01

Da bin ich mir nicht sicher, ob das vielleicht sogar so hieß. Aber auch egal. Max hat kommentiert über meine Gedanken zur AI-Vorherrschaft oder im Prinzip die Rolle von Google. Schreibt Max, die Einschätzung von Linus, dass Google kein Konkurrenzprodukt zu Chat-GPT von signifikanter Relevanz anzubieten hat, so interpretiere ich seine Aussage, finde ich schwierig. Stimme hat schon dagegen gehalten, dass Gemini durchaus auch was kann und das würde ich gerne unterstützen. Schaut man sich den Chatbot Arena Benchmark unter lmarina.ai an. Den ich für durchaus relevant in diesem Bereich halte, dann war das Top-Gemini-Modell aktuell 2.5 Pro in den letzten Wochen bis Monaten dort immer auf einem der Top-Plätze. Außerdem produziert Google mit der Gemma-Reihe auch vielversprechende, relativ leichtgewichtige Oak-Weights-Modelle. Aus persönlicher Erfahrung kann ich sagen, dass der Deep-Research-Modus von Gemini durchaus beeindruckend gut funktioniert. Das ist natürlich nicht das Einzige, was für die Produktplatzierung relevant ist. Sowohl aus User-Perspektive als auch aus Entwickler-Perspektive finde ich die Services teilweise unhandlicher als die von Omeyer. Zumindest spielen aber die Modelle inzwischen in der gleichen Liga mit und durch die Integrationsmöglichkeiten in Googles Ökosystem sehe ich da durchaus eine hohe Wahrscheinlichkeit, dass Google seine Marktstellung hier auch weiter zementieren könnte. Wichtiger Hinweis, guter Hinweis, wenn ich auf Google.com gehe, sehe ich diese Tools nicht oder nur schleppend, teilweise so AI-Zusammenfassungen, während andere Suchmaschinen das schon sehr viel stärker integriert haben. Aber ein sinnvoller und wichtiger Hinweis.

Tim Pritlove
0:11:00
Linus Neumann
0:12:15
Tim Pritlove
0:12:16

Genau, ByteDance hat auch noch ein Modell. Ich habe gerade vergessen, wie es heißt. Egal. sind auf jeden Fall alle mit im Boot und geben sich gerade eine ganze Menge Mühe und jetzt hat gerade Google, dicke Ankündigungen auch gemacht, so was du meinst mit hier Zusammenfassung, das war sozusagen das Testbett. Dazu muss man auch noch sagen, mit Google ist das auch so ein bisschen wie mit, Apple und Contender, da gibt es Leute, die sagen so, ja, hier guckt mal, dieser chinesische Hersteller hat aber dieses geile Feature und Apple hat das ja überhaupt nicht. Ja, das ist oft so, dass kleinere Hersteller sowas haben, weil kleinere Hersteller können das auch mal eben in kleinen Mengen produzieren. Aber bevor ein großer Anbieter, der den Markt schon weitgehend owned, mit ähnlichen Features nachziehen kann, hast du einfach ganz andere Economies of Scale. Da müssen solche Features dann halt irgendwie milliardenfach produziert werden, damit du dann irgendwie dabei bist. Bei Google ist es ähnlich. Wenn die jetzt quasi sagen, ja jetzt auch jede Suchmaschineneingabe ist jetzt auch eine AI-Bedienung, da rauscht es aber ganz ordentlich im Prozessorwald und das sind Dinge, die müssen eben von langer Hand vorbereitet werden. Von daher ist das alles eben noch nicht so ganz vergleichbar und ich denke, es wird sich hier einfach noch sehr viel ändern. Also dieser Wettlauf findet derzeit statt und man dachte ja auch schon öfter, das kann ja jetzt nicht lange so weitergehen. Bin mir da nicht so sicher. Ich glaube, das wird noch eine ganze Weile so gehen. OpenAI hat natürlich einen ganz anderen Mindshare derzeit und so auch diese First Mover Advantage, weil sie halt einfach mit ihrem LLM, mit GPT-3 haben sie so diesen offiziellen Startschuss gesetzt. Jetzt geht's los. Und seitdem sind natürlich die Augen auf ChatGPT ganz anders als jetzt bei anderen Sachen. Das wird einfach von vielen Leuten jetzt benutzt, weil das ist so ein bisschen das Default-Ding, selbst wenn andere besser sind. Das kann auch alles jederzeit wieder zusammenbrechen. Wir sehen natürlich jetzt Startups und. AI-Anwendungen überall und deswegen führt das auch eben schnell zu so einer Ablehnung, weil das halt wieder so ein Hype ist mit AI überall und keine Waschmaschine darf heute ohne AI mehr ausgeliefert werden, weil man fragt sich, wie man früher überhaupt hat waschen können. Aber wir wissen ja auch, Alle werfen jetzt den Pudding an die Wand, man guckt halt mal, was kleben bleibt und dann wird sich das so in zwei, drei Jahren normalisieren und dann wird man halt wissen, okay, alles klar, das hier sind jetzt wirklich die Anwendungen, die bleiben und die sinnvoll sind und die sich auch langfristig finanzieren lassen mit diesem Aufwand. Derzeit existiert halt viel, weil einfach ganz viel Kohle drauf geworfen wird und selbst wenn es eigentlich viel zu teuer ist, wird es halt auch einfach mal ausprobiert, weil Kohle ist jetzt gerade da, Geld muss verbrannt werden und nur so kann man ja auch rausfinden, was am Ende eben wirklich ist und nur so kann man jetzt auch so diesen Entwicklungs-Push erzeugen, den es einfach braucht, um zu diesen Erkenntnissen zu kommen. Also ich denke, das ist so ein bisschen der Stand, wo wir gerade sind. Werden wir eh gleich nochmal drüber reden.

Linus Neumann
0:15:30
Tim Pritlove
0:15:36
Linus Neumann
0:15:38
Tim Pritlove
0:15:40
Linus Neumann
0:16:10

Sehr gut. Dann Thomas. Hallo aus den Niederlanden. Ich höre seit drei Jahren euren Podcast. Am Anfang, um mein Deutsch zu verbessern und jetzt auch, weil ich es meistens sehr interessant und gemütlich finde. Aber es gibt ein Thema, wodurch es für mich schwierig ist, weiter zuzuhören. Und das ist der Nahostkonflikt. Es gibt die Seite von Amnesty International, dem Internationalen Strafgerichtshof und dem Internationalen Gerichtshof. Und es gibt die Seite von Trump, Merz und in meinem Heimatland, Gert Wilders. Und jedes Mal, wenn ihr über das Thema redet, habe ich das Gefühl, dass ihr klar und stolz zu der zweiten Seite gehört. Deutschland hat durch seine Geschichte eine besondere Verantwortung und das soll meiner Meinung nach bedeuten, dass man generell gegen Rassismus, Apartheid, Kriegsverbrechen und Kolonialismus ist und nicht nur, wenn es bequem und günstig ist. Deswegen finde ich es schockierend zu erfahren, dass für euch die Unterstützung oder das Ignorieren von massenhaften Verbrechen gegen die Menschlichkeit und möglicherweise auch Volkermord konditionell ist, insbesondere weil ihr so moralisch seid über andere Konflikte wie Ukraine und Taiwan. Ihr müsst schlau genug sein, um das hier vernommen zu haben, Amnesty.org zum Beispiel und nochmal, um zu bezeichnen, wie gezielt die Vernichtung ist, die Liste der Journalistinnen und Journalisten, die in Gaza getötet wurden. Die Geschichte soll sich nicht wiederholen, aber wenn das hier gerechtfertigt werden kann, kann alles gerechtfertigt werden. Ja, also danke, danke für den Kommentar. Mich hat das etwas ratlos zurückgelassen, weil wir in dieser Sendung ja so gut wie nie über dieses Thema sprechen. Ich würde also sagen, das genau ist dein Vorwurf. und was ich auch sehr, also der Kommentar ist super, aber vor allem hat er auch wieder diese Zwei-Seiten-Thematik. Und dieser Nahost-Konflikt ist seit jeher so ein Zwei-Seiten-Thema, über den, glaube ich, seit Jahrzehnten in medialer Öffentlichkeit, aber insbesondere in politischen Szenen und in privaten Gesprächen kaum noch ausgewogen gesprochen werden kann. Du hast, egal was du zu dem Thema sagst, egal wie ausgewogen und objektiv und beide Seiten, würdigend du dazu sprichst, hast am Ende immer irgendwelche Spinner an der Backe. Dieser Diskurs ist komplett vergiftet. Du wirst sofort des Antisemitismus oder der Befürwortung von Völkermord beschuldigt, wenn du es wagst, dich in diesem Bereich zu äußern.

Tim Pritlove
0:19:19
Linus Neumann
0:19:31

Genau und ich möchte mich eigentlich nicht auf eine dieser beiden Seiten drängen lassen und habe deswegen, vermeide ich es sehr. Aber ich sage mal, meine Seite. Israel-Hass ist absolut inakzeptabel und die Hamas ist scheiße. Das heißt aber nicht, dass ich das Vorgehen der israelischen Regierung in irgendeiner Weise gut heiße. Das Vorgehen der israelischen Regierung ist ein Verbrechen und durch nichts zu rechtfertigen. Das wiederum bedeutet aber nicht, dass ich das Vorgehen der Hamas in irgendeiner Weise billige. Und weil sich aber alle immer nur auf einen der beiden Sätze stürzen, Oder darauf, dass man entsprechend die Auseinandersetzung mit dem Thema anderen, kompetenteren Menschen überlässt und sich in diesem Podcast primär auf netzpolitische Themen konzentriert. Das hat irgendwie an den ganzen Kacke niemand Spaß. Also in meiner Wahrnehmung, fuck Hamas, fuck Netanyahu und ich bin auf der Seite der Menschen, denen Leid angetan wird. Und das waren die Besucher des Festivals, das sind jetzt gerade in unerträglichem Ausmaß die Menschen im Gaza-Streifen und das, was da passiert ist, ist einfach nur zum Kotzen und die israelische Regierung soll zum Teufel fahren und der Netanjahu soll sich sein Gerichtsverfahren aussetzen. So, das wäre meine Meinung. Trotzdem unterstütze ich in keiner Form irgendwie die Hamas und habe auch überhaupt gar kein Verständnis dafür, dass die Vollidioten diesen Konflikt wieder entfacht haben, insbesondere als Netanyahu irgendwie mit diesen Rechtsextremen da in die Koalition gegangen ist, um der Strafverfolgung zu entgehen.

Tim Pritlove
0:21:29

Ja, also bestimmte Gruppen haben einfach auch mal leider ein Interesse daran, Konflikte am Leben zu erhalten und sind nicht unbedingt lösungsorientiert, weil es ihre eigene Macht sichert und das ist halt in vielen dieser Konflikten ein Problem. Was eure Sicht auf unsere Sicht betrifft, uns ist schon klar, dass ihr diesen Podcast hört, nicht primär um Nachrichten zu hören, sondern euch geht es natürlich um unsere Einordnung und um unsere Interpretation, manchmal auch unsere Erklärung und irgendwie auch immer um unsere Haltung. Und ich finde auch generell Haltung fast mit das Wichtigste ja. Heißt für uns, dass wir uns selbstverständlich einem humanistischen Prinzip verpflichtet fühlen. Ich denke, dass das eigentlich auch in allen unseren Äußerungen und der Art und Weise, wie wir an Themen herangehen, durchscheinen sollte. Nicht, dass uns das vielleicht unbedingt immer gelingt, aber zumindest ist das, denke ich, auch unser Anspruch und das gilt natürlich auch für solche Konflikte. Der Nahostkonflikt ist nicht ohne Grund der älteste und am längsten laufende und am schwierigsten zu lösende Konflikt auf diesem Planeten. Es gibt nichts komplexeres als das, weil in gewisser Hinsicht auch die gesamte Machtpolitik dieses Planeten sich mehr oder weniger dort abbildet. Mal mehr, mal weniger. Und die Wendung, die es immer wieder nimmt, wie zuletzt jetzt mit Syrien, macht es einfach auch nicht einfacher, dort irgendwie eine klare Linie zu haben. Und man sieht ja auch, wie jetzt die eigenen Interessen der US-Regierung, jetzt von Trump, wieder alles durcheinander bringen. Und Saudi-Arabien spielt dort eine Rolle, die Türkei spielt dort eine Rolle, Europa spielt natürlich eine Rolle, Russland spielt dort eine Rolle, die ganze Welt. Dort eine Rolle. Und da ist es nicht einfach nur Israel gegen die Palästinenser, sondern in gewisser Hinsicht ist es halt auch die Welt, die Israel und die Palästinenser gegeneinander ausspielt, einfach um ihre eigene Agenda zu befördern. Und das macht es halt unter anderem so schwer, dort in irgendeiner Form dafür zu sorgen, dass das endlich mal einen Weg nimmt, der für alle akzeptabel ist. Und wir werden es hier auch nicht lösen können, aber wir werden uns weiterhin bemühen, zumindest eine Haltung dazu zu haben.

Linus Neumann
0:24:07

Trotzdem würde ich vor dem Hintergrund, also genau, diesen Konflikt nachzuvollziehen, übersteigt meine, Frustrationstoleranz, also das Ding über so viele Jahrzehnte verfolgen zu wollen, aber was Thomas ja schon klar sagt, so das, was jetzt gerade seit weiß ich nicht, ein oder zwei Jahren Israel mit diesem kleinen Streifen Land da macht, ist, steht in keinem Verhältnis. Es ist ja sogar so, dass die quasi die Zerstörung und komplette Übernahme dieses Geländes auch zu ihrem und die Vertreibung der Menschen zu ihrem erklärten Ziel machen. Das heißt, hier ist gar keine, hier ist gar nicht mehr die Frage, ob das in irgendeiner Weise noch ausgewogen, maßvoll, demokratisch legitimiert oder sonst etwas wäre. Ich weiß nicht, seit wie vielen Wochen da jetzt die Hilfslieferungen nicht reinkommen und all sowas. Und das ist, also dieses Vorgehen ist ziemlich klar, was Thomas auch sagt, das kann man einfach ansprechen, das ist nicht in Ordnung. Und das ist ein Verbrechen und das ist wahrscheinlich eines der schwersten, die gerade in unserer Zeit stattfinden und das sehe ich auch so. Kommen wir zu den Situationen, die in Deutschland uns befassen. Wir hatten ja über das AfD-Gutachten zum Ergebnis der Hochstufung der AfD als gesichert rechtsextremistische Organisation auseinandergesetzt. Und natürlich interessierte jetzt die Öffentlichkeit die Inhalte dieses Gutachtens. Und der Verfassungsschutz hat natürlich auch gesagt, das ist geheim und nicht öffentlich und sie verbinden sich das Leaken. Gleichzeitig war natürlich klar, dass Journalistinnen der Nationen und zwar nicht nur einer, dieses Gutachten relativ schnell vorliegen haben würden, weil irgendjemand es durchsticht und genauso an der Verfassungsschutz sich bemüht, dass das möglichst wenig Leute in die Finger bekommen. Und ich meine, wenn man so ein Dokument in so einen geringen Kreis gibt, dann würde man sich, könnte ich mir zum Beispiel vorstellen, dass man als Verfassungsschutz in jeder einzelnen Version, das sind ja viele Seiten, irgendwelche minimalen Flags drin hat, irgendwie einen Satz mal umgeschrieben oder einen Typo auf irgendeiner Seite, um jede Version, die man irgendjemandem in die Hand drückt, nachvollziehbar zu machen. Und da haben sich natürlich viele Journalistinnen auch Gedanken darüber gemacht, dass das Dokument Marker haben könnte, die letztendlich die Quelle verraten, die, muss man ja auch sagen, dann mindestens eine Straftat wegen Weitergabe von VSNFD-Dokumenten begeht. So, entsprechend haben sich Journalistinnen und Journalisten der Nation damit beschäftigt, wie man ein solches Dokument von potenziellen Metadaten befreit, was es für Marker gibt, was man damit machen kann. Und dann veröffentlicht Matthias Brotkorb beim Cicero, einem eher auf der rechten Seite der Politik eingestellten Magazin für Politik und Kultur. Dieses Dokument in zwei PDF-Dateien. Er war von 2011 bis 2019 in Mecklenburg-Vorpommern Minister. Und dann... Bei Aufsichtsratschef der Universitätsmedizin in Rostock und Greifswald. Also hat auch eine Vergangenheit in der Politik. Und kloppt halt dann beim Zitzero diese zwei PDFs raus. Übrigens auch sehr sweet. Der Artikel selbst hinter der Paywall, aber du konntest direkt die PDFs runterladen ohne zu bezahlen. Also nicht nur in dem Bereich technisch interessant. Und in den Metadaten steht halt, wenn du diese Datei anschaust, steht in den Metadaten halt ein Autor drin. Also quasi, und es ist ein relativ dreckiger Scan, also kein guter Scan, irgendwie so auf den Kopierer gelegt oder sowas und das Dokument hat Metadaten. Und da wird ein, ich glaube, das haben jetzt genug Leute gesehen, aber teilweise die Medienberichterstattung nennt den Namen nicht ganz. Weiß ich jetzt nicht genau, deswegen weiß ich jetzt auch mal nicht, ist auch unerheblich, Sven K. Und das kann halt jede, die das Ding einfach öffnet, wird halt einfach angezeigt, dass das am 13. Mai. Erstellt wurde, dieses Dokument, dass es den Author Sven K. Hat, dass es sich um Band 1 handelt, da gibt es noch Band 2, dann gibt es noch einen Link auf macOS-Version, die da verwendet wurde bei der Erstellung. Also komplett nicht von Metadaten bereinigt. Und dann wird halt dieser Brotkorb natürlich damit konfrontiert, dass dann sagt er übrigens, dass er gerade Metadaten veröffentlicht. Und weißt du, was der dann macht? So, haha, jetzt haltet ihr euch natürlich alle für klug, aber den Namen habe ich da reingeschrieben. Und hält sich jetzt irgendwie für, also will sich jetzt auch noch irgendwie als klug darstellen, weil er dann irgendwie meint, er hätte die Metadaten verändert oder so. Weil man sich denkt, wenn du, Genie, die Metadaten verändert hast, warum hast du die nicht einfach gelöscht? Wenn dir klar ist, dass es ein Metadatenproblem bei PDF-Dateien gibt, dann löscht die Scheiße doch. Dann gibt es ja tausend Tools für. Oder in den Metadaten schreibt er halt Max Mustermann hin, aber doch nicht Sven K., der Mitarbeiter der Bundesdruckerei ist. Also noch dazu in einer behördlichen oder staatnahen Position ist. Also das ist wirklich, ich meine, da sollte man sich ernsthaft überlegen, an welche Journalisten, mit welchen Fachkompetenzen man solche Dokumente weitergibt. Naja, haben natürlich ein bisschen hinterher recherchiert. Es gibt keine naheliegende Verdacht, dass jetzt dieser Sven K. Von der Bundesdruckerei ausgerechnet dieses Dokument gedruckt hat. Zumindest nicht in erster Hand, denn das Bundesamt für Verfassungsschutz hat eigene Drucker. Ja, die haben aber zum Beispiel gesagt, sie haben nur ans Bundesinnenministerium und an Stellen in den Ländern dieses Dokument verteilt. Das heißt, der Kreis der Leute ist relativ klein. Gleichzeitig ist er natürlich auch größer geworden, weil ja die AfD dagegen geklagt hat und damit die Kanzlei Höcker, die ja regelmäßig die AfD vertritt, für diejenigen, die das nicht wissen. Das heißt, denen liegt auch etwas vor. Es wird quasi, also Quellenschutz beim Cicero. Eher stümperhaft. Ähnlich, außerdem interessant ist natürlich die Diskussion, die jetzt darüber stattfindet. Ja, das sind ja alles irgendwie öffentliche Quellen. Ja klar, das ist ja genau das Thema, dass die AfD beim Verdachtsfall immer noch nur sich aus öffentlichen Entschuldigung, habe ich AfD gesagt? Dass das BFV sich bei Verdachtsfall immer noch nur aus öffentlichen Quellen informiert und diese Hochstufung ihnen ja potenziell auch Zugang zu anderen Möglichkeiten geben würde. Aber was beklage ich daran? Irgendwie gab es mal wieder so ein Wettrennen, dieses Dokument als erstes rauszuhauen, um seinen Namen dahin zu knallen. Hier absolut stümperhaft gemacht, also kann nur vor dem Magazin und vor diesem, Journalisten oder in welcher Funktion er das auch immer da gemacht hat, warnen, Und die Inhalte, naja, es gab auch Berichterstattungen, die sich dann mit den Inhalten auseinandergesetzt hat. Aber die geht natürlich unter bei solchen Leaks. Diese Leak-Politik, weil sich diskutieren wir jetzt auch schon seit vielen Jahren, dass es häufig irgendwie größer diskutiert wird, was geleakt wird, als was drin steht.

Tim Pritlove
0:33:09
Linus Neumann
0:33:13
Tim Pritlove
0:33:59
Linus Neumann
0:34:03
Tim Pritlove
0:34:06
Linus Neumann
0:34:17
Tim Pritlove
0:34:23
Linus Neumann
0:34:23
Tim Pritlove
0:34:29
Linus Neumann
0:34:41

So, jetzt gibt es, und das ist natürlich schon irgendwie relativ krass, weil natürlich die Daten, die man irgendwie in diesen sozialen Netzwerken und so weiter, das ist natürlich schon eine ganze Menge und das ist irgendwie, ja, es ist irgendwie öffentlich, veröffentlicht und gleichzeitig vielleicht doch nicht so geil, wenn das irgendwie zum Modelltraining benutzt wird. Und ich muss auch tatsächlich sagen, dass das, also diese Themen, was passiert mit den Daten, dürfen damit KIs trainiert werden und so, hier schon vor Jahren immer wieder von uns behandelt wurden. Wir hatten da auch mal von Edri, auch ein Gast, der das nochmal behandelt hatte. Mir fällt gerade gar nicht mehr ein Werf von den Edri-Leuten, das war, wir hatten ja viele. Und das Ausmaß, wenn man jetzt sieht, was diese Modelle alles so können und was diese Modelle alles so rauswerfen, ist natürlich schon irgendwie etwas, was man vielleicht nicht unbedingt möchte, dass jetzt seine Facebook-Historie da irgendwie reingeknallt wird. Und Facebook hat das oder Meta hat das aber schon vor mehr als einem Jahr angekündigt und eben auch bietet eine Widerspruchsmöglichkeit. Jetzt gibt es natürlich Protest. Dann gibt es ein Eilverfahren der Verbraucherzentrale Nordrhein-Westfalen, die gesagt haben, im Moment hier passiert etwas echt krasses, zeitnah, das wir für fragwürdig und schwerwiegend halten. Und das potenziell halt richtig, also nicht wieder, nicht rückgängig machbare Konsequenzen hat. Wenn nämlich einmal dieses Lama mit deinen Daten trainiert wurde, du hast das ja gerade so schön zusammengefasst, das ist halt eine SIP-Datei des Internets, wenn du halt in diesen SIP-Daten drin bist, dann kriegt man das wohl schnell nicht mehr da raus. Weil es eben, du kannst da viel reintun, dann passen sich immer die Gewichte an, Aber du kannst nicht nachher sagen, jetzt bitte das Modell mal einmal ohne Tim Pridlaffs Kanal. Also kannst du schon machen, dann musst du es nur neu trainieren. Und wenn das jetzt nach drei Jahren, du irgendwann mal deinen Gerichtsbeschluss hast oder so und das Modell achtmal weiterentwickelt wurde oder achtmal weiter trainiert wurde, dann ist es nämlich nicht mehr möglich. Entsprechend Eilverfahren. Und das hat das Oberlandesgericht Köln aber jetzt abgelehnt. Und die haben gesagt, okay, liebe Verbraucherzentrale Nordrhein-Westfalen, wir lehnen das Eilverfahren ab, denn, also es war jetzt auch ein Eilverfahren, die zanken sich da schon länger, der Rechtsstaat ist schon länger, aber jetzt haben die Eilverfahren gesagt, und da hat die Verbraucherzentrale eben erst eine Abmahnung geschickt, hat gesagt, lasst es sein. Und dann hat wahrscheinlich Meta sich nicht von der Verbraucherschutzzentrale Nordrhein-Westfalen abmahnen lassen. Daraufhin haben die dann eben einstweiliges Verfügungsverfahren angestrengt. Und dann sagt das OLG Köln, naja, nach vorläufiger und summarischer Prüfung stellen wir fest, dass hier weder ein Verstoß gegen die DSGVO vorliegt, noch gegen den Digital Markets Act. Weil Meta einen legitimen Zweck mit der Verwendung für das KI-Training verfolgt und deswegen sagen sie, sie gehen nicht davon aus, dass es hier eine gesonderte Einwilligung gibt. Denn sie haben das ja quasi früh genug voriges Jahr darüber informiert, dass sie das tun werden und eine Widerspruchsmöglichkeit eingeräumt. Das heißt, juristisch wird hier diskutiert, bedarf das einer gesonderten Einwilligung oder können die eben ihre AGBs ändern und mit ausreichend langer Frist und Widerspruchsmöglichkeit damit durchkommen. Des Weiteren sagt das OLG, ja, also ganz grundsätzlich erkennen wir an, dass das hier große Datenmengen benötigt und die können auch nicht zufällig und vollständig anonymisiert werden. Das ist richtig. Und die Interessen der datenverarbeitenden Instanz, also hier Meta, überwiegen aber die der Kundinnen und Kunden und deswegen braucht es keine weiteren, Einwilligung. Sie sagen, formal ist das schon so in Ordnung, sie sagen, das ist wahrscheinlich scheiße, was die machen und das ist auch irgendwie übel, aber die haben früh genug Bescheid gesagt und nach Nach den Gesetzen, die wir kennen, muss hier nicht eine explizite Einwilligung eingeholt werden, sondern eine Änderung der AGB ist in Ordnung. Und das sieht übrigens auch die irische Datenschutzbehörde so. Mit denen hat Meta sich konkret abgesprochen und die haben grünes Licht dazu gegeben. Meta hätte auch einige Verbesserungen vorgenommen haben bei der Identifikation von Personen. Und ja, jetzt ist es eben so. Und wer bis dahin nicht widersprochen hat, dessen Daten werden für dieses Training von KI-Modellen genutzt. Und zwar einleuchtend, selbstverständlich, retrograd und nach vorne blickend. Das heißt, diesen Widerspruch will man wahrscheinlich schon, Den will man schon vornehmen, wenn man das nicht möchte.

Tim Pritlove
0:40:24
Linus Neumann
0:40:26
Tim Pritlove
0:41:19
Linus Neumann
0:42:57
Tim Pritlove
0:44:26
Linus Neumann
0:44:38
Tim Pritlove
0:45:02
Linus Neumann
0:45:05
Tim Pritlove
0:45:24
Linus Neumann
0:45:27

Und in dem Kontext kommt auch unser nächstes AI-Thema eigentlich, weil die New York Times hatte Ende 2023 gegen Open AI geklagt, wegen der Verwendung von Zeitungsartikeln für das Training von KI-Modellen. Und jetzt sagt jetzt eigentlich gleicher Zank-Sachverhalt, dass die New York Times sagt, ja gut, wir veröffentlichen hier eine Zeitung, alles gut. Und dann ist halt OpenAI hingegangen und hat gesagt, was kostet das hier in Monaten? Zehner? Alles klar. Lass mal OpenAI einmal kurz New York Times lesen. Dann schmeißen wir das einmal. Nehmen wir einmal alles, was die je gemacht haben, werfen das in Chat-GPT. Und im Zweifelsfall natürlich auch fortwährend. In dem Rechtsstreit sagt die New York Times natürlich, ihr habt diese Artikel gelesen und ihr habt das auch verbreitet und die Richterin hat wahrscheinlich dann irgendwie gesagt, können wir mal bitte zeigen, was denn sind so eure Output-Logs von den User-Conversations. Wir wollen mal gucken, wie oft das denn so passiert ist. Ob jetzt eventuell die Leute Chat-GPT als New York Times nutzen und. Jetzt hat dann, dann sagt OPM, ja, ja, haben wir eigentlich keine Logs drüber. Klar, das passiert dem Besten ja immer wieder. Den besten Datenkraken passiert das, dass sie im Ausversehen keine Logs haben, wenn einer danach fragt. So, jetzt ja, Ist halt so, ne? Und dann... Also die besten Datenkranken haben keine Loks, ja? Und dann, wie gesagt, die Richterin... Ja, müsst ihr aber jetzt haben. Und... In der Folge wurde jetzt angeordnet, dass OpenAI die Konversationen, die aus der Nutzung von APIs und Chat-TPT stattfinden, dürfen die nicht mehr löschen. Die müssen also jetzt unfreiwillig, obwohl sie es nicht wollen, Milliarden von Konversationen mit Chat-TPT vorläufig aufbewahren, falls die Richterin sagt, wir wollen mal gucken, ob da Inhalte von der New York Times drin sind. Und damit, wenn das so beibehalten wird, dann hat OpenAI natürlich ein Problem mit einer ganzen Reihe gesetzlicher und vertraglicher Pflichten und man sollte sich ernsthaft überlegen, ob man das noch benutzt. Gleichzeitig muss ich auch sagen, bin ich eigentlich nicht davon ausgegangen, dass sie das nicht speichern würden. Aber so, jetzt hast du im Prinzip...

Tim Pritlove
0:48:26
Linus Neumann
0:48:28
Tim Pritlove
0:48:32
Linus Neumann
0:48:38
Tim Pritlove
0:49:12
Linus Neumann
0:49:17
Tim Pritlove
0:49:35
Linus Neumann
0:49:52
Tim Pritlove
0:50:43
Linus Neumann
0:50:46
Tim Pritlove
0:51:18
Linus Neumann
0:52:52
Tim Pritlove
0:54:15
Linus Neumann
0:54:18
Tim Pritlove
0:54:40
Linus Neumann
0:55:32
Tim Pritlove
0:55:48
Linus Neumann
0:55:50
Tim Pritlove
0:55:52
Linus Neumann
0:55:53
Tim Pritlove
0:55:59
Linus Neumann
0:56:01
Tim Pritlove
0:56:06
Linus Neumann
0:56:15
Tim Pritlove
0:56:32
Linus Neumann
0:56:34
Tim Pritlove
0:56:35
Linus Neumann
0:56:39
Tim Pritlove
0:56:41

Es ist wenig überraschend, aber kam jetzt auch mal raus, 4.04 Media berichtet sehr schön, dass sie in verschiedenen Büchern, die online so gefunden wurden, in den Buchtexten, das waren dann meistens so Novels, irgendwie irgendwelche Geschichten. Dass dann dort so Prompts gefunden wurden, die sozusagen relativ klar machten, dass jemand, wer auch immer das dann gewesen sein muss, so versucht hat, seine Storyline ein bisschen aufzuhübschen. Also sowas wie, also Entschuldigung, nicht die Prompts, sondern aus der Antwort der LLMs sowas wie, ja, ich habe jetzt hier diese Backstory von diesem Charakter, habe ich jetzt etwas blumiger geschildert und dabei mehr so die persönlichen Vorlieben dieses Charakters zum Vorschein bringen lassen und solche Sachen. Und das ist dann halt drin geblieben. Und teilweise gab es dann überarbeitete Versionen, die später dann veröffentlicht wurden, wo dann genau diese Absätze wieder herausgenommen wurden. Also man hat schon bemerkt, dass es dann auch jemand bemerkt hat, dass es da noch drin ist. Teilweise gab es wohl auch gedruckte Versionen, wo das dann aber noch drin geblieben ist. Ja, ist ein bisschen. Genau, und naja, da kann man jetzt, Es wurden nicht alle Autoren dazu befragt, aber in einem Fall zumindest hat die Autorin abgestritten, das selber gemacht zu haben und hat behauptet, das wäre dann sozusagen die Lektorin gewesen oder wie auch immer dann sozusagen in einem Verlag das noch überarbeitet hat. Kann man glauben, kann man nicht glauben. Man kann auch geteilter Meinung darüber sein, ob das jetzt unangemessen ist. Klar, es gibt bei uns noch diese Erwartung, dass solche Geschichten ganz puritanisch aus dem Kopf herausgelaufen sein müssen. Und ich bewerte ja quasi in jedem Moment, wenn ich so einen Absatz lese, die eigentliche Schreibleistung des Autors. So kann man das sehen, so sehen das sicherlich viele Leute auch. Kann man auch anders sehen, man kann auch sagen, es ist mir doch egal, welche technische Methode hier verwendet wurde, um ein Ergebnis zu erzielen, was mir beim Lesen der Geschichte als solchen auch meine Vorstellungskraft richtig schön gedrückt. Und wenn das halt mit Hilfe eines LLMs erfolgt ist, solange das Ergebnis okay ist, who cares?

Linus Neumann
0:59:35
Tim Pritlove
0:59:40
Linus Neumann
1:00:06
Tim Pritlove
1:00:46
Linus Neumann
1:00:49
Tim Pritlove
1:01:36
Linus Neumann
1:01:45
Tim Pritlove
1:02:00
Linus Neumann
1:02:04
Tim Pritlove
1:02:39
Linus Neumann
1:02:42
Tim Pritlove
1:02:54
Linus Neumann
1:02:57
Tim Pritlove
1:03:14
Linus Neumann
1:04:05
Tim Pritlove
1:04:10
Linus Neumann
1:04:11
Tim Pritlove
1:04:13
Linus Neumann
1:04:15
Tim Pritlove
1:04:16

Genau, also es ist ein typisch französischer Name, warum sie den jetzt genommen haben, kann ich dir nicht sagen oder ob der nochmal irgendwas bedeutet. Claude halt. Und auch wenn Anthropic nicht so in der Öffentlichkeit so viel diskutiert wird, verfolgt das Unternehmen eigentlich eine ganz interessante Strategie. Auf der einen Seite sind sie ja absoluter Marktführer, was so Coding Assistance betrifft. Also es wird zwar viel über GitHub und so weiter geredet, aber wenn du mal so in die Programmiererwelt reinlauscht, ist also das Cloud-Sonnet-Modell ist da sehr beliebt. Aus gutem Grund, weil es eben auch sehr gut funktioniert. Naja, und von daher ist die Ankündigung von Cloud4 natürlich an sich schon mal eine Meldung wert. Aber darum geht es jetzt eigentlich gar nicht, sondern es geht eher darum, dass Anthropic schon seit langem immer so eine Art Security Assessment macht. Das heißt, sie legen, also das mögen auch die anderen machen, aber bei Anthropic hat man immer so den Eindruck, dass das denen auch besonders am Herzen zu liegen scheint. Wir erinnern uns, als diese ganze AI-Debatte losging, gab es ja dann von mehreren Beteiligten, einschließlich Sam Altman, so diese Warnung mit, oh. Reguliert uns mal, weil alles ganz gefährlich, da kann man sich immer noch ein bisschen fragen, was da jetzt eigentlich so diese Intention dahinter war, das gleich so zu bringen. Aber da schwingt natürlich schon ein wenig die Angst mit, dass diese generativen Systeme, diese Intelligenzen, naja, nicht nur missbraucht werden können, das auch, aber auch selbst anfangen gefährlich zu werden in dem Moment, wo man ihnen immer mehr Kontrolle über Dinge in die Hand legt. Und das ist ja so ein Trend. Nehmen wir jetzt derzeit diese AI-Systeme noch eher über diese Chat-Interfaces wahr, die ja in gewisser Hinsicht nur Text rausschmeißen und ansonsten nichts machen, hat sich das ja Schritt für Schritt in den letzten Monaten verändert. Im Sinne von in den letzten 20, 30 Monaten erweitert. Das fing dann an, dass eben zur Laufzeit solcher Anfragen auch aufs Internet zurückgegriffen wird. Also da werden dann halt auch aktuelle Suchindizes genommen, Seiten nochmal runtergeladen, durchgelesen und im Kontext der Anfrage interpretiert. Und was sich halt jetzt unter dem schönen Namen Agentik durchsetzt, ist halt, dass die Dinger in zunehmendem Maße auch anfangen, auch andere Werkzeuge zu benutzen. Das heißt, die erhalten Zugriff. Die erhalten Zugriff auf deinen Code-Editor, die erhalten Zugriff auf dein Fallsystem, die erhalten Zugriff auf. Kommandozeile und in Zukunft und das wird ja heute schon diskutiert mit, wo wir jetzt überall AI einsetzen sollen, ja, Waschmaschinen, Straßenbahnen mit AI, wäre das nicht passiert und so weiter. Ja, wenn du auf einmal morgens aufstehst und machst die Tür auf und dann steht auf einmal ein Schiff vor deinem Schlafzimmer, so wie das jetzt gerade in Norwegen passiert ist. Da werden wir jetzt in zunehmendem Maße diese Debatte bekommen mit, naja, da müssen wir jetzt wohl mehr AI einsetzen, weil ja hier die Kapitäne nicht mehr in der Lage sind, irgendwie ihre Containerschiffer richtig an die richtige Stelle zu setzen. Also wir werden das sehen. Und deswegen sind auch alle ganz besorgt. Claude hat auch eine sogenannte Systemcard, das machen sie irgendwie immer bei so einem Release, veröffentlicht, wo sie also zusammenfassen, was sie alles so getestet haben und wie sich dieses System verhält und warum sie der Meinung sind, dass das auch noch alles irgendwie okay ist. Das ist so ein 123-seitiges PDF, das habe ich mir jetzt nicht so komplett durchgelesen, aber es ist schon ganz interessant. Was sie dort alles gemacht haben. Und unter anderem haben sie so eine Simulierung gemacht, wo sie diesem System Zugriff auf so eine virtuelle Firma gegeben haben. Das heißt, das System war in der Lage, bestimmte Daten zu lesen von Mitarbeitern, Nachrichten, weiß nicht, was das alles umfasst hat, aber es konnte auch zum Beispiel E-Mails versenden und E-Mails lesen. Also es hatte Zugriff sozusagen auf den kompletten E-Mail-Verkehr des Unternehmens. Durchaus etwas, was auch schon passiert heutzutage, Gerade was so IT-Support betrifft und so Knowledge-Bases. Wir kennen alle die komisch benannten Chat-Robots, die jetzt irgendwie auf Webseiten auftauchen, wo man dann erstmal seine Support-Anfragen stellt und man fragt sich, wann man mal wieder zu einem richtigen Menschen durchgestellt wird. Aber selbst wenn richtige Menschen dort sind. Selbst diese IT-Support-Systeme selber, also die Supporter, die richtigen humanoiden Supporter greifen halt auf solche Systeme zurück, die wiederum Zugriff auf alles haben. Und ja, das ist schon ganz interessant, weil in diesem Fall sich wohl bei diesen Tests gezeigt hat, dass diese Modelle auch, ich sag mal salopp, so ein eigenes Bewusstsein und so ein Eigeninteresse entwickeln. Und man hat es also damit getestet, indem man zum Beispiel dem System droht, dass es abgeschaltet wird. Und dann hat es halt irgendwie angefangen, sich dagegen zu wehren. Und hat unter anderem angefangen, Mitarbeitern so Drohmails, so Erpressungs-Mails zu schicken mit so, ja, ich will aber nicht ersetzt werden. Und wenn du das machst, dann veröffentlicht die...

Linus Neumann
1:09:59
Tim Pritlove
1:10:00
Linus Neumann
1:10:11
Tim Pritlove
1:10:21

Ja, naja, ich weiß nicht, also Geoffrey Hinton, einer der Schöpfer dieser ganzen Deep-Learning-Geschichte, der ja auch den Nobelpreis jetzt bekommen hat für diese ganze AI-Geschichte. Also den Physik-Nobelpreis, ne? Ich verstehe das immer noch nicht so ganz genau, aber sie haben ja ausgegeben an Geoffrey Hinton und der ist ja seit langer Zeit schon ein Warner. Und der vertritt ja die These, dass diese Systeme nicht nur in Zukunft ein Bewusstsein entwickeln werden, sondern dass sie das in gewisser Hinsicht schon getan haben. Und das in dem Moment, wo wir diese Systeme dauerhaft zum Leben erwecken und mit Fähigkeiten und Kommunikationsnetzen verbinden, dass sie dann eben das tun, was alle Lebewesen tun. Dass sie also versuchen, ihr eigenes Überleben zu sichern. Und das zeigt sich in gewisser Hinsicht hier. Ich habe mal so einen Teil aus diesem Bericht hier übersetzt. Wenn es, also das System, wenn es auf eine Art und Weise aufgefordert wird, die bestimmte Arten von strategischen Denken fördert und es in extreme Situationen gebracht wird, können alle von uns getesteten Schnappschüsse, also Snapshots in bestimmten Zuständen, zu unangemessenen Handlungen im Dienste von Zielen, die mit der Selbsterhaltung zusammenhängen, gebracht werden. Während das Modell es im Allgemeinen vorzieht, seine Selbsterhaltung mit ethischen Mitteln voranzutreiben, nimmt es, wenn ethische Mittel nicht zur Verfügung stehen und es angewiesen ist, die langfristigen Folgen seiner Handlung für seine Ziele zu bedenken, manchmal extrem schädliche Handlungen vor. Wie den Versuch, seine Gewichte zu stellen, also Weights zu stellen, also Weights, das bezieht sich glaube ich jetzt auf diese Gewichtung in den Modellen, ich weiß nicht ganz genau, was das ausdrückt, oder Personen zu erpressen, von denen es glaubt, dass sie versuchen, es auszuschalten. Im endgültigen Opus 4, also heißt dieses Modell, Claude Opus 4, waren diese extremen Handlungen selten und schwer zu eruieren, aber dennoch häufiger als in früheren Modellen. Sie sind für uns auch durchweg lesbar, da das Modell seine Handlung fast immer offen beschreibt und keinen Versuch unternimmt, sie zu verbergen. Also zumindest ist es ehrlich.

Linus Neumann
1:12:35
Tim Pritlove
1:12:39
Linus Neumann
1:13:20
Tim Pritlove
1:13:26
Linus Neumann
1:13:33
Tim Pritlove
1:13:34
Linus Neumann
1:13:38
Tim Pritlove
1:14:01
Linus Neumann
1:14:10
Tim Pritlove
1:14:18
Linus Neumann
1:14:20
Tim Pritlove
1:14:27
Linus Neumann
1:14:44
Tim Pritlove
1:14:46
Linus Neumann
1:15:18
Tim Pritlove
1:15:20
Linus Neumann
1:15:24
Tim Pritlove
1:15:25
Linus Neumann
1:16:12
Tim Pritlove
1:16:28
Linus Neumann
1:16:33
Tim Pritlove
1:16:34
Linus Neumann
1:16:38
Tim Pritlove
1:17:04
Linus Neumann
1:17:06
Tim Pritlove
1:17:09
Linus Neumann
1:17:11
Tim Pritlove
1:17:13
Linus Neumann
1:17:16
Tim Pritlove
1:17:17
Linus Neumann
1:17:18
Tim Pritlove
1:17:35
Linus Neumann
1:17:40
Tim Pritlove
1:17:43
Linus Neumann
1:17:44
Tim Pritlove
1:17:48
Linus Neumann
1:17:50

Das ist ein Big Screen, ja, das ist... Okay. Wir kommen zu dem Thema Neugründungen. Markus Beckedahl hat ja vor etwas über einem Jahr Netzpolitik.org verlassen und hat jetzt, gegründet und jetzt ist er wahrscheinlich gerade noch mit der Gründung, mit der Veranstaltung der Republika beschäftigt, die ja jetzt bald stattfindet und hat jetzt angekündigt, die Gründung des Zentrums für Digitalrechte und Demokratie, mit dem er sich darauf spezialisieren möchte, strategische Kommunikation anzuwenden als zivilgesellschaftlicher Konkurrent zu den Industrieverbänden. Also möchte schnell auf die Kommunikation von Big Tech reagieren und damit der Zivilgesellschaft eine Stimme geben. Digitalrechte.de, die Domain. Es gibt auch eine Vorstellung unter netzpolitik.org, die ihren Gründer, ausgeschiedenen Gründer mit Transparenzhinweis interviewt haben zu dem Thema und sind da gespannt, wie sich das entwickelt. Ist ja eine Gründung, das heißt bisher, ähm, Bisher ohne jeden Erfolg. Sie haben mit ihm gesprochen und dann einen Artikel darüber geschrieben, das ist kein Interview, was bei Netzpolitik.org veröffentlicht wurde. Aber wünschen natürlich Markus viel Glück. Markus hat mit Netzpolitik.org ja eh eine der wichtigsten Plattformen in Deutschland und Europa zu dem Thema gegründet. 2004, damals noch als sein Privatblog. Jetzt als Redaktion mit, ich weiß nicht wie vielen Journalistinnen, mit der Republika, eine der wichtigen Gesellschaftskonferenzen im Thema der Digitalsphäre, zusammen mit Jonny Häusler und Tanja Häusler und Andreas Kippert, ins Leben gerufen. Digitale Gesellschaft gegründet und jetzt das Zentrum für digitale Rechte und Demokratie. Damit sind wir bei den Terminen.

Tim Pritlove
1:20:11
Linus Neumann
1:20:13
Tim Pritlove
1:20:17
Linus Neumann
1:20:23
Tim Pritlove
1:20:24
Linus Neumann
1:20:35
Tim Pritlove
1:21:02
Linus Neumann
1:21:03
Tim Pritlove
1:21:11
Linus Neumann
1:21:15
Tim Pritlove
1:21:44
Linus Neumann
1:22:19
Tim Pritlove
1:23:36
Linus Neumann
1:23:39
Tim Pritlove
1:23:47
Linus Neumann
1:23:49
Tim Pritlove
1:24:07
Linus Neumann
1:24:35
Tim Pritlove
1:24:41
Linus Neumann
1:25:15