Här är bolagen som kartlägger ditt liv. Del 1: Big tech – har samlat in så mycket data om dig att de tappat kontrollen.
Den kommersiella massövervakningen: Aktörerna bakom datainsamlingen
Du vet redan vilka de stora bolagen är som samlar in data i kommersiellt syfte. Men frågan är om du har koll på den absurda omfattningen? Du kan fundera på svaret, men svaret är nej. Inte ens företagen själva vet hur mycket data de samlar in, var den tar vägen och hur de ska kontrollera den.
Kartläggningen av människors beteende på internet genom insamling av data, som i allra högsta grad är privat, har lagt grunden för en av världens största ekonomier. Här kan du läsa om affärsmodellen som går ut på att suga data ur de flesta av internets dagliga användare. Här skriver vi om hur själva datainsamlingen går till. Och i den här genomgången tar vi en titt på vad datan används till. Men nu ska vi ägna några rader till att peka ut techbolagen som driver på den marknadsplats av beteendedata som internet förvandlats till och hur absurt mycket data de samlar in.
Låt oss börja med internetleverantörerna. Det är ju ganska uppenbart att de håller koll på vad du gör online (om du inte använder en VPN förstås). Det är inte heller särskilt konstigt att de gör det; i väldigt många länder är de enligt lag tvingade att logga din trafik. Det betyder inte att alla internetleverantörer gör sig en extra hacka genom att sälja datan vidare, men i ett land som USA hör det till vanligheterna. En granskning av Vice visade att det till och med gått att köpa människors geografiska position i realtid. Och i en rapport slår The Federal Trade Commission i USA fast att minst sex av de största internetleverantörerna kartlägger sina kunders internetbeteende och att deras alternativ för att erbjuda kunderna integritet är en illusion.
Vad har vi mer? Betalningstjänster: Paypal har till exempel rapporterats ha villkorstexter som är längre än Shakespeares Hamlet, vilket signalerar om en lite väl tilltagen datainsamling. Apparna i din telefon: Washington Posts journalist Geoffrey A. Fowler räknade samman antal ord i sina telefonappars privacy policiesoch kom upp i en miljon – eller dubbelt så långt som Tolstojs Krig och Fred om vi ska fortsätta jämföra med klassisk litteratur. Och ja, så långa användaravtal är lika med att samla in data. När det gäller apparna är det inte minst location data som är åtråvärd. Och i just den här kategorin finns det ingen gräns för hur känslig data som går till högstbjudande; besök på läkarkliniker och trossamfund tillhör basvarorna på en marknadsplats där människors fysiska rörelsemönster omsätter 12 miljarder dollar per år. Och tro inte att du är skonad för att du stängt av platstjänster. Låt oss för enkelhetens skull använda Meta som exempel. I deras affärsmodell ingår det att betala sig ur åtal. Det är inget problem för dem ekonomiskt, men för varje förlikning får vi veta lite mer om deras metoder. I en enda uppgörelse under 2022 betalade de till exempel 37 miljoner dollar efter att ha spårat 70 miljoner användare trots att de klickat bort platstjänstsfunktionen. Ännu dyrare blev uppgörelsen med de som drabbats i Cambridge Analytica-läckan där Meta gick med att betala 725 miljoner dollar efter att ha läckt bland annat privata konversationer. Just Meta förtjänar en mer utförlig presentation. Du kommer nog hålla med om det när du läst kommande stycken.
Meta – vet inte ens själva hur mycket data de samlar in, var den tar vägen eller hur den ska kunna raderas.
Både Google och Meta erbjuder dig som användare att kontrollera och ta en titt på den samlade data som bolagen har på dig. Men det är en falsk föreställning och långt ifrån hela sanningen. Inte ens i domstol vill Meta berätta om hur mycket data de sitter på. I ett rättegångsförhör kopplat till Cambridge Analytica-skandalen gick bolaget med på att dela med sig av data som går att finna under “Download Your Information” men argumenterade för att de ville hålla data som kom från “non-consumer parts of Facebook” utanför rättegången. När rätten inte riktigt gick med på det och krävde svar från två av Metas utvecklingschefer svarade de att inte ens Meta har koll på hur mycket data de har på människor: “Det finns inte en enda person på Meta som kan svara på den frågan.”
Läckta dokument våren 2022 gav samma bild när anställda på Meta erkände att ”vi har inte kontroll på hur våra system använder datan”. Tidningen Vice publicerade delar av läckan där anställda på Meta jämförde deras system med att hälla bläck i vatten.
“Vi har byggt ett system med öppna gränser. Tänk dig att du har en flaska med bläck. Den innehåller alla möjliga användardata; tredjepartsdata, förstapartsdata, data klassad som känslig. Sen tar du flaskan och häller bläcket i en sjö; alltså vårt datasystem. Bläcket flyter ut överallt. Hur ska du kunna stoppa tillbaka bläcket i flaskan? Och hur ser du till så att bläcket bara flyter i vissa delar av sjön?”
Bilden av ett Meta utan kontroll på sin (din) insamlade data växer fram. Återstår då bara att försöka reda ut hur mycket data de sitter på. Genom åren har vi fått många tecken på att mängden är absurd. När ProPublica gjorde en kartläggning av Facebooks insamling av data visade det sig redan 2016 att Meta hade svindlande 52 000 unika attribut som de kategoriserade människor utifrån med hjälp av maskinlärning. Meta vill gärna ge sken av att datainsamlingen till största del kommer från användarnas aktivitet på deras plattformar. Men det räcker att läsa om skandal efter skandal efter skandal där Meta och dataläckor har gått hand i hand för att en annan bild ska växa fram. Oftast är läckorna kopplat till den teknik som de en gång i tiden döpte till Facebook Pixel; annonssystemet som miljontals sajter hakat på och som gör det möjligt för Meta att nå långt utanför sina egna appar när de matar sitt AI- och maskininlärningssystem med data.
Meta samlar in information om kunder som köpt graviditetstest och sökt konsultation gällande potensproblem. Detta gäller människor världen över oavsett om de har ett Facebook-konto eller inte.
Enkelt förklarat går Metas Pixelsystem ut på att hemsidor ger Meta tillgång till hur deras hemsidebesökare beter sig – vad de handlar, vad de väljer bort, vilka texter de läser, vilka videor de tittar på och så vidare – och i motprestation får sajterna i sin tur använda sig av Metas totala datainsamling för att skräddarsy och rikta sina annonser (på Metas plattformar och i deras annonssystem) på bästa sätt. I en kartläggning av The Markup visade det sig att var tredje sajt av världens 100 000 populäraste hemsidor var kopplade till Meta Pixel. Det är den här infrastrukturen som gör att Meta har koll på internetanvändare världen över oavsett om de har ett Facebook-konto eller inte.
När en läcka via Meta Pixel avslöjas handlar skandalrubrikerna ofta om att känsliga köp eller beteenden online har gått att knyta till riktiga personer via mejladresser eller telefonnummer. Det har till exempel framgått att pixeltekniken registrerar data om apotekskunder som köpt hiv-test, graviditetstest och sökt konsultation gällande potensproblem. Men egentligen är det ingen skillnad på en “skandal-läcka”, där personuppgifter som mejladress har läckt ut tillsammans med onlinebeteenden, och det konstanta flöde av insamlad data som når techbolagen varje dag, där datan kan knytas till personer med andra metoder: med hjälp av IP-adresser, cookies och andra tekniker. Det spelar ingen roll hur mycket de stora techbolagen svär sig fria genom att säga att datan de har på profiler är anonymiserad. Har du bara tillräckligt mycket data på en person går det inte att hålla den anonym. Det går hur snabbt som helst att lägga ett pussel som avslöjar vem som döljer sig bakom datan och så är den av-anonymiserad. Speciellt om hela din affär bygger på stora AI- och maskininlärningssystem vars enda syfte är att kategorisera allt du gör för att bygga en profil på dig.
Även om Meta har tillgång till data om sina två miljarder användare och dessutom spårar människor på var tredje sajt i världen, så nöjer sig företaget inte där. Förutom att de samlar in egen data köper de dessutom extra data från så kallade data brokers. De har också blivit påkomna med att köpa vpn-bolaget Onavo för att använda det som ett spionverktyg. Utåt sett såg det alltså ut som att Meta gav sig in i privacy-världen. Men så var inte fallet (ytterligare en anledning till att det är viktigt att tänka igenom vilken vpn-tjänst man väljer). Istället användes vpn-tjänsten till helt andra syften. De användare som laddade ner Onavo fick spionverktyg installerade på sina telefoner. Genom rena hackingtekniker såg Meta till så att deras vpn-app plockade upp data från andra appar. Framförallt handlade det om att komma över krypterad trafik från konkurrerande tjänsten Snapchat.
Den totala datainsamlingen ger Meta förmågan – som de själva beskriver det i läckta dokument – att rikta annonser till människor utifrån hur de kommer att bete sig, vad de kommer att köpa och vad de kommer att tänka.
Skandalerna och läckorna och de absurda siffrorna över hur mycket Meta samlar in skildrar företaget på ett bra sätt. Men det som kanske säger allra mest om bolagets värderingar och ambitioner är tillvägagångssätten de använder. Det är i de tekniska detaljerna som det blir tydligt att övervakning är själva kärnan i Metas affärsmodell.
Meta samlar in dina rörelser med musen, meddelandena du skrivit på sociala medier men ångrat och aldrig postat, och hur du rör dig med din mobil även när du klickat nej tack till att dela location data.
Meta är inte kända för att vara transparenta med hur de samlar in data och vad de gör med den. Men det går att ta en bakdörr in i deras huvud genom att läsa deras patent. Ett av dem har de döpt till Offline Trajectories och det går ut på att använda tekniker som kan förutspå när du är på väg att tappa täckning och gå offline. Flera av bolagets patent handlar om just detta: att hitta sätt att lokalisera dig även om du gör motstånd. Ett patent heter Location Prediction Using Wireless Signals on Online Social Networks och precis som det låter går det ut på att använda styrkan i din wifi-uppkoppling eller läsa av din bluetooth för att lokalisera dig. På samma vis har Meta använt andra människors mobiler (i din närhet) för att pricka din position även när du har location data avstängt. Meta har blivit stämda för att bryta mot Apples Tracking Transperancy och de har själva erkänt att de kan spåra människor även när platstjänster stängts av.
Men inget har blottat Metas utbredda datainsamling lika väl som efterspelet av den så kallade Cambridge Analytica-skandalen där 87 miljoner användares metadata och personliga meddelande gick rakt till ett analysbolag som använde informationen för att påverka valet i USA. Bland annat framkom det att Meta läser av och registrerar ditt rörelsemönster med datormusen och vilka publika wifi som finns i närheten av spårade mobiltelefoner. De använder sig av mobilmaster och GPS för att räkna ut var du befinner dig. Och loggar batteriprocent, tillgängligt lagringsutrymme, installerade plugins och hastigheten på din uppkoppling för att identifiera dig. Bolaget erkände också att de använder metadata från bilder du tar med din telefon (data som inte är synligt för blotta ögat men som finns inbäddat i bildfilerna) för att identifiera och spåra dig. Talespersoner för Meta bekräftade också att de registrerar IP-adresser och köper data från data brokers för att bygga tydligare personprofiler.
Metas patent avslöjar kärnan i deras affärsmodell och vilka ambitioner de har. Ett av patenten siktar till och med på att kunna förutse när du ska dö.
Meta har också avslöjats med att använda något som kallas för accelerometern för att spåra människor; det är själva hårdvaran i mobiler som mäter rörelse och riktning och som gör att telefonen till exempel kan skifta mellan liggande och stående läge. Genom att kartlägga rörelsemönster och koppla det till andra appar i din telefon har Meta kunnat identifiera hur du rör dig och när du besöker olika sorters platser. Den här tekniken har även använts för att matcha med mobiler i din närhet och plötsligt blir det extremt tydligt att techbolagen har tillgång till tekniker långt bortom de uppenbara i deras jakt på personlig data. På ett annat inkräktande sätt har Meta övervakat vad människor skrivit men inte postat i olika formulär på internet. Facebook själva sorterar in dessa “unposted thoughts” under begreppet “self-censorchip”. Vi tar det igen: text som du alltså skrivit men som du sedan av någon anledning ångrat att du skrivit och valt att aldrig posta har sparats och loggats av Meta. Men inget chockerar egentligen längre. Meta har även patent på teknik som kan förutse när människor går genom “life changing events” genom att analysera dagliga rutiner och hur din sömn förändras (med telefonen på nattduksbordet är allt möjligt). Patentet siktar till och med på att kunna förutse när du ska dö. Välkommen till en ny skön värld.
Google – med monopol på både sökmotor och webbläsare vet de allt om alla.
Även om Meta framstår som överlägsna på datainsamling så har de förstås en nästan oslagbar konkurrent i Google. När Facebook Pixel har en närvaro på var tredje sajt har Googles motsvarighet Google Analytics en träffprocent på 74. Upplägget är ungefär detsamma: när en hemsida har Google Analytics installerat – för att mäta och analysera trafiken på hemsidan och koppla det till Googles annonssystem för mer pricksäker marknadsföring – får Google också tillgång till hur besökarna beter sig. Men det är inte det enda verktyget i Googles låda.
Bolaget tillhandahåller också gratis typsnitt till hemsidor. Det är ett erbjudande som 60 miljoner sidor har haft svårt att tacka nej till. Och precis som med företagets analysverktyg så kommer det med samma krav på motprestation: att Google får samla in information om besökarna. På hemsidor som använder Google Fonts kan de övervaka besökare och hur de beter sig genom att registrera deras IP-adress och sedan korsbefrukta det med all annan information som de har kopplat till just den IP-adressen. Samma sorts insamling sker så fort det finns en Google-sökruta inbäddad på hemsidor (detta gäller för övrigt också så fort det finns en “dela-knapp” från Facebook, Twitter och Instagram). Sammantaget ger det här ett enormt datainflöde till Google. Men vi vet ju alla att det bara är början.
2022 betalade Google 400 miljoner dollar i en enda förlikning innan de fortsatte med sin kärnverksamhet: att samla in personlig information.
9 av 10 som använder en sökmotor gör det genom att googla. Det innebär att Google har koll på i princip all världens internetanvändares innersta tankar och liv. Här kan du läsa om hur Google knappast behöver att du är inloggad för att de ska kunna logga att det är just du som gör sökningen. Och det tar ju inte ens slut där. 7 av 10 webbläsare som används är Googles Chrome. Här kan du i serieformat se hur Google använder sin webbläsare för att googla dig snarare än att det är du som googlar vad du nu än googlar. Lägg till Youtube och Gmail så blir det nästan absurt hur mycket Google vet om världen och dess invånare.
Precis som Meta har Google en stor kassa för rättsliga förlikningar(i en enda förlikning 2022 pröjsade de 400 miljoner dollar innan de fortsatte att samla in data). Google köper sig fria, men de rättsliga påtryckningarna har inte lämnat techjätten helt oberörd. Google Analytics har i princip förbjudits i flertalet länder och tredjeparts-cookies har varit under legal press, vilket fått Google att åtminstone försöka fasa ut den typen av datainsamling. Problemet är bara att techbolagen är snabbare än lagstiftarna. Det spelar ingen roll om bolag som Google plockar bort en specifik datainsamlingsteknik eftersom de hittar nya sätt att samla in data, eftersom det är deras kärnverksamhet. Som Googles medgrundare Larry Page sa i en intervju redan 2001: “Personlig information är Googles affär.”
På senare år har Google känt sig tvungna att vidta en del åtgärder för att framstå som att de bryr sig om integritet trots att hela deras affärsmodell bygger på motsatsen. De har bland annat gått ut med att de tar bort data efter ett och ett halvt år. Om vi bortser från det allvarsamma i att i princip alla dina digitala avtryck sparas 18 månader i taget så är ju den återkommande frågan: spelar det någon roll vad Google säger att de gör? När Washington Posts journalist Geoffrey A. Fowler hörde av sig till Google och frågade varför de har 167 gigabyte data – eller 83 500 romaner av Stephen King om du så vill – sparat på honom svarade de bara: “We’ve long focused on minimizing the data we use to make our products helpful”. När abortlagarna ändrades i USA sa Google att de proaktivt skulle ta bort “särskilt personlig” data om ställen som människor besökt, som abortkliniker och sjukhus. Ett år efter uttalandet hade det inte infriats. Det tål att upprepas: personlig information är Googles affär. Det innebär inte att de helt kan ignorera sin omvärld. Men det innebär att de sannolikt bara kommer att hantera nya lagkrav och press från allmänheten genom att försöka hitta nya sätt att samla in data. Åtminstone tills de ändrar sin affärsmodell.
Det finns fler techbolag som förtjänar omnämnande. TikTok har blivit anklagade för att samla in mängder med data och dela den med kinesiska staten. De är dessutom tydliga, på sin egen sajt, med att de samlar in till exempel tangenttryckningsmönster och rytmen i hur du skriver. Amazon har avslöjats med att samla in absurt mycket data i både sitt digitala ekosystem och i fysiska butiker. Var dina kreditkortsköp tar vägen vill du knappt veta. Som sagt, den stora delen av internet har förvandlats till en infrastruktur där insamlingen av personlig data är det som används till att öka både intäkter och makt. Det kommer att krävas starkt motstånd för att vända utvecklingen.