5
7.08.2023, 16:00Lektura na 4 minuty

Śmieci AI zalewają internet – raport

Pojawienie się powszechnie dostępnej AI jest bez wątpienia rewolucją. Tyle że technologia sztucznej inteligencji zaczyna być wykorzystywana w sposób, który powoduje, że internet zalewają śmieci – o czym donoszą badacze z NewsGuard.


Grzegorz „Krigor” Karaś

Organizacja wzięła pod lupę nie tylko serwisy, ale i reklamy wyświetlane dzięki największym ich dostawcom, z Google Ads na czele. Wnioski są zatrważające.


Śmieci, wszędzie śmieci

NewsGuard jest organizacją śledzącą m.in. transparentność mediów i umożliwiającą dzięki rozszerzeniu do przeglądarek internetowych identyfikowanie fake newsów. Udostępnia też reklamodawcom rekomendacje dot. rzetelności stron pod kątem publikowania na nich płatnych ogłoszeń – nic zatem dziwnego, że wśród obiektów ich zainteresowania znalazły się również witryny korzystające z AI w celu generowania zawartości. Jak podano w raporcie, liczba zidentyfikowanych przez NG serwisów określanych mianem Unreliable Artificial Intelligence-Generated News (czyli witryn z mało wiarygodnymi informacjami generowanymi przez AI) wzrosła od czasu rozpoczęcia badania w maju tego roku z 49 do aż 380, według danych na koniec lipca. Przeciętnie do listy dodawanych jest 25 takich stron tygodniowo.

Przykładowa witryna z treściami generowanymi przez AI.
Przykładowa witryna z treściami generowanymi przez AI.

Organizacja śledzi je dzięki stworzonemu przez siebie narzędziu, a identyfikacja witryn opiera się na czterech kryteriach. By serwis trafił na tę listę, zawartość danej witryny wyraźnie musi cechować się „niestarannością” typową dla tekstów tworzonych przez AI, artykuły te muszą obejmować znaczącą część treści dostępnych na danej stronie i muszą również być publikowane bez znaczącego nadzoru ludzi. Ponadto witryna musi udawać, np. layoutem, że materiały tworzone są przez ludzi i nie ujawniać przed czytelnikiem, że zawartość została stworzona maszynowo.

Artykuły takie takie mają różną tematykę – newsy, styl życia, zdrowie, technologie, sport, ciekawostki i wiele innych. Ich poziom i wartość merytoryczna są nieistotne, a najczęściej – bardzo niskie. Dzięki temu w niektórych przypadkach pochodzenie takiego materiału można łatwo rozpoznać, gdyż teksty opatrzone są zatrważającymi błędami. Przykładowo pojawiają się w nich nawet informacje na temat tego, że dany model AI nie jest w stanie korzystać z zewnętrznych linków URL i tym samym wygenerować artykułu z bieżącymi informacjami lub że... sztuczna inteligencja nie potrafi pomóc w typowaniu zakładów sportowych. Bywa, że artykuły są maszynowo „przepisywane” z wykorzystaniem powszechnie znanych źródeł, korzystają z tych samych, powtarzających się zdjęć czy fraz, a nawet udzielają fałszywych porad dotyczących zdrowia. Innymi więc słowy, są zwyczajnie groźne, gdyż wprowadzają w błąd, który może sporo kosztować.


Fejkowe serwisy pełne spamu

Jak podaje NewsGuard, skala w niektórych przypadkach jest zatrważająca. Na jednej z witryn pojawia się na przykład 1200 wypluwanych przez AI artykułów dziennie, inna z kolei stwarza wrażenie, że publikują tam ludzie – tyle tylko, że do jednego autora przypisane są tysiące tekstów, w tym 108 materiałów… stworzonych w jeden dzień. Serwisy tego rodzaju często też skupiają się na publikowaniu długich, rozbitych na liczne akapity treści – co ułatwia pozycjonowanie reklam. Tym samym więc witryny stają się ich farmami, co rodzi naturalne podejrzenie, że są finansowane przez firmy, które wyspecjalizowały się w takim „pozyskiwaniu” pieniędzy od reklamodawców. Co ciekawe, objęte badaniem strony www często nie znają umiaru: Google najprawdopodobniej nie ma limitów na liczbę umieszczonych na danej stronie reklam – tych więc w pojedynczym tekście często pojawia się nawet kilkanaście.

Przykładowa witryna z treściami generowanymi przez AI.
Przykładowa witryna z treściami generowanymi przez AI.

NG podaje, że ponad 90% reklam przebadanych przez NewsGuard na potrzeby raportu z ogólnej ich próbki 393 było dostarczanych przez Google Ads. Reklamy te rzecz jasna są dostosowywane do odbiorcy. Raport nie podaje jednak poszczególnych marek i firm, które reklamują się w ten sposób najczęściej i pośrednio finansują działalność tego rodzaju stron, zakładając, że przedsiębiorstwa te zwyczajnie nie mają pojęcia o całym procederze skoro nie wie o tym Google, blokujące zresztą zgodnie z własną polityką farmy reklam. Podobnie wygląda również kwestia samej tematyki artykułów – niektóre mogą sprawiać wrażenie tekstów przygotowywanych przez przedstawicieli określonej marki, trudno jednak w takim wypadku posądzać zewnętrzne firmy o współpracę. NewsGuard zauważa, że reklamodawcy mają co prawda czarne listy, które wykluczają poszczególne, podejrzane serwisy z tego rodzaju usług, jednakże te – według organizacji – najwyraźniej nie są aktualizowane na tyle szybko, by odciąć od pieniędzy wspomniane strony.

Konkluzja jest oczywiście dość smutna: jak na razie walka z takimi stronami w dużej mierze jest skazana na porażkę, a skoro witryny tego rodzaju powstają i ich liczba rośnie, to muszą się po prostu komuś opłacać. My zaś coraz częściej będziemy się z nimi spotykać.

Fot. otwierająca: Pexels.


Czytaj dalej

Redaktor
Grzegorz „Krigor” Karaś

Gdyby mnie ktoś zapytał, ile pracuję w CD-Action, to szczerze mówiąc, nie potrafiłbym odpowiedzieć. Zacząłem na początku studiów i... tak już zostało. Teraz prowadzę działy sprzętowe właśnie w CD-Action oraz w PC Formacie. Poza tym dużo gram: w pracy i dla przyjemności – co cały czas na szczęście sprowadza się do tego samego. Głównie strzelam i cisnę w gry akcji – sieciowo i w singlu. Nie pogardzę też bijatyką, szczególnie jeśli w nazwie ma literki MK, a także rolplejem – czy to tradycyjnym, czy takim bardziej nastawionym na akcję.

Profil
Wpisów472

Obserwujących22

Dyskusja

  • Dodaj komentarz
  • Najlepsze
  • Najnowsze
  • Najstarsze