około 23 godziny temuLektura na 2 minuty

Programista opracował pułapkę na roboty zbierające dane do szkolenia AI

Złośliwy kod (bo tym właśnie jest, a jego autor wcale się z tym nie kryje) został nazwany Nepenthes, czyli dzbanecznik, na cześć rodziny mięsożernych roślin.


Jakub „Jaqp” Dmuchowski

Wielu ludzi ma już po dziurki w nosie rzeszy botów przeczesujących ich witryny w poszukiwaniu treści wartych „pożyczenia” w celu nakarmienia nimi modeli sztucznej inteligencji. Jedną z takich osób jest anonimowy programista, do którego udało się dotrzeć redakcji Ars Technica. Przedstawiony jako Aaron mężczyzna przygotował pułapkę na crawlery, a jej zadaniem jest wciągnięcie robotów w praktycznie nieskończoną pętlę skakania po stronach wypełnionych bezsensowną paplaniną.


Nepenthes

Swój twór Aaron nazwał Nepenthes, nawiązując przy tym do roślin mięsożernych z monotypowej rodziny dzbanecznikowatych, które pożrą praktycznie wszystko, co pokusi się na zbliżenie do ich liści pełniących funkcję pułapek. Jak działa złośliwy kod inspirowany dziełem natury? Nepenthes generuje niekończącą się sekwencję stron zawierających multum łączy przerzucających boty z miejsca na miejsce. Całość została zaprojektowana w taki sposób, aby działała na tyle wolno, żeby uniknąć przeciążenia serwera (co często i tak nie jest możliwe) i przy okazji zmarnować jak najwięcej czasu crawlera czekającego na wczytanie się treści.

Miłym akcentem jest możliwość dodania tzw. bełkotu Markova, który wykorzystuje łańcuchy Markova do generowania zdań o losowej treści, jak np. „Niedługo później partie herbaciane w ogóle wpłyną na politykę? Nakaz Hume'a leży u podstaw ostrożności naukowców z artykułu: „Niezmiennie”, mówi Craig, książka o czarnej tematyce przyjdzie na myśl o sojuszach gejów i prawicowców na katolickich kampusach?”. Aaron liczy na to, że nafaszerowanie botów tak bezsensownym materiałem sprawi, że szkolone na pozyskanych przez nie danych modele AI staną się jeszcze głupsze, niż są obecnie.

Mimo że wielu zagorzałych fanów sztucznej inteligencji może pokusić się o zaimplementowanie Nepenthes na swojej stronie, warto mieć na uwadze, że jest to ostrze obosieczne. Jako że kod stanowi pułapkę na crawlery, pochłonie on również te odpowiedzialne za indeksację witryn, co sprawi, że witryna taka zniknie z wyników wyszukiwania Google i pokrewnych wyszukiwarek. Z kolei próbujące się wydostać z labiryntu roboty mogą doprowadzić do znacznego obciążenia procesora serwera, na co wypada zwrócić uwagę szczególnie w przypadku, kiedy to korzystamy z własnego sprzętu.

Więcej informacji na temat Nepenthes znajdziecie na stronie projektu. Tam również znajdziecie demo prezentujące działanie pułapki w akcji. Warto się z nim zapoznać choćby z tego powodu, aby na własne oczy zobaczyć, z czym muszą zmierzyć się usidłane boty.


Czytaj dalej

Redaktor
Jakub „Jaqp” Dmuchowski

Swoją przygodę z grami komputerowymi rozpoczął od Herkulesa oraz Jazz Jackrabbit 2, tydzień później zagrywał się już w Diablo II i Morrowinda. Pasjonat tabelek ze statystykami oraz nieliniowych wątków fabularnych. Na co dzień zajmuje się projektowaniem stron internetowych. Nie wzgardzi dobrą lekturą ani kebabem.

Profil
Wpisów1471

Obserwujących3

Dyskusja

  • Dodaj komentarz
  • Najlepsze
  • Najnowsze
  • Najstarsze