Postanowiłem napisać prosty i…

Postanowiłem napisać prosty i przystępny wpis na temat głośnego „artykułu 13”, jako że na wykopie chyba zaczyna górować przeświadczenie, że w tej dyrektywie niczego kontrowersyjnego nie ma. Otóż jest, przynajmniej jedna – obowiązkowe filtry treści.

Sytuacja obecna:
Lubię wszystko przedstawiać na prostych przykładach, wiec załóżmy, że jestem grafikiem i jakiś zły człowiek przywłaszczył sobie moją świetną pracę i wrzucił ją na wykop. Obecnie sytuacja wygląda tak, że sam muszę się zgłosić z tym do administracji i im powiedzieć, że ktoś naruszył moje prawa autorskie. Jeżeli znowu się pojawi mój obrazek na wykopie, znowu muszę się z nimi skontaktować. Dla mnie – jako autora – nie jest to idealna sytuacja, bo muszę aktywnie przeszukiwać internet w poszukiwaniu złodziei moich pięknych obrazków.

Po zmianach:
Unia Europejska chce ukrócić ten proceder w taki sposób, ze wystarczy, że tylko raz poskarżę się Michałowi B. a on już zadba o to, aby moje prace nie trafiały na wykop. Doda go do treści, których publikować nie można i wszystko się będzie usuwać automatycznie! Brzmi pięknie, prawda?

W czym jest problem?
Główny problem polega na tym, że zadanie przechwytywania tego typu treści jest cholernie trudne. Powiem więcej, znam tylko jeden działający algorytm, który coś takiego w miarę skutecznie realizuje, i jest nim Content ID od Google, którego efekty oglądacie na YouTube. Możecie sobie o nim poczytać tutaj, a w najprostszych słowach działa on tak, że porównuje wrzucane materiały z tymi, które posiada w bazie danych filmów objętych prawem autorskim, i jeżeli znajdzie między nimi podobieństwo, automatycznie je zablokuje. Unia Europejska chce tego typu rozwiązanie wymusić na wszystkich stronach, gdzie są publikowane treści. Rozwiązanie to jest rozwijane od 11 lat, a pomimo tego nadal jest dalekie od doskonałości. Trafiliście może czasem na filmy z dziwnymi ramkami, albo nagrywane telefonem z telewizora? 🙂

Z technicznego punktu widzenia tego typu rzeczy są realizowane przez sztuczną inteligencję, która ustala coś, co można porównać do stopnia podobieństwa między treściami. Nie jest to zadanie proste, chociażby ze względu na to, że filmy mogą się różnić jakością, mogą mieć dodane napisy, mogą być puszczone niezauważalnie wolniej lub szybciej, obraz może być przycięty, i tak dalej. Można więc powiedzieć, że nie szukamy czegoś, co jest identyczne, tylko wystarczająco podobne. Im mniej restrykcyjni jesteśmy, tym skuteczniej działamy, ale jednocześnie zwiększa się liczba tak zwanych „false positive”, czyli usunięć filmów, które wcale żadnych praw autorskich nie naruszały.

Znowu przykład, tym razem z wykopowego podwórka. Kojarzycie przeróbki pasków TVP, które trafiają na wykop? Czasem sam nie wiem, czy to prawda, czy satyra ( ͡° ͜ʖ ͡°) Algorytm tym bardziej tego nie będzie wiedział i jeżeli TVP to zgłosi, to usuwane będzie wszystko, bo przecież nie rozpozna który napis był prawdziwy, a który nie. To praktycznie tyczy się wszystkich memów, chyba że właściciel pierwotnego zdjęcia nie podejmie żadnej akcji.

Pomijając nierealność stworzenia idealnego algorytmu, to innym problemem jest to, że obowiązek prowadzenia takiego filtrowania treści niesamowicie utrudni działanie portali, praktycznie zostawiając tylko kilka największych, którzy będą sobie mogli pozwolić na stworzenie własnych filtrów, albo wymusi zakup gotowego oprogramowania, które się tym zajmuje – czyli znów zarobią najwięksi. Jeszcze cieszyć się będą osoby pracujące nad AI 😉

A może się mylę i piszę bzdury?
Może. Nie należy wyrabiać sobie zdania w oparciu o wpisy tworzone przez anonimowych ludzi w Internecie. Poczytaj więc co o tym sądzą fachowcy, tacy jak GitHub:

Ineffectiveness: Content detection tools are flawed (generate false positives, don’t fit all kinds of content) and overly burdensome, especially for small and medium-sized businesses that might not be able to afford them or the resulting litigation

Albo Electronic Frontier Foundation:

By requiring Internet platforms to perform automatic filtering all of the content that their users upload, Article 13 takes an unprecedented step towards the transformation of the Internet, from an open platform for sharing and innovation, into a tool for the automated surveillance and control of its users.

Do stworzenia wpisu zainspirowało mnie to znalezisko i słowa @m__b o „kursie Internetu”. Może ktoś by coś więcej napisał na temat ograniczeń w linkowaniu?

#acta2018 #antyart13 #4konserwy #technologia