Δεδομενα

Εκατοντάδες χιλιάδες βίντεο από μεγάλα ΜΜΕ χρησιμοποιήθηκαν στην εκπαίδευση μοντέλων ΑΙ

Κανάλια στο YouTube μεγάλων ΜΜΕ και δημιουργών περιεχομένου περιλαμβάνονταν σε σύνολα δεδομένων βίντεο που χρησιμοποιούσαν οι Microsoft, Meta, Snap, Runway και Bytedance.

Αυτό το άρθρο δημοσιεύθηκε αρχικά από το Nieman Lab στις 30/10/2025 και αναδημοσιεύεται, σε ελληνική μετάφραση από το iMEdD, με την άδειά του. Οποιαδήποτε άδεια αναδημοσίευσης υπόκειται στον αρχικό εκδότη. Διαβάστε το αρχικό άρθρο εδώ.

Μετάφραση: Εβίτα Λύκου
Κεντρική εικόνα: Shutterstock

Τον περασμένο μήνα, το The Atlantic δημοσίευσε την πιο πρόσφατη έρευνα στη σειρά του σχετικά με τα σύνολα δεδομένων εκπαίδευσης της δημιουργικής τεχνητής νοημοσύνης (gererative AI). Ο συντάκτης Άλεξ Ράισνερ (Alex Reisner) διαπίστωσε ότι τουλάχιστον 15 εκατομμύρια βίντεο από το YouTube χρησιμοποιήθηκαν ως δεδομένα εκπαίδευσης από μεγάλες εταιρείες τεχνολογίας, είτε για έρευνα είτε, σε ορισμένες περιπτώσεις, για την κατασκευή προϊόντων βίντεο μέσω τεχνητής νοημοσύνης.

Το ρεπορτάζ του The Atlantic επικεντρώθηκε σε δώδεκα σημαντικά σύνολα δεδομένων εκπαίδευσης που είτε συγκεντρώθηκαν είτε χρησιμοποιήθηκαν από εταιρείες όπως η Microsoft, η Meta, η Snap, η Tencent, η Runway και η ByteDance. Από την έρευνα προκύπτει ότι η μη εξουσιοδοτημένη χρήση βίντεο του YouTube συνέβαλε ουσιαστικά στο πρόσφατο άλμα της βιομηχανίας της τεχνητής νοημοσύνης όσον αφορά την ποιότητα της παραγωγής βίντεο τεχνητής νοημοσύνης.

«Όπως το ChatGPT δεν θα μπορούσε να γράψει όπως ο Σαίξπηρ χωρίς να “διαβάσει” πρώτα τον Σαίξπηρ, έτσι και ένα λογισμικό παραγωγής βίντεο (video generator) δεν θα μπορούσε να κατασκευάσει ένα ψεύτικο δελτίο ειδήσεων χωρίς να “δει” άπειρες καταγεγραμμένες εκπομπές», γράφει ο Ράισνερ.

Το άρθρο του The Atlantic αναφέρει εν συντομία ότι περισσότερα από 30.000 βίντεο του BBC περιλαμβάνονταν στα δεδομένα εκπαίδευσης, μαζί με αυτά άλλων ειδησεογραφικών καναλιών του YouTube. Χρησιμοποιώντας μια βάση δεδομένων με δυνατότητα αναζήτησης που δημοσίευσε το The Atlantic, θέλησα να κατανοήσω περισσότερο την κλίμακα της στοχοποίησης των ειδησεογραφικών καναλιών. Στα ίδια σύνολα δεδομένων, βρήκα εκατοντάδες χιλιάδες βίντεο που προέρχονται από ορισμένες από τις πιο δημοφιλείς ειδησεογραφικές επιχειρήσεις και δημιουργούς ειδήσεων στο YouTube, συμπεριλαμβανομένων των New York Times, Washington Post, Guardian, Al Jazeera και Wall Street Journal.

Για παράδειγμα, εντόπισα περισσότερα από 88.000 βίντεο από τα κανάλια του Fox News στο YouTube, συμπεριλαμβανομένου του κύριου λογαριασμού του και του Fox Business. Περίπου 70.000 επιπλέον βίντεο προέρχονται από τα κανάλια του ABC News και της πρωινής εκπομπής του, Good Morning America. Βρήκα επίσης περισσότερα από 55.000 βίντεο από τα κανάλια του Bloomberg στο YouTube, συμπεριλαμβανομένων των Bloomberg Originals, Bloomberg Television και Bloomberg Technology.

Ερευνώντας στη βάση δεδομένων τα κανάλια της Vox Media στο YouTube, βρήκα περισσότερα από 30.000 βίντεο, μεταξύ των οποίων επεξηγηματικά βίντεο από το Vox, ταξιδιωτικά ντοκιμαντέρ από το Eater και μελό βίντεο με ζωάκια από το The Dodo. Περίπου 13.900 από αυτά τα βίντεο προέρχονταν από το επίσημο κανάλι του The Verge στο YouTube, συμπεριλαμβανομένων οδηγών gadget για iOS, επεισοδίων του κορυφαίου podcast The Vergecast και συνεντεύξεων με διευθύνοντες συμβούλους της Silicon Valley, όπως ο Μαρκ Ζούκερμπεργκ (Mark Zuckerberg).

Ο διευθύνων σύμβουλος του YouTube Νιλ Μόχαν (Neal Mohan) έχει δηλώσει στο παρελθόν ότι οι όροι χρήσης της πλατφόρμας δεν επιτρέπουν σε άλλες εταιρείες να κατεβάζουν βίντεο και να τα χρησιμοποιούν ως δεδομένα εκπαίδευσης.

«Για να επιβιώσουν, οι πλατφόρμες τεχνητής νοημοσύνης γνωρίζουν ότι χρειάζονται (και οι καταναλωτές τους επιθυμούν) ποιοτικό, αξιόπιστο περιεχόμενο όπως το δικό μας, το οποίο δίνει στα προϊόντα τους βαρύτητα και σκοπό», δήλωσε η Λόρεν Σταρκ (Lauren Starke), εκπρόσωπος της Vox Media. «Οι δαπάνες τους για υποδομές τεχνητής νοημοσύνης είναι άνευ προηγουμένου: τσιπ, διακομιστές και κέντρα δεδομένων που τροφοδοτούν τα μοντέλα τους. Ωστόσο, όταν φτάνουμε στο περιεχόμενο που κάνει αυτά τα μοντέλα χρήσιμα –δημοσιογραφία, δημιουργική δραστηριότητα– δεν έχουν ξοδέψει συγκριτικά σχεδόν τίποτα».

Τον Μάιο του 2024, η Vox Media υπέγραψε ένα σύμφωνο συνεργασίας με την OpenAI για ένα μη γνωστοποιημένο ποσό, επιτρέποντας στην εταιρεία να χρησιμοποιήσει το περιεχόμενό της για προϊόντα όπως το ChatGPT. Η Σταρκ δήλωσε ότι η Vox Media θα συνεχίσει να επιδιώκει συνεργασίες με εταιρείες τεχνητής νοημοσύνης που σέβονται το έργο της, αλλά «θα ακολουθήσει και ένδικα μέσα για την προστασία της πνευματικής μας ιδιοκτησίας όταν είναι απαραίτητο».

«Χωρίς το ποιοτικό μας περιεχόμενο, η πραγματικότητα για αυτές τις πλατφόρμες θα είναι: σκουπίδια μπαίνουν, σκουπίδια βγαίνουν», δήλωσε.

Η βάση δεδομένων του The Atlantic περιλαμβάνει πάνω από δώδεκα διαφορετικά σύνολα δεδομένων εκπαίδευσης βίντεο, τα οποία έχουν χρησιμοποιηθεί κατά κόρον στην έρευνα και στην ανάπτυξη της δημιουργικής τεχνητής νοημοσύνης. Ορισμένα από αυτά τα σύνολα δεδομένων συνδέονται σαφώς με εμπορικά μοντέλα παραγωγής βίντεο που κυκλοφορούν στην αγορά.

Για παράδειγμα, εντόπισα 11.604 βίντεο από το επίσημο κανάλι των New York Times στο YouTube σε 11 διαφορετικά σύνολα δεδομένων στη βάση δεδομένων. Πάνω από 8.000 από αυτά τα βίντεο, ωστόσο, προέρχονταν από μία και μόνη πηγή δεδομένων εκπαίδευσης –το Runway Gen-3. Το συγκεκριμένο σύνολο δεδομένων, που συγκεντρώθηκε από τη Runway, μια εταιρεία που έχει λάβει υποστήριξη από τις Salesforce, Google και Nvidia, δημιουργήθηκε με σκοπό να εκπαιδεύσει το σημαντικότερο μοντέλο της για τη δημιουργία βίντεο. Όταν το Gen-3 κυκλοφόρησε τον Ιούνιο του 2024, έλαβε διθυραμβικές κριτικές και συγκρίθηκε με προηγούμενες εκδόσεις των μοντέλων Sora της OpenAI και Veo της Google. Νωρίτερα φέτος, η αξία της Runway αποτιμήθηκε στα 3 δισεκατομμύρια δολάρια.

Ανάμεσα στα χιλιάδες βίντεο από τους New York Times στο Runway Gen-3, υπάρχει ένα ντοκιμαντέρ για τη δολοφονία του Τζον Κένεντι, μια έρευνα με οπτικό υλικό για τις διαδηλώσεις υπέρ της δημοκρατίας στο Χονγκ Κονγκ, μια συνέντευξη με τον Μπαράκ Ομπάμα και μια στήλη γνώμης για τις ρωσικές επιχειρήσεις επηρεασμού της πληροφόρησης. Άλλα 382 βίντεο προέρχονται από το κανάλι NYT Cooking στο YouTube, και συμπεριλαμβάνουν συνταγές που έγιναν viral, οδηγούς παρασκευής αρτοσκευασμάτων και σύντομα ντοκιμαντέρ για το φαγητό δρόμου. (Με την επιφύλαξη ότι η Runway ενδέχεται να παρέλειψε ορισμένα βίντεο όταν τελικά εκπαίδευσε το Gen-3).

Ένα εσωτερικό υπολογιστικό φύλλο της Runway που δημοσιεύθηκε από την 404 Media πέρυσι δίνει κάποιες πληροφορίες σχετικά με το γιατί επιλέχθηκαν βίντεο στο YouTube από ειδησεογραφικές επιχειρήσεις. Το υπολογιστικό φύλλο, με τίτλο «Video sourcing – Jupiter» (που παραπέμπει στην κωδική ονομασία του Gen-3), απαριθμεί χιλιάδες κανάλια που χαρακτηρίστηκαν από την εταιρεία ως υψηλής ποιότητας.

Στο έγγραφο, 27.000 βίντεο από το κανάλι της Wall Street Journal στο YouTube είχαν την ένδειξη: «πολλά γραφικά, ανασκοπήσεις, “επιδείξεις”». Από το CNET, 22.000 βίντεο περιγράφηκαν ως «κριτικές τεχνολογίας» και επισημάνθηκαν με τη φράση-κλειδί «χρήση φορητού υπολογιστή». Από την Washington Post, 21.000 βίντεο χαρακτηρίστηκαν ως «πολλά ειδησεογραφικά, αλλά πολλά συμπληρωματικά πλάνα». Άλλα 35.000 βίντεο από το Good Morning America χαρακτηρίστηκαν ως «γαργάρα» (gargling), όρος της ΤΝ που σημαίνει ότι ένα μοντέλο μιμείται επιφανειακά κάτι από την εκπαίδευσή του χωρίς βαθύτερη «κατανόηση».

Από το επίσημο κανάλι των New York Times στο YouTube, τα βίντεο παρατίθενται με την περιγραφή «βίντεο των nyt, op docs, συμπληρωματικά πλάνα, μπλα μπλα, ανθρώπινα υποκείμενα». Εκατοντάδες βίντεο μαγειρικής των NYT Cooking είχαν επισημανθεί με τη λέξη-κλειδί «αυγά ομελέτα». Αυτές οι διατυπώσεις δίνουν κάποια ένδειξη για την οπτική διάλεκτο –ή ακόμη και για συγκεκριμένες ενέργειες– που εκπαιδεύτηκε το Gen-3 να μιμείται.

Μετά την κυκλοφορία του μοντέλου, μεγάλα στούντιο του Χόλιγουντ άρχισαν να εντάσσουν τα προϊόντα της Runway σε ταινίες, τηλεοπτικές εκπομπές και διαφημιστικές παραγωγές. Σύμφωνα με μια έκθεση του Bloomberg που δημοσιεύτηκε αυτό το καλοκαίρι, το Netflix χρησιμοποιεί ήδη τα εργαλεία της Runway στην «παραγωγή περιεχομένου» του και η Walt Disney Co. δοκιμάζει παρομοίως το λογισμικό της.

Εν τω μεταξύ, δεν έχει ανακοινωθεί καμία συμφωνία αδειοδότησης μεταξύ της Runway και των πολλών ειδησεογραφικών επιχειρήσεων των οποίων το έργο περιλαμβάνεται στο σύνολο δεδομένων, όπως η Washington Post, η Vox Media, το BBC και οι New York Times. Η Runway δεν απάντησε στο αίτημα για σχολιασμό.

«Οι New York Times δεν έχουν εγκρίνει τη χρήση των βίντεο που δημοσιεύουν στο YouTube για σκοπούς εκπαίδευσης της τεχνητής νοημοσύνης από οποιονδήποτε τρίτο. Ως ιδιοκτήτης αυτών των έργων, οι New York Times έχουν το αποκλειστικό νομικό δικαίωμα να αποφασίζουν πώς και πού χρησιμοποιείται το περιεχόμενό μας –και το παρακολουθούμε στενά», δήλωσε εκπρόσωπος των New York Times, οι οποίοι επί του παρόντος έχουν προσφύγει εναντίον της OpenAI και της Microsoft επειδή οι συγκεκριμένες εταιρείες φέρονται να χρησιμοποίησαν τα άρθρα τους για την εκπαίδευση του ChatGPT χωρίς άδεια. «Θα συνεχίσουμε να διερευνούμε ενεργά κάθε παραβίαση της πολύτιμης πνευματικής μας ιδιοκτησίας και θα διεκδικούμε τα δικαιώματά μας αναλόγως».

Δεν έχουν όλα τα σύνολα δεδομένων εκπαίδευσης στη βάση δεδομένων του The Atlantic τόσο σαφή σύνδεση με εμπορικά προϊόντα βίντεο μέσω τεχνητής νοημοσύνης. Ορισμένα χρησιμοποιήθηκαν από τις ερευνητικές ομάδες μεγάλων εταιρειών τεχνητής νοημοσύνης, συμπεριλαμβανομένων των Meta, Snap, Tencent και Bytedance. Η εν λόγω χρήση είναι δημόσια επειδή οι ίδιοι οι εργαζόμενοι την κοινοποίησαν σε ερευνητικά άρθρα.

Για παράδειγμα, ένα σύνολο δεδομένων εκπαίδευσης με την ονομασία HD-VILA-100M συλλέχθηκε για πρώτη φορά από τη Microsoft Research Asia, το ερευνητικό εργαστήριο της εταιρείας με έδρα το Πεκίνο της Κίνας. Το The Atlantic ανέφερε ότι το HD-VILA-100M διατέθηκε για λήψη από ερευνητές της Microsoft και στη συνέχεια χρησιμοποιήθηκε από πολλές μεγάλες εταιρείες τεχνητής νοημοσύνης στη δική τους έρευνα και ανάπτυξη.

Η Meta χρησιμοποίησε το σύνολο δεδομένων για να αναπτύξει το σύστημα μετατροπής κειμένου σε βίντεο «Make-A-Video», το οποίο κυκλοφόρησε το 2022. Ένα ερευνητικό εργαστήριο της Tencent, του κινεζικού τεχνολογικού γίγαντα, χρησιμοποίησε το HD-VILA-100M για να δημιουργήσει ένα δημόσια διαθέσιμο σύνολο δεδομένων που θα μπορούσε να ανταγωνιστεί τα δεδομένα εκπαίδευσης που χρησιμοποιεί η OpenAI για το μοντέλο παραγωγής βίντεο Sora. Η Byetdance, ιδιοκτήτρια εταιρεία του TikTok, χρησιμοποίησε το μοντέλο για να εκπαιδεύσει το πειραματικό της μοντέλο μετατροπής κειμένου σε βίντεο MagicVideo. Η Snap, ιδιοκτήτρια εταιρεία του Snapchat, χρησιμοποίησε το μοντέλο για την έρευνα σχετικά με τη βελτίωση των λεζάντων βίντεο τεχνητής νοημοσύνης, των εργαλείων αναζήτησης βίντεο και της μετατροπής κειμένου σε βίντεο.

Το HD-VILA-100M, όπως διακινήθηκε στη βιομηχανία της τεχνητής νοημοσύνης επί σειρά ετών, περιείχε χιλιάδες βίντεο του YouTube που ανήκαν σε ειδησεογραφικές επιχειρήσεις. Αυτό περιλαμβάνει περισσότερα από 13.000 βίντεο που κατέβηκαν από τα κανάλια του Fox News στο YouTube, περίπου 6.300 από διάφορα κανάλια του DW και άλλα 5.520 από το αγγλόφωνο κανάλι του Al Jazeera, μεταξύ άλλων.

Ενώ η έρευνα με τη χρήση του HD-VILA-100M έχει προωθήσει την τεχνολογία παραγωγής βίντεο σε κάθε αντίστοιχη εταιρεία, είναι πιο δύσκολο να συνδέσει κανείς απευθείας τη χρήση του με οποιοδήποτε ιδιόκτητο μοντέλο ή λειτουργία.

Ομοίως, το YT-Temporal-180M είναι ένα σύνολο δεδομένων που συγκεντρώθηκε από ερευνητές του Πανεπιστημίου της Ουάσινγκτον και του Allen Institute for AI, ενός μη κερδοσκοπικού ερευνητικού οργανισμού. Το The Atlantic αναφέρει ότι το σύνολο δεδομένων φιλοξενείται σε διακομιστές του Google Cloud και είναι διαθέσιμο για λήψη μέσω του Hugging Face, μιας πλατφόρμας για την κοινή χρήση συνόλων δεδομένων και μοντέλων μηχανικής μάθησης. Το YT-Temporal-180M περιλαμβάνει περί τις 36.000 βίντεο από το Fox News, 34.000 βίντεο από το Bloomberg και περίπου 31.000 βίντεο από το ABC News, μεταξύ άλλων.

Από τότε που έγινε διαθέσιμο το 2021, το YT-Temporal-180M έχει μεταφορτωθεί από το Hugging Face περισσότερες από 1.450 φορές. Πολλά από τα σύνολα δεδομένων που εντοπίστηκαν και ελέγχθηκαν από το The Atlantic παραμένουν διαθέσιμα για λήψη στο Hugging Face για ελεύθερη χρήση για την εκπαίδευση μοντέλων.

Οι μεγάλες επιχειρήσεις των Μέσων δεν ήταν τα μόνα κανάλια που βρήκα στο YouTube με επίκεντρο τις ειδήσεις. Βίντεο από δημιουργούς ειδησεογραφικού περιεχομένου –ανεξάρτητα κανάλια που φιλοξενούν συγκεντρωτικές ειδήσεις, τοκ σόου, συνεντεύξεις και πολιτικό σχολιασμό– ήταν διάσπαρτα σε όλα τα σύνολα δεδομένων εκπαίδευσης και μερικές φορές ξεπερνούσαν αριθμητικά τα παραδοσιακά ειδησεογραφικά μέσα ενημέρωσης.

Βρήκα αρκετά από τα πιο δημοφιλή προοδευτικά ειδησεογραφικά κανάλια στο YouTube στα σύνολα δεδομένων εκπαίδευσης, μεταξύ των οποίων περισσότερα από 15.000 βίντεο από το The David Pakman Show, ένα τοκ σόου με περισσότερους από τρία εκατομμύρια συνδρομητές στο YouTube. Τα βίντεό του συμπεριλαμβάνονται, μεταξύ άλλων, τόσο στο HD-VILA-100M όσο και στο YT-Temporal-180M. Ο Ντέιβιντ Πάκμαν (David Pakman), ιδρυτής και οικοδεσπότης του προγράμματος, επιβεβαίωσε ότι δεν έχει λάβει κανένα αίτημα για χρήση των βίντεο αυτών για εκπαίδευση της τεχνητής νοημοσύνης.

«Καταλαβαίνω ότι η εκπαίδευση της τεχνητής νοημοσύνης συχνά περιλαμβάνει την επεξεργασία μεγάλων ποσοτήτων δημοσίως διαθέσιμων δεδομένων, και αυτό είναι κομμάτι της βελτίωσης αυτών των συστημάτων», μου είπε ο Πάκμαν. «Όταν η χρήση είναι τόσο συμπυκνωμένη –δηλαδή δεκάδες χιλιάδες βίντεο από έναν δημιουργό– μοιάζει λιγότερο με τυχαία συμπερίληψη και περισσότερο με μεγάλης κλίμακας εκμετάλλευση πνευματικής ιδιοκτησίας χωρίς συγκατάθεση».

Το Wired έχει παρουσιάσει στο παρελθόν τον τρόπο με τον οποίο οι υπότιτλοι από τα βίντεο του Πάκμαν χρησιμοποιήθηκαν για την εκπαίδευση γλωσσικών μοντέλων.

Πάνω από 11.000 βίντεο από την εκπομπή The Majority Report με τον Σαμ Σέντερ (Sam Seder), η οποία έχει σχεδόν δύο εκατομμύρια συνδρομητές στο YouTube, περιλαμβάνονταν επίσης στα σύνολα δεδομένων. Όταν μίλησα με τον Σέντερ, υπέθεσε ότι το κανάλι του προσφέρει στις εταιρείες τεχνητής νοημοσύνης μια «οπτική και διαλεκτική γλώσσα» που διαφέρει θεμελιωδώς από τις καθιερωμένες ειδησεογραφικές επιχειρήσεις. Αυτά τα χιλιάδες βίντεο από το The Majority Report περιλαμβάνουν μαγνητοσκοπημένες ζωντανές μεταδόσεις, εκπομπές με κλήσεις ακροατών και βίντεο αντιδράσεων, τα οποία καταλήγουν σε έναν πολιτικό σχολιασμό σε ραδιοφωνικό στιλ.

Αξίζει να σημειωθεί ότι ελάχιστοι από τους σημαντικότερους συντηρητικούς πολιτικούς σχολιαστές των ΗΠΑ στο YouTube περιλαμβάνονταν στα σύνολα δεδομένων. Για παράδειγμα, δεν υπήρχαν βίντεο από τον Στίβεν Κράουντερ (Steven Crowder) ή το The Rubin Report. Υπήρχαν 460 βίντεο από το κανάλι του Μπεν Σαπίρο (Ben Shapiro) στο YouTube, το οποίο έχει πάνω από επτά εκατομμύρια συνδρομητές.

Σύμφωνα με τους κανόνες του YouTube, όταν ένας δημιουργός ανεβάζει ένα πρωτότυπο βίντεο, διατηρεί αυτόματα τα πνευματικά δικαιώματα. Τούτου λεχθέντος, το YouTube έχει τη δυνατότητα να χρησιμοποιεί το περιεχόμενο για τους δικούς του σκοπούς εκπαίδευσης τεχνητής νοημοσύνης. Νωρίτερα φέτος, το CNBC ανέφερε ότι το YouTube χρησιμοποίησε ένα υποσύνολο βίντεο στην πλατφόρμα του για να εκπαιδεύσει τα μοντέλα Gemini και Veo 3 της Google. Αυτή η παραχώρηση δεν επεκτείνεται σε τρίτους.

Οι ειδησεογραφικές εκδόσεις και οι δημιουργοί ειδησεογραφικού περιεχομένου δεν χρειάζεται να καταχωρίσουν τα βίντεό τους στο YouTube στο Γραφείο Πνευματικών Δικαιωμάτων των ΗΠΑ (USCO) για να έχουν έγκυρη αξίωση πνευματικών δικαιωμάτων. Μολαταύτα, η καταχώριση βίντεο με την υποβολή αίτησης και την καταβολή τέλους καταχώρησης συνεπάγεται νομικά οφέλη, όπως η δυνατότητα μήνυσης για παραβίαση πνευματικών δικαιωμάτων.

Οι New York Times δήλωσαν ότι «καταχωρίζουν την έντυπη έκδοση και την ιστοσελίδα τους σε συνεχή βάση στο Γραφείο Πνευματικών Δικαιωμάτων των ΗΠΑ, συμπεριλαμβανομένου όλου του υποκείμενου περιεχομένου». Σε πολλές περιπτώσεις, τα βίντεο των New York Times στο YouTube που βασίζονται σε έντυπα ή διαδικτυακά άρθρα που έχουν ήδη καταχωριστεί στο USCO θα μπορούσαν να θεωρηθούν «παράγωγα έργα» και να καλύπτονται από τις ίδιες καταχωρίσεις.

«Η χρήση περιεχομένου από δημιουργούς, όπως οι New York Times, χωρίς άδεια παραβιάζει τον νόμο και θα βλάψει σοβαρά την αγορά του πρωτότυπου, ανεξάρτητου ρεπορτάζ, κάτι που θα περιορίσει τη δυνατότητα των ανθρώπων να λένε σημαντικές ιστορίες, με συνέπεια το κοινό να ενημερώνεται λιγότερο», μου είπε εκπρόσωπος των New York Times. «Οι New York Times πιστεύουν ότι η μελλοντική επιτυχία αυτής της τεχνολογίας δεν πρέπει να λειτουργήσει εις βάρος των δημοσιογραφικών θεσμών».

Ο Σέντερ, εν τω μεταξύ, δήλωσε ότι κανένα από τα βίντεο του καναλιού The Majority Report –που συχνά ανεβάζει πέντε βίντεο την ημέρα– δεν είναι καταχωρημένο στo USCO. Όπως λέει ο ίδιος, απλώς «δεν βγαίνει» για να καλύψει τα τέλη καταχώρησης και να προσλάβει νομικό σύμβουλο, ειδικά όταν έχει να αντιμετωπίσει μερικές από τις μεγαλύτερες εταιρείες στον κόσμο.

Δεν έχει πρόβλημα να χρησιμοποιούν άλλοι δημιουργοί αποσπάσματα από τα βίντεό του χωρίς άδεια, σε έναν βαθμό. Εξάλλου, τα βίντεο αντίδρασης αποτελούν καύσιμη ύλη για τους δημιουργούς ειδησεογραφικού περιεχομένου σε όλο το YouTube.

«Ο κόσμος χρησιμοποιεί το περιεχόμενό μου συνεχώς, αλλά προσθέτει σχόλια σε αυτό, και είναι μέρος μιας συζήτησης, και είναι ανοιχτό –αυτό είναι μέρος του οικοσυστήματος», δήλωσε ο Σέντερ. Βλέπει, ωστόσο, με άλλο μάτι τη μαζική μεταφόρτωση του περιεχομένου καναλιού του για την εκπαίδευση της τεχνητής νοημοσύνης. «Αυτό που κάνουν αυτές οι [εταιρείες τεχνητής νοημοσύνης] είναι θεμελιωδώς διαφορετικό. Δεν υπάρχει αμοιβαιότητα· είναι μόνο εκμετάλλευση».