OpenAI bị kiện vì “ăn cắp” sách bất hợp pháp

Thứ Sáu, 14/07/2023 05:56

Hai tác giả Mona Awad và Paul Tremblay mới đây đã đưa ra một thông cáo về việc tác phẩm đã được bảo hộ bản quyền của họ đang được sử dụng một cách trái pháp luật để đào tạo cho ứng dụng ChatGPT, vì chatbot đã tạo ra các “bản tóm tắt tương đối chính xác” về các cuốn này.

Đã được đệ trình vào cuối tháng 6, vụ kiện lần này chính là ví dụ mới nhất về sự căng thẳng trong việc công cụ ứng dụng AI (trí tuệ nhân tạo) có khả năng tạo ra văn bản và hình ảnh chỉ trong vài giây theo các yêu cầu đến từ người dùng, bằng việc đã được đào tạo rất lâu từ trước. Rất nhiều cá nhân trong ngành sáng tạo ngày càng quan tâm đến việc công nghệ phát triển ở mức độ nhanh có thể ảnh hưởng thế nào đối với nghề nghiệp và sinh kế của bản thân họ.

Đây là vụ kiện đầu tiên chống lại ChatGPT liên quan đến bản quyền, theo nguồn tin từ Andres Guadamuz, một học giả về luật sở hữu trí tuệ tại Đại học Sussex. Ông cho biết thêm, vụ kiện có thể mở ra các “đường biên giới mang tính hợp pháp” của AI trong thời gian tới.

Với trường hợp trên, sách là một đối tượng tương đối lí tưởng trong việc đào tạo các mô hình học máy, bởi chúng sở hữu đặc trưng như có “dung lượng dài, chất lượng cao và đã qua khâu biên tập”. Luật sư của hai tác giả cũng nói thêm rằng “đó là một nguồn đầu vào vô cùng chất lượng cho việc đào tạo các cỗ máy học theo ý tưởng của chính chúng ta”.

Khiếu nại nói rằng OpenAI đã thu lợi nhuận một cách “không công bằng” từ “các bài viết cũng như ý tưởng đã bị đánh cắp”. Cả hai nhà văn thay mặt cho các tác giả ở Hoa Kì có tác phẩm bị cáo buộc sử dụng để đào tạo ChatGPT, phản đối cũng như kêu gọi bồi thường thiệt hại bằng tiền. Saveri và Butterick – luật sư đại diện của hai nhà văn cho biết, mặc dù các tác giả được “bảo vệ pháp lí rất tốt”, nhưng họ đang phải đối mặt với các công ti “như OpenAI - những người hành xử như thể luật pháp đã loại trừ họ”.

Hai tác giả Mona Awad và Paul Tremblay thay mặt cho các nhà văn giành lại công bằng từ AI.

Tuy nhiên có thể sẽ khó chứng minh rằng các tác giả đã chịu tổn thất tài chính cụ thể ra sao do ChatGPT đã được đào tạo, ngay cả khi điều sau đó hóa ra là đúng. Guadamuz cho biết, ChatGPT sẽ mãi hoạt động “giống hệt như cũ” nếu như không được đào tạo ngày này thông qua ngày khác bằng các cuốn sách liên tục thay mới, và có thực tế là ngoài sách vở đã được xuất bản, thì nó cũng dựa trên vô số thông tin trên Internet, chẳng hạn như việc bàn luận của các độc giả xung quanh cuốn sách.

Saveri và Butterick cho biết OpenAI đã trở nên “ngày càng bí mật” về việc công bố dữ liệu đào tạo. Trong các bài báo đã được phát hành cùng lúc với lần huấn luyện đầu tiên của ChatGPT, OpenAI đã từng công bố về nguồn dữ liệu mà mình sử dụng trên Internet, nhưng họ chỉ gọi một cách chung chung đó là “Books2”. Các luật sư đã suy luận rằng kích thước của tập dữ liệu ước tính chứa khoảng 294.000 đầu sách, và nó có nghĩa là sách chỉ có thể được lấy từ các thư viện hoạt động theo kiểu bất hợp pháp như Library Genesis (LibGen) và Z-Library, qua đó nguồn đầu vào này có thể được bảo mật hàng loạt thông qua hệ thống torrent.

Lilian Edwards, giáo sư ngành Luật, Đổi mới và Xã hội tại Đại học Newcastle thì lại cho rằng trường hợp kiện tụng như đã nêu trên “có thể sẽ phụ thuộc vào việc tòa án xem việc sử dụng tài liệu đã có bản quyền theo cách mà công ti công nghệ này làm là ‘sử dụng hợp pháp’ hay chỉ đơn giản là ‘sao chép trái phép’”. Edwards và Guadamuz đều nhấn mạnh rằng một vụ kiện tương tự được đưa ra ở Vương quốc Anh sẽ không được quyết định theo cùng một cách vì đất nước này không có hệ thống điều khoản luật pháp tương tự.

Các công nghệ mới đã khiến nhà văn e ngại cho sự nghiệp và sinh kế của mình.

Edwards cho biết chính phủ Vương quốc Anh đã “quan tâm hơn đến việc thúc đẩy một ngoại lệ đối với bản quyền, khi cho phép sử dụng tài liệu miễn phí để khai thác văn bản và dữ liệu, thậm chí cho các mục đích thương mại,” nhưng cải cách này đã “bị tạm hoãn” sau khi các tác giả, nhà xuất bản và các nghệ sĩ trong ngành công nghiệp âm nhạc lên tiếng phản đối.

Theo đó kể từ khi ChatGPT được ra mắt vào tháng 11 năm 2022, ngành xuất bản cũng đã thảo luận về cách bảo vệ tác giả khỏi những tác hại tiềm ẩn của công nghệ AI. Tháng trước, Hiệp hội Tác giả Mỹ (SoA) cũng đã công bố “các bước dành cho thành viên của hiệp hội này” để “bảo vệ” bản thân và các sáng tạo khỏi bị lạm dụng.

Hiệp hội tác giả cũng cho xuất bản một bức thư ngỏ vào tuần trước kêu gọi giám đốc điều hành của các công ti Big Tech và AI tiến hành “xin phép” nhà văn trong việc sử dụng tác phẩm đã có bản quyền trong việc đào tạo chương trình AI. Nó cũng kèm theo yêu cầu “bồi thường cho người sáng tạo một cách công bằng.” Đại diện của SoA cũng tiết lộ rằng thư ngỏ của họ đã thu được hơn 2.000 chữ kí.

Richard Combes, người đứng đầu về quyền và cấp phép tại Hiệp hội cấp phép sáng tạo (ALCS), cho biết quy định hiện hành về AI là “phân mảnh và không nhất quán giữa các khu vực pháp lí khác nhau. Tuy vậy nó đang cố gắng và được cải thiện để theo kịp với sự phát triển của công nghệ này”. Ông khuyến khích các nhà hoạch định chính sách tham khảo các nguyên tắc mà ALCS đã soạn thảo nhằm “bảo vệ giá trị đích thực mà quyền tác giả mang lại cho cuộc sống của chúng ta, đặc biệt là trong trường hợp của Vương quốc Anh”.

Saveri và Butterick tin rằng AI cuối cùng sẽ giống như “những gì xảy ra với nhạc kĩ thuật số, TV và phim ảnh” trong việc tuân thủ theo luật bản quyền. “Chúng sẽ dựa trên dữ liệu đã được cấp phép, với thông tin nguồn sẽ được công khai.” Các luật sư cũng lưu ý rằng thật “mỉa mai” khi “cái gọi là công cụ ‘trí tuệ nhân tạo’ lại toàn dựa vào dữ liệu do con người tạo ra. “Hệ thống của chúng phụ thuộc hoàn toàn vào sự sáng tạo của con người, vì vậy nếu người đứng đầu các công nghệ này khiến cho những người chuyên về sáng tạo cảm thấy nản lòng, thì bản thân họ cũng sớm phá sản”.

Daniel Gervais, giáo sư luật tại Đại học Vanderbilt, nói với Insider rằng vụ kiện của các nhà văn là một trong số ít các vụ kiện bản quyền chống lại công cụ AI trên toàn thế giới. Nhưng nó cũng sẽ không phải lần cuối. Ông cũng tin rằng sắp sửa xảy ra vô số thách thức pháp lí nhắm vào đầu ra của các công cụ như ChatGPT trên toàn cầu.

NGÔ MINH dịch theo The Guardian và Insider

Tin tức khác

Bài đọc nhiều nhất

Ống kính nhà văn

Vẻ đẹp nguyên bản nơi bãi đá Móng Rồng

Nơi biển xanh vỗ về đá cuội

Mùa xanh Tam Cốc

Lẫm liệt Hải Vân quan

Những cái tên mang thân phận người của "Gió vẫn thổi qua rừng nhiệt đới"

Từ những đường dây lừa đảo xuyên biên giới, từ những căn phòng trọ ám mùi dây thừng và điện thoại bị tắt nguồn…, tôi muốn bạn đọc bước vào thế giới lạnh lẽo và dữ dội của thời đại dữ liệu,... (DƯƠNG BÌNH NGUYÊN)

Khi tác giả là nguyên mẫu

Trong thời gian này tôi cùng trung đội ở trên chốt rất gần địch. Trận địa tôi chỉ cách khu nhà hòa hợp chừng 1 cây số... (NGUYỄN TRỌNG LUÂN)

Những người tôi gặp, những chuyện tôi viết

Tôi từng hình dung viết văn là công việc của sự hư cấu, một hành trình phác dựng thế giới từ trí tưởng tượng, nơi nhà văn tự do tạo hình mọi thứ theo ý mình... (TRẦN THỊ TÚ NGỌC)