OpenAI bị kiện vì “ăn cắp” sách bất hợp pháp

Thứ Sáu, 14/07/2023 05:56

Hai tác giả Mona Awad và Paul Tremblay mới đây đã đưa ra một thông cáo về việc tác phẩm đã được bảo hộ bản quyền của họ đang được sử dụng một cách trái pháp luật để đào tạo cho ứng dụng ChatGPT, vì chatbot đã tạo ra các “bản tóm tắt tương đối chính xác” về các cuốn này.

Đã được đệ trình vào cuối tháng 6, vụ kiện lần này chính là ví dụ mới nhất về sự căng thẳng trong việc công cụ ứng dụng AI (trí tuệ nhân tạo) có khả năng tạo ra văn bản và hình ảnh chỉ trong vài giây theo các yêu cầu đến từ người dùng, bằng việc đã được đào tạo rất lâu từ trước. Rất nhiều cá nhân trong ngành sáng tạo ngày càng quan tâm đến việc công nghệ phát triển ở mức độ nhanh có thể ảnh hưởng thế nào đối với nghề nghiệp và sinh kế của bản thân họ.

Đây là vụ kiện đầu tiên chống lại ChatGPT liên quan đến bản quyền, theo nguồn tin từ Andres Guadamuz, một học giả về luật sở hữu trí tuệ tại Đại học Sussex. Ông cho biết thêm, vụ kiện có thể mở ra các “đường biên giới mang tính hợp pháp” của AI trong thời gian tới.

Với trường hợp trên, sách là một đối tượng tương đối lí tưởng trong việc đào tạo các mô hình học máy, bởi chúng sở hữu đặc trưng như có “dung lượng dài, chất lượng cao và đã qua khâu biên tập”. Luật sư của hai tác giả cũng nói thêm rằng “đó là một nguồn đầu vào vô cùng chất lượng cho việc đào tạo các cỗ máy học theo ý tưởng của chính chúng ta”.

Khiếu nại nói rằng OpenAI đã thu lợi nhuận một cách “không công bằng” từ “các bài viết cũng như ý tưởng đã bị đánh cắp”. Cả hai nhà văn thay mặt cho các tác giả ở Hoa Kì có tác phẩm bị cáo buộc sử dụng để đào tạo ChatGPT, phản đối cũng như kêu gọi bồi thường thiệt hại bằng tiền. Saveri và Butterick – luật sư đại diện của hai nhà văn cho biết, mặc dù các tác giả được “bảo vệ pháp lí rất tốt”, nhưng họ đang phải đối mặt với các công ti “như OpenAI - những người hành xử như thể luật pháp đã loại trừ họ”.

Hai tác giả Mona Awad và Paul Tremblay thay mặt cho các nhà văn giành lại công bằng từ AI.

Tuy nhiên có thể sẽ khó chứng minh rằng các tác giả đã chịu tổn thất tài chính cụ thể ra sao do ChatGPT đã được đào tạo, ngay cả khi điều sau đó hóa ra là đúng. Guadamuz cho biết, ChatGPT sẽ mãi hoạt động “giống hệt như cũ” nếu như không được đào tạo ngày này thông qua ngày khác bằng các cuốn sách liên tục thay mới, và có thực tế là ngoài sách vở đã được xuất bản, thì nó cũng dựa trên vô số thông tin trên Internet, chẳng hạn như việc bàn luận của các độc giả xung quanh cuốn sách.

Saveri và Butterick cho biết OpenAI đã trở nên “ngày càng bí mật” về việc công bố dữ liệu đào tạo. Trong các bài báo đã được phát hành cùng lúc với lần huấn luyện đầu tiên của ChatGPT, OpenAI đã từng công bố về nguồn dữ liệu mà mình sử dụng trên Internet, nhưng họ chỉ gọi một cách chung chung đó là “Books2”. Các luật sư đã suy luận rằng kích thước của tập dữ liệu ước tính chứa khoảng 294.000 đầu sách, và nó có nghĩa là sách chỉ có thể được lấy từ các thư viện hoạt động theo kiểu bất hợp pháp như Library Genesis (LibGen) và Z-Library, qua đó nguồn đầu vào này có thể được bảo mật hàng loạt thông qua hệ thống torrent.

Lilian Edwards, giáo sư ngành Luật, Đổi mới và Xã hội tại Đại học Newcastle thì lại cho rằng trường hợp kiện tụng như đã nêu trên “có thể sẽ phụ thuộc vào việc tòa án xem việc sử dụng tài liệu đã có bản quyền theo cách mà công ti công nghệ này làm là ‘sử dụng hợp pháp’ hay chỉ đơn giản là ‘sao chép trái phép’”. Edwards và Guadamuz đều nhấn mạnh rằng một vụ kiện tương tự được đưa ra ở Vương quốc Anh sẽ không được quyết định theo cùng một cách vì đất nước này không có hệ thống điều khoản luật pháp tương tự.

Các công nghệ mới đã khiến nhà văn e ngại cho sự nghiệp và sinh kế của mình.

Edwards cho biết chính phủ Vương quốc Anh đã “quan tâm hơn đến việc thúc đẩy một ngoại lệ đối với bản quyền, khi cho phép sử dụng tài liệu miễn phí để khai thác văn bản và dữ liệu, thậm chí cho các mục đích thương mại,” nhưng cải cách này đã “bị tạm hoãn” sau khi các tác giả, nhà xuất bản và các nghệ sĩ trong ngành công nghiệp âm nhạc lên tiếng phản đối.

Theo đó kể từ khi ChatGPT được ra mắt vào tháng 11 năm 2022, ngành xuất bản cũng đã thảo luận về cách bảo vệ tác giả khỏi những tác hại tiềm ẩn của công nghệ AI. Tháng trước, Hiệp hội Tác giả Mỹ (SoA) cũng đã công bố “các bước dành cho thành viên của hiệp hội này” để “bảo vệ” bản thân và các sáng tạo khỏi bị lạm dụng.

Hiệp hội tác giả cũng cho xuất bản một bức thư ngỏ vào tuần trước kêu gọi giám đốc điều hành của các công ti Big Tech và AI tiến hành “xin phép” nhà văn trong việc sử dụng tác phẩm đã có bản quyền trong việc đào tạo chương trình AI. Nó cũng kèm theo yêu cầu “bồi thường cho người sáng tạo một cách công bằng.” Đại diện của SoA cũng tiết lộ rằng thư ngỏ của họ đã thu được hơn 2.000 chữ kí.

Richard Combes, người đứng đầu về quyền và cấp phép tại Hiệp hội cấp phép sáng tạo (ALCS), cho biết quy định hiện hành về AI là “phân mảnh và không nhất quán giữa các khu vực pháp lí khác nhau. Tuy vậy nó đang cố gắng và được cải thiện để theo kịp với sự phát triển của công nghệ này”. Ông khuyến khích các nhà hoạch định chính sách tham khảo các nguyên tắc mà ALCS đã soạn thảo nhằm “bảo vệ giá trị đích thực mà quyền tác giả mang lại cho cuộc sống của chúng ta, đặc biệt là trong trường hợp của Vương quốc Anh”.

Saveri và Butterick tin rằng AI cuối cùng sẽ giống như “những gì xảy ra với nhạc kĩ thuật số, TV và phim ảnh” trong việc tuân thủ theo luật bản quyền. “Chúng sẽ dựa trên dữ liệu đã được cấp phép, với thông tin nguồn sẽ được công khai.” Các luật sư cũng lưu ý rằng thật “mỉa mai” khi “cái gọi là công cụ ‘trí tuệ nhân tạo’ lại toàn dựa vào dữ liệu do con người tạo ra. “Hệ thống của chúng phụ thuộc hoàn toàn vào sự sáng tạo của con người, vì vậy nếu người đứng đầu các công nghệ này khiến cho những người chuyên về sáng tạo cảm thấy nản lòng, thì bản thân họ cũng sớm phá sản”.

Daniel Gervais, giáo sư luật tại Đại học Vanderbilt, nói với Insider rằng vụ kiện của các nhà văn là một trong số ít các vụ kiện bản quyền chống lại công cụ AI trên toàn thế giới. Nhưng nó cũng sẽ không phải lần cuối. Ông cũng tin rằng sắp sửa xảy ra vô số thách thức pháp lí nhắm vào đầu ra của các công cụ như ChatGPT trên toàn cầu.

NGÔ MINH dịch theo The Guardian và Insider

VNQD
Thống kê
Bài đọc nhiều nhất
Bóng thầm mà rực rỡ trên mỗi trang văn

Bóng thầm mà rực rỡ trên mỗi trang văn

Sau những giờ lên lớp về lí thuyết, các ông chia nhau mỗi người kèm mấy học viên sáng tác... (CHÂU LA VIỆT) 

Anh Tựu trong "Vượt lũ"

Anh Tựu trong "Vượt lũ"

Anh Tựu của chúng tôi, ngoài đời là Thầy thuốc Ưu tú, tiến sĩ, dược sĩ chuyên khoa II Trần Tựu... (KIỀU BÍCH HẬU)

Giọt nước mắt mang hình vết thương

Giọt nước mắt mang hình vết thương

Cứ chiều chiều bà xay bột, tối tráng bánh rồi phơi, phơi đến khô thì mang ra chợ, vừa quạt than nướng vừa bán... (VŨ THANH LỊCH)

Tiếng chim bắt cô trói cột

Tiếng chim bắt cô trói cột

Chẳng biết bắt đầu từ đâu, nhưng trong kí ức của một đứa trẻ đôi lần lên núi kiếm củi, bứt lá rừng về lót chuồng cho lợn cho bò, thi thoảng gặp bụi sim chín ửng… thì núi sau lưng làng tôi được bắt đầu từ mé sông... (HỒ MINH TÂM)