生成式人工智慧(AI)訓練資料版權戰火再度擴大。蘋果(Apple)、亞馬遜(Amazon)與OpenAI遭多名YouTube創作者提起集體訴訟,指控其涉嫌繞過YouTube的技術保護措施,大規模爬取平台影片以訓練自家的影音AI模型。本案焦點直指美國《數位千禧年著作權法》(DMCA)中的「反規避條款」,恐衝擊未來AI影片生成的資料來源。
綜合媒體報導,包括TED在內的多個YouTube頻道已向美國法院遞交訴狀。原告指出,核心證據源自蘋果先前公開的技術論文,文中提及使用名為「Panda-70M」的大型資料集進行訓練。
Panda-70M是一套由約380萬支YouTube影片拆解而成、包含超過7,000萬個片段的大型資料集。原告主張,該系統雖表面上看似索引,但實際上每次擷取片段都必須重新存取YouTube原始影片並規避技術限制進行下載。訴訟文件顯示,TED有高達438部影片遭系統性納入訓練,Golfholics也有62部影片中招,顯示創作者的數位資產已被大規模且未經授權地挪用。
原告要求法院認定此案為集體訴訟,並請求法官判定蘋果、亞馬遜與OpenAI為「故意侵權」,爭取法定最高額賠償及律師費。此外,創作者更進一步要求法院頒布永久禁制令,禁止被告持續使用相關影片內容進行訓練。
此案並非孤立事件,相同原告近期也對Meta、輝達(NVIDIA)及字節跳動(ByteDance)提出類似訴訟。這代表AI版權爭議正從文字、圖片快速延伸至影音領域。若法院最終支持創作者,科技公司未來將更難以「公開可見」為由規避授權,勢必得重新建立合法的資料取得流程。
