法院認證七法爬的是33萬筆資料,且資料庫中全部都來自法源的內容。(翻攝自法源法律網)
鏡週刊 2025.07.07 05:40 臺北時間

爬蟲盜資料重判2/法源33萬筆法規資料建置具原創性 七法爬蟲重判無關新創

記者|鏡週刊

七法遭重判引起各界震驚,但法官在判決中以嚴厲口氣指出,郭榮彥與謝復雅均受高等教育,郭榮彥更是律師,但在審理中「絲毫未見其對爬取競爭對手資料有任何『愧疚』或『良心不安』之處,也從未向法源公司道歉」,有人直覺反應「只是抓幾條法規沿革,有必要判4年嗎?」不過,如果詳讀判決書就會發現,法院所認定的「抓資料」,不是少量片段式引用,而是33萬筆完整、結構化包含命名邏輯、分類結構與附檔的完整資料庫內容。

簡單說,這不是抓一點法條,是搬了整個法規資料的骨架與肉。這也是法院判定七法成立侵害著作權與無故取得電磁紀錄罪的核心依據。律師王銘裕點出核心問題表示,法院認證七法爬的是33萬筆,不是幾條法規?是外界誤會案件本質。判決第46頁清楚列出計算方式:法規沿革:98,068筆;法規內容:102,520筆;法規附件:130,936筆;合計共331,524筆資料,為七法資料庫中全部來自法源的內容。

這不是一個模糊數字,而是法院根據「扣案光碟內容加上七法開發人員簽名確認」做出的認定。法院為什麼要強調「筆數」?王銘裕指出,因為在法律上,侵害著作權與無故取得電磁紀錄的構成要件之一,是「是否為實質重製」與「是否破壞資料的控制與支配性」。

其中侵害著作權的部分是「法規沿革」,共98,068 篇;而侵害法源公司對於電磁紀錄獨有支配權的部分更是包括「法規沿革」「法規內容」及「法規附件」共331,524筆。

法院審理時,根據七法開發者(謝復雅)在偵查中承認「我沒有去爬政府網站,因為政府網站不一定保留歷史版本,但法源會保留,而且格式一致,一個站就夠了。」法院因此認為,七法非但不是「參考法源」,而是「幾乎全站性重製」。

此外,法院認為這些不只是文字,而是完整結構資料庫,因為法源整理過的檔案具有創作性、且與別人表達不同的「法規沿革」。內容不但是法源獨有,甚至政府網站都查不到的「法規內容」與「法規附件」。

法院在判決中提及,這些資料被完整使用於七法的商業資料庫中,並以訂閱制提供企業與個人使用。這種資料規模與應用方式,讓法院不再以「片段取用」來看待,而是視為一套資料庫的重建與再商業化。

王銘裕說,當七法選擇使用爬蟲程式連續取得資料、整批儲存充為自己的資料庫內容進行販售,法院認為這已超越使用界線,而進入資料控制權的侵害。更別說七法開發者與負責人都具備技術背景與法律專業,法院強調:「不是不知道,而是知道還做。」

全案凸顯不是「抓幾條資料也會被告」的問題,而是「當你知道這些資料不是自己建立的,知道對方禁止你抓,知道你們是競業,卻選擇一次打包全部內容,甚至可能連資料格式、欄位命名與結構分類都未加變化,法院怎麼可能視為合理使用?」七法在此案中,並不是輸在創新,而是輸在過度簡化資料倫理與取得邊界的判斷,法院在判決是用了最直接的方式告訴七法,「這不是幾筆資料的事,是一座資料庫的事,而你不能這麼做!」

律師連思藩也說,不少輿論把這場官司包裝成「傳統 vs. 新創」、「公共財 vs. 法律保護」之爭,但從完整判決內容來看,這起案件其實是被告利用爬蟲程式爬取競業資料庫內容充為自身內容,再回頭與競業低價競爭,根本與「新創」「AI」議題全然無關。

連思藩說,這起案件的爭議仍未落幕,但從一審判決來看,法院給出的訊息並不複雜,亦即在法規逐步數位化的時代,對資料的取得方式、誠信態度與授權理解,可能比用什麼技術更重要。

至於七法案是否真的構成著作權侵害及刑法第359條妨害電腦使用罪,仍有上訴空間;但從判決全文中,可以看出一場原本可以以合約協商解決的商業糾紛,為何演變成刑罰重判的導火線。本案與AI發展其實無關,而是被告的誠信與態度,才是法院真正做出判斷的主因。

不過,本刊調查,法院不但認定七法爬蟲抓取的「法規沿革」具有著作權,還揭露法源的「法規沿革」不是原封不動抄政府網站的原始資料,而是靠資料部門人工選擇、編寫、修訂、甚至回頭改寫,總計高達535,665次而形成了98,068「整篇」為「語文編輯著作」的法規沿革,這一連串鍵盤聲,成了法院認定其具有「創作性」的一大關鍵,也是七法敗訴理由。

相關文章

爬蟲盜資料重判1/法官痛批毫無愧疚 教七法做人基本道理「賺錢靠自己,不要從競爭同業爬資料」

爬蟲程式剽竊法源資料庫 七法創辦人重判4年賠1億

爬蟲盜資料重判/七法當庭坦承法源資料完整才去爬 「法學版Google」遭重判揭密

即時新聞