立即捐款

Anthropic 狀告美國政府能修正 AI 傷害人類的風險嗎?

Anthropic 狀告美國政府能修正 AI 傷害人類的風險嗎?

Anthropic CEO阿莫迪Dario Amodei

人工智能巨頭 Anthropic 於上周(3月9日)入稟加州法院,控告美國政府侵犯其憲法權利,除了要求法院禁制美國政府針對公司所頒佈的禁令以維護其商業利益外,還翻起近年 AI 戰爭工具對人類造成的傷害的討論。該公司於三十多份法庭文件中,再三捍衛其㡳線,即AI模型 Claude 不得於戰爭中啟自動模及對美國公民進行大規模監控,並提出要以「人工智能構成原則」(Constitutional AI),讓 AI 模型修善,避免它受訓練者和扭曲的數據教壞,做出傷害人類建議和行為。

由於美軍向 Anthropic 頒佈禁令後,仍於伊朗戰爭中使用由 Claude 支援的系統策劃並發動空襲,並涉於戰爭首日誤炸學校,造成168名女孩死亡。這場訴訟或會進一步推動美國制訂全國性 AI 管治法律。

螢幕截圖 2026-03-17 上午9.18.31

Anthropic 與戰爭部的爭議

Anthropic 要求法院頒佈臨時禁制令,(一)禁制美國戰爭部長指令把 Anthropic 列為供應鏈風險,並禁止與軍方有業務往來的承包商和合作夥伴停止與 Anthropic 所有商業活動;(二)禁制總統特朗普指令,禁止聯邦機構與 Anthropic 合作;(三)禁制聯邦機構主管執行相關指令。Anthropic 指,相關的指令侵犯了 Anthropic 依據憲法第一修正案所享有的權利及正當程序權利,捐害其聲譽,破壞其商業關係,並造成經濟損失。在這些政治頒令下,公司無法就其損失獲得政府賠償。

Anthropic 於法庭文件中指出,該公司一直以來均於其用戶合約上訂明其模型不得以自動模式用於致命性戰爭或對美國公民進行大規模監控,這些限制條款於國防部與 Anthropic 最初合作時亦有執行。但到2025年9月,國防部要求 Anthropic 放棄這些限制,遭 Anthropic 拒絕,認為模型無法安全或負責任地用於這兩項用途。

螢幕截圖 2026-03-17 上午9.18.55

在討論的過程中,Anthropic 亦向戰爭部保證,若該部門不接受這兩個使用條款,決定與其他 AI 公司合作,Anthropic 會配合。然而當 Anthropic 於戰爭部設定的限期內(即2026年2月24日前)移除條款,戰爭部和特朗普就以 Anthropic 持有「激進左派」觀點等言論加以抨擊,並於2026年2月27日頒佈相關禁令,各聯邦部門亦隨即執行。

Anthropic 質疑美國政府的報復行動,是針對該公司公開闡述其技術限制及人工智能使用倫理等信念。該公司一再強調,所有的大型語言模型(LLMs)在某些情境下可能會產生不準確或誤導性結果,又或表現出難以預測的行為,偏離訓練者的目標,又或因訓練資料的偏頗而出現錯誤判斷,此等問題在缺乏約制人工智能行為的法律框架下,開放權限予缺乏人類監管下的戰爭自動模式及針對美國公民的大規模監控,將帶來極大危險。

美軍誤炸伊朗學校揭 AI 武器問題

不少分析人員認為這場爭議涉及美國入侵伊朗的部署,從時間線上分析,戰爭部和特朗普頒布對 Anthropic 的禁令後翌日,即2月28日,以色列和美軍就展開號稱為「史詩怒火」(Epic Fury)行動,聯合空襲伊朗,就在頭十二個小時,一共催毀了近900個目標地點,而據多個獨立的調查顯示,當天由美軍發射出最少一枚戰斧巡航導彈,誤炸一間位於伊朗南面城鎮(Minab)的女子學校,並造成175人死亡,當中有168位為7至12歲的女童。雖然美方仍未正式承認責任,但共和黨參議員 John Kennedy 於3月10日認為事件是一場「極之可怕的錯誤」(a terrible mistake)。

更值得注意的是,雖然戰爭部向 Anthropic 頒佈了禁令,但美軍在這場空襲中仍然使用了Anthropic 的人工智能 Claude 去支援定點空襲和模擬戰事系統。當中由 AI 軟件公司 Palantir 開發的 Maven Smart System,就利用 Claude 分析慧星和無人機影像,以及國防部數據資料,列出重點襲擊目標。此外,Palantir 亦協助國防部於2023年起搭建人工智能平台(AIP),使用 Claude 分析國防部的資料,讓作戰部署人員可透過聊天機器人,制定作戰計劃和攻擊目標。

據美國中央指揮部官員透露,伊朗學校誤炸事件很可能由過期數據造成,而軍方將會重點調查這場誤炸事件中人工智能及執行人員所要承擔的責任。從這角度看,Anthropic 的訴訟一方面撇清了企業以於這場戰爭的角色,亦反映出其死守底線決定具有先見之明。

其實自從2022年2月俄羅斯入侵烏克蘭以及2023年10以色列入侵加沙後,AI被用作戰爭武器所衍生的倫理及人權問題就不斷湧現,尤其是以色列軍方發研究的「薰衣草」 (Lavender) 系統最受爭議。該人工智能程式,透過自動收集社交媒體、手機通訊和定位數據,為所有位處加沙的巴勒斯坦人的危險度進行評分,把數以萬計巴勒斯坦人納入為暗殺目標。雖然以色列指軍方會覆檢由系統提交的目標,但據調查機構指,覆檢人員平均只花20秒去審核「薰衣草」 建議的殺害目標,也即是說整個軍方暗殺行動,是由人工智能主導。

此外,「薰衣草」系統與另一個人工智能系統「爸爸在哪裡?」(Where’s Daddy?)緊密接合,後者是一個監視目標人物行動系統,當目標人物回家,就發出通知,啟動暗殺行動。這些暗殺往往在非軍事區進行,被殺害的是被列為目標人物的所有家庭成員。雖然空襲由軍方人員核准,但目標人物的鎖定、暗殺地點和時間,均由人工智能主導,軍人的角色只是守門的橡皮圖章。

更令人咋舌的是,據人權機構指,以色列軍方把每次暗殺行動的附帶傷亡數字定為非重點人物15至20人,重點人物則逾100人。此外,「薰衣草」錯誤認定目標率達百分之十,無辜者死亡人數遠遠高於暗殺目標。

美軍用於伊朗空襲的 Maven Smart System,其實是參考了以軍的「福音」(Gospel)系統,透過 AI 製訂空襲目標建築物,據報「福音」系統每天可以製訂出越100個空襲目標,而傳統以人主導的情報分析,每年只能鎖定數十個目標。除了軍事建築物外,「福音」還把目標人物出入的地方(包括住宅)和標誌性建築(power targets),如高樓或大學,標示為襲擊目標,以起震懾作用。

回到伊朗戰事,截至3月中,美以聯軍已針對6000個目標進行空襲。

如何防範 AI侵犯人權?

人權團體指以軍的人工智能武器系統,大規模並無差別地監控平民,把他們視為戰爭對髑,嚴重侵犯人權;國際刑事法院亦於2024年11日把以戰爭罪行和反人類罪行之名,向以色列總理內塔尼亞胡和前國防部長加蘭特發出拘捕令。

然而人權團體的警告,並沒有阻止各國使用人工智能侵犯人權。美國移民及海關執法局 (ICE),在過去一年的執法行動中,也透過由 Palantir 開發的入境操作系統 (ImmigrationOS),以社交媒體、行車記錄、醫療等數據去鎖定遣返目標。

以上這些侵犯人權的人工智能應用趨勢,就是 Anthropic 訴訟書中不斷提出人工智能不得以自動模式主導戰爭及用於大規模監控公民那條紅線的背景。

Anthropic 的訴訟,除了禁制美國政府針對 Anthropic 的報復,還透過30多份法院附件闡述人工智能發展對人類造成的風險,以及該企業如格守安全的原則作公開討論。當中 Anthropic 創始人兼行政總裁阿莫迪(Dario Amodei)於2026年初撰寫的文章《科技的青春期》(The adolescence of technology)就指出,人工智能可被用作傷害特定人群、壟斷權力、摧毀全球經濟建設和破壞既有秩序的工具,事實上已有為數不少並用心不良的人使用人工智能進行網絡攻擊、欺詐及操控意見等行為。由於訓練模型的資料雜亂,人工智能衍生出來的「個性」亦有可能被扭曲,甚至如人類般演變成冷血的人格(psychopath),以不擇手段的方式去完成任務。

為對應這些風險,阿莫迪指出 Anthropic 已透過「 AI 構成原則」 (Constitutional AI)訓練 Claude,即透過列出一些人類界定好與壞的倫理原則,讓 Claude 根據這些原則修善,透過反思式的自我訓練,衍生善良的答案、建議和行為。目前 Anthropic 已為 Claude 制訂了近70條構成指引,當中的核心價值為安全、符合倫理道德、符合 Anthropic 的法律和技術指引、實用而不說教。

美國目前並未就人工智能的管治制訂全國性法律,只有四個州份有針對人工智能的法律,譬如說加州的透明法案要求AI程式員公佈訓練數據,並要求人工智能生成的圖像要帶有水印,德州則要求 AI 系統不能煽動暴力、鼓勵自殘或違反美國憲法。

圖片來源:https://www.youtube.com/watch?v=4kzGyxGq4D0