然而,許多作家和教育家質疑人工智能的真實性。其中之一是 TrustInsights.ai 的聯合創始人 Christoper Pen,他在 LinkedIn 的一篇帖子中表示, “AI探測器”是一個笑話。 Pen並不是唯一一個認爲人工智能探測器不可靠的人。 SEO 內容專家 Dianna Mason 在一篇文章中表示,“人工智能內容檢測器不起作用。”
根據 Reddit 上的另一篇帖子,一位用戶表示: “是的,人工智能探測器是一個騙局。從來沒有一篇學術論文證明人工智能探測器可以可靠地工作。對於可靠的人工智能探測器如何工作,也沒有一個有前景的理論框架。 “
幾個廣爲人知的例子表明人工智能探測器效率低下。例如,一臺探測器將美國《獨立宣言》的 97.75%dent認爲是人工智能撰寫的。
在另一個例子中,聖經中的文本被發現是人工智能編寫的。印度教經典《薄伽梵歌》也被人工智能誤dent。此類dent對人工智能探測器的可信度提出了非常嚴重的質疑。
爲了進一步研究人工智能探測器的有效性,我們用四種不同的探測器測試了聖經的摘錄。結果卻截然不同
AI檢測器主要使用兩種衡量標準,即困惑度和突發性。困惑度衡量下一個單詞正確的概率,突發性衡量單詞和短語數量的變化性。雖然人類書寫往往表現出更多的多樣性,但人工智能生成的文本通常更加統一。儘管如此,隨着 GPT-4 等人工智能模型的進步,它們可以更熟練地複製人類書寫,從而使檢測變得更加困難。
Coachvox 創始人朱迪·庫克 (Jodie Cook)表示, “現在我們嘲笑人工智能生成的 LinkedIn 評論......但隨着技術的進步,我們將不知道什麼是真實的,什麼是不真實的。沒有人會。 “
對於作家、dent和企業來說,風險很高。這就引出了一個問題:人工智能探測器是否可信?