tradingkey.logo

维基百科正与人工智能公司商讨向其内容使用收费事宜

Cryptopolitan2025年12月4日 12:49

维基百科联合创始人吉米·威尔士表示,这家运营在线百科全书的非营利组织正在寻求与人工智能公司达成更多授权协议。 此举正值一系列自动化人工智能机器人给维基百科的基础设施带来压力之际。 

威尔士解释说,人工智能公司利用该平台免费提供的知识来训练大型语言模型(LLM)。他指出,大量人工智能机器人会抓取整个网站,给平台带来巨大的技术和财务负担。

“人工智能机器人……会遍及整个网站……所以我们需要更多的服务器,需要更多的内存和缓存来缓存它们,这会让我们花费不成比例的资金,”他解释说。

威尔士指出,人工智能机器人的大量使用迫使维基百科扩展服务器、增加内存并改进缓存,而所有这些都需要付出高昂的成本。

他指出,虽然该网站对个人用户免费,但营利性人工智能公司大规模、自动化访问则是另一个问题。这家非营利组织于2022年与谷歌签署了许可协议,目前正在与其他公司洽谈类似协议。

运营维基百科的非营利组织维基媒体基金会依靠相对较小的公众捐款和志愿者编辑来运作,其目的并非用于资助大规模的营利性人工智能开发。

威尔士表示,让贡献者和捐助者承担商业人工智能公司使用维基百科内容的成本是不公平的。

维基百科警告人工智能机器人可能带来不可持续的负担

维基百科声明,它警告人工智能机器人带来的负担已不堪重负。近几个月来,这些机器人对维基百科服务器的需求急剧增长。自动化机器人增加了网站流量——尤其是多媒体下载量——导致这家非营利组织不得不投入巨资用于基础设施建设。

这些流量大多并非来自人类用户,而是来自人工智能公司抓取旨在训练其模型的内容。2022年,维基媒体基金会推出了一款付费商业产品——维基媒体企业版(Wikimedia Enterprise),旨在大规模提供其核心内容的访问权限,并为平台用户提供必要的工具和资源。 

这项服务旨在缓解维基百科网站的压力,同时为人工智能开发者提供必要的数据以增强其模型。威尔士敦促人工智能公司使用这项付费服务,而不是抓取公共网站的数据。 

威尔士表示,如果企业未能遵守这些技术措施,可能会通过诸如AI Crawl Control。目前,企业界对于公共(或商业)人工智能在管理用户个人数据方面的作用存在一些争议。用户如今持有的个人数据规模已经超过了人们享有自由、透明知识的法定权利,也超过了公共和私营部门的实际需求。

随着越来越多的AI处理严重依赖于大型公开数据集,维基百科倡导一种公平的做法,既要补偿维护这些数据的实体,也要补偿相关企业。维基百科始终坚持其中立原则。 

在全球冲突中,维基百科难以保持中立。

维基百科网站作为一家由维基媒体基金会管理的非营利机构,已经运营了20多年。它的模式建立在一支全球志愿者编辑队伍之上,这些编辑花费时间创建、编辑和校对内容。

公众捐款是确保维基百科对任何人、任何地点开放的关键因素,无论其资金多少或地理位置如何。维基百科作为一个知名的国际网站和百科全书,也一直在努力保持与其他信息来源的保持中立

在详细报道涉及重大政治议题、社会运动或全球武装冲突时,这个问题会变得更加突出。威尔士表示,尽管大多数维基百科编辑本身并非活动人士,但个人偏好可能会影响对相关话题的报道方式。 

然而,他补充说,他信任维基百科社群,并表示编辑们即使在巨大的压力下,也往往能够实现维基百科公平和准确的价值观。该平台的公正性还dent 在其社群政策、同行评审机制和争议处理流程等诸多方面。 

与此同时,对志愿者和捐款的持续依赖也凸显了该系统的脆弱性。随着平台面临新的压力,包括人工智能公司越来越多地使用其内容,确保平台的核心价值观(中立性、准确性和自由访问)保持不变变得愈发重要。

立即加入 Bybit并在几分钟内领取 50 美元奖金

免责声明:本网站提供的信息仅供教育和参考之用,不应视为财务或投资建议。

相关文章

KeyAI