tradingkey.logo

新研究发现,人工智能公司依赖优质出版商提供训练数据

Cryptopolitan2024年11月9日 20:30

在研究中,Ziff Davis 的 AI 律师 George Wukoson 和首席技术官 Joey Fortuna 声称,AI 公司根据搜索引擎排名较高的权威网站的排名来选择训练数据。选择高质量和受欢迎的网站来改进模型,因为它们具有良好的声誉。根据该研究,该策略使人工智能开发人员能够微调语言模型。

Ziff Davis 指出,Axel Springer、Future PLC、Hearst、新闻集团和纽约时报等顶级内容提供商为训练数据集的开发做出了贡献。特别是,已dent用于创建 OpenAI 的 GPT-3 的 OpenWebText2 的 12.04% 来自这些受信任的发布者。

马克·扎克伯格还对围绕人工智能培训内容使用正在进行的争论发表了看法。在最近接受 The Verge 采访时,扎克伯格承认人工智能的数据抓取具有挑战性,但也指出个人创作者或出版商的内容可能没有那么有影响力。他表示,“我认为个人创作者或出版商往往会高估其特定内容在这个宏伟计划中的价值。”

出版商对人工智能公司提起诉讼

培训数据源的保密引起了出版商和消费者的担忧。 《纽约时报》和《华尔街日报》最近对人工智能公司提起诉讼,称它们使用其内容违反了版权法。

尽管 OpenAI 已努力从《金融时报》和 DotDash Meredith 等媒体组织获得内容许可,但仍有几家人工智能公司在没有适当许可的情况下开展业务。该报告进一步指出, “主要的法学硕士开发人员不再像以前那样披露他们的培训数据。”

尽管人工智能公司的价值不断上升,但科技巨头与传统媒体公司之间的差距仍然巨大。谷歌和 Meta 等科技巨头的估值分别为 2.2 万亿美元和 1.5 万亿美元,仍然处于生成人工智能领域的前沿,而 OpenAI 和 Anthropic 等初创公司的估值分别为 1570 亿美元和 400 亿美元。

另一方面,出版商仍在应对裁员和重组,这证明了适应人工智能日益defi的环境所面临的财务压力。由于与用户生成和基于人工智能的内容的竞争,许多出版商面临着降低成本和人员方面的挑战。

免责声明:本网站提供的信息仅供教育和参考之用,不应视为财务或投资建议。

相关文章

Tradingkey
tradingkey.logo
tradingkey.logo
日内数据由路孚特(Refinitiv)提供,并受使用条款约束。历史及当前收盘数据均由路孚特提供。所有报价均以当地交易所时间为准。美股报价的实时最后成交数据仅反映通过纳斯达克报告的交易。日内数据延迟至少15分钟或遵循交易所要求。
* 参考、分析和交易策略由第三方提供商Trading Central提供,观点基于分析师的独立评估和判断,未考虑投资者的投资目标和财务状况。
风险提示:我们的网站和移动应用程序仅提供关于某些投资产品的一般信息。Finsights 不提供财务建议或对任何投资产品的推荐,且提供此类信息不应被解释为 Finsights 提供财务建议或推荐。
投资产品存在重大投资风险,包括可能损失投资的本金,且可能并不适合所有人。投资产品的过去表现并不代表其未来表现。
Finsights 可能允许第三方广告商或关联公司在我们的网站或移动应用程序的任何部分放置或投放广告,并可能根据您与广告的互动情况获得报酬。
© 版权所有: FINSIGHTS MEDIA PTE. LTD. 版权所有
KeyAI