ในการวิจัย George Wukoson ทนายความด้าน AI ของ Ziff Davis และ Joey Fortuna ประธานเจ้าหน้าที่ฝ่ายเทคโนโลยีอ้างว่าบริษัท AI เลือกข้อมูลการฝึกอบรมโดยพิจารณาจากการจัดอันดับเว็บไซต์ที่เชื่อถือได้ซึ่งมีอันดับเครื่องมือค้นหาสูง มีการเลือกเว็บไซต์คุณภาพสูงและเป็นที่นิยมเพื่อปรับปรุงโมเดลเนื่องจากมีชื่อเสียงที่ดี กลยุทธ์ที่ตามการศึกษาช่วยให้นักพัฒนา AI ปรับแต่งโมเดลภาษาได้อย่างละเอียด Ziff Davis ชี้ให้เห็นว่าผู้ให้บริการเนื้อหาชั้นนำ เช่น Axel Springer, Future PLC, Hearst, News Corp และ The New York Times และอื่นๆ มีส่วนในการพัฒนาชุดข้อมูลการฝึกอบรม โดยเฉพาะอย่างยิ่ง ฉัน dent ว่า 12.04% ของ OpenWebText2 ซึ่งใช้สำหรับการสร้าง GPT-3 ของ OpenAI มาจากผู้เผยแพร่ที่เชื่อถือได้เหล่านี้ Mark Zuckerberg ยังชั่งน้ำหนักการอภิปรายอย่างต่อเนื่องเกี่ยวกับการใช้เนื้อหาในการฝึกอบรม AI ใน การสัมภาษณ์ล่าสุด กับ The Verge นั้น Zuckerberg ยอมรับว่าการคัดลอกข้อมูลสำหรับ AI เป็นสิ่งที่ท้าทาย แต่ยังชี้ให้เห็นว่าเนื้อหาของผู้สร้างหรือผู้จัดพิมพ์แต่ละรายอาจไม่ส่งผลกระทบขนาดนั้น เขากล่าว ว่า "ผมคิดว่าผู้สร้างหรือผู้เผยแพร่แต่ละรายมักจะประเมินค่าสูงเกินไปของเนื้อหาเฉพาะของตนในโครงการใหญ่ของสิ่งนี้" ความลับเกี่ยวกับแหล่งข้อมูลการฝึกอบรมทำให้เกิดความกังวลในหมู่ผู้เผยแพร่และผู้บริโภค เมื่อเร็วๆ นี้ New York Times และ The Wall Street Journal ได้ยื่นฟ้องบริษัท AI โดยกล่าวว่าพวกเขาละเมิดกฎหมายลิขสิทธิ์โดยใช้เนื้อหาของพวกเขา แม้ว่า OpenAI จะมีความพยายามขั้นสูงในการขอรับลิขสิทธิ์เนื้อหาจากองค์กรสื่อ เช่น Financial Times และ DotDash Meredith แต่บริษัท AI หลายแห่งยังคงทำงานโดยไม่มีใบอนุญาตที่เหมาะสม รายงานระบุเพิ่มเติมว่า “นักพัฒนา LLM รายใหญ่ไม่เปิดเผยข้อมูลการฝึกอบรมอีกต่อไปเหมือนที่ครั้งหนึ่งเคยทำ” ในขณะที่มูลค่าของบริษัท AI เพิ่มขึ้น ช่องว่างระหว่างบริษัทยักษ์ใหญ่ด้านเทคโนโลยีและบริษัทสื่อทั่วไปยังคงมีอยู่มากมาย บริษัทยักษ์ใหญ่ด้านเทคโนโลยี เช่น Google และ Meta ซึ่งมีมูลค่าประมาณ 2.2 ล้านล้านดอลลาร์ และ 1.5 ล้านล้านดอลลาร์ ตามลำดับ ยังคงอยู่ในแถวหน้าของ generative AI ในขณะที่สตาร์ทอัพ เช่น OpenAI และ Anthropic มีมูลค่า 157 พันล้านดอลลาร์ และ 40 พันล้านดอลลาร์ตามลำดับ ในทางกลับกัน ผู้จัดพิมพ์ยังคงเผชิญกับการเลิกจ้างและการปรับโครงสร้างใหม่ ซึ่งเป็นข้อพิสูจน์ถึงแรงกดดันทางการเงินจากการปรับตัวให้เข้ากับสภาพแวดล้อมที่ defi โดย AI มากขึ้นเรื่อยๆ จากการแข่งขันกับเนื้อหาที่ผู้ใช้สร้างขึ้นและเนื้อหาที่ใช้ AI ผู้เผยแพร่โฆษณาจำนวนมากเผชิญกับความท้าทายในแง่ของการลดต้นทุนและพนักงาน ผู้จัดพิมพ์ยื่นฟ้องบริษัท AI