









新闻加密货币

OpenAI最新的“推理”模型存在基本错误

Cryptopolitan2024年12月6日 20:55

OpenAI 演示视频表明该模型容易出错

根据 OpenAI 发布的展示该模型优势的视频，用户上传了一张木制鸟舍的图像，然后向模型询问如何建造类似鸟舍的一些建议。 “推理”模型似乎会“思考”一会儿，然后发出看似一组指令。

仔细一看，这些说明似乎是浪费时间。该模型测量了任务所需的材料，例如油漆、胶水和密封剂，但它只提供了鸟舍前面板的尺寸。

该模型建议将一张砂纸切割成另一组不需要的尺寸。此外，该模型表示它给出了“准确的尺寸”，但没有给出准确的尺寸，这与之前的说法相反。

总部位于英国的贸易机构木匠协会 (Institute of Carpenters) 所长 James Filus 也揭露了该模型的错误，例如 o1 的清单中缺少但需要的工具，例如锤子。

“你对从图像中构建鸟舍的了解与从文本中了解的一样多，这违背了人工智能工具的全部目的。”
丝状体。

此外，Filus 还透露，建造同一个鸟舍的成本“远不及”模型估计的 20 至 50 美元。

OpenAI 模型的用途与预期相反

o1 案例增加了人工智能模型产品演示的其他示例，但它们的作用与预期目的相反。 2023 年，谷歌的人工智能辅助搜索工具广告错误地指出詹姆斯·韦伯望远镜有了一项原本没有的发现。这一错误导致该公司股价下跌。

这并非全部来自搜索引擎巨头，因为最近类似谷歌工具的更新版本告诉用户吃石头是安全的。它还声称用户可以使用胶水将奶酪粘到披萨上。

尽管存在这些错误，但根据公开基准测试，o1 模型仍然是 OpenAI 迄今为止最强大的模型。它在回答问题时也采取了与 ChatGPT 不同的方法。

据《时代》杂志报道，o1 仍然是一个非常先进的下一个单词预测器，因为它是使用机器学习对来自互联网及其他领域的数十亿单词文本进行训练的。

该模型使用一种称为“思想链”推理的技术，在幕后“思考”答案，然后才给出答案。这与仅根据提示发出言语不同。

这有助于模型给出更准确的响应，而不是仅仅吐出单词来响应用户查询。

90 天内开启您的 Web3 职业生涯并获得高薪加密工作的分步系统。

免责声明：本网站提供的信息仅供教育和参考之用，不应视为财务或投资建议。

Tradingkey

美联储降息：罗素2000将跑赢标普500？

TradingKey - 美联储于9月17日降息了25个基点，标志着降息周期的正式重启。从理论上讲，小盘股相比大盘股，因更依赖外部融资、更受美国国内经济周期影响且作为更高风险资产，在美联储降息时能获得更多益处。

TradingKey

3 小时前

Uranium Energy (UEC)财报预览：铀矿资源还有多少？

TradingKey - Uranium Energy（UEC）将于9月24日开盘前公布第四季度及全年财报。该公司股价表现强劲，年内累计上涨61%，这波涨势与铀作为大宗商品的行情密切相关。

TradingKey

5 小时前

SoFi的降息红利：贷款需求激增与FSPL战略加速

我对SoFi持谨慎乐观的评级。其独特的商业模式推动了强劲的表现。银行牌照提供了低成本资金来源。轻资产业务的快速增长为其增添了动能，显示出其长期的价值潜力。

TradingKey

8 小时前

破冰！马斯克与特朗普“握手言和”，白宫合作有望重启？

TradingKey - 在经历数月公开决裂后，美国总统特朗普与特斯拉CEO埃隆·马斯克于当地时间9月21日在亚利桑那州一场保守派活动家查理·柯克的追悼会上罕见同框。这是两人自5月底因“大而美”财政法案激烈争吵以来，首次被拍到共同现身并互动。

TradingKey

13 小时前

黄金交易提醒：涨势停不下！美联储降息后，金价直奔4000美元大关？

上周全球黄金市场再度迎来里程碑时刻。上周三美联储宣布降息25个基点后，现货黄金价格一度冲至3707.40美元/盎司的历史新高，尽管随后出现震荡回调，但上周五收盘仍站稳3684.93美元，周线涨幅达1.15%，实现连续第五周上涨。市场分析师普遍认为，黄金的看涨基调并未因短期波动而改变。

汇通财经网

14 小时前

Tradingkey

KeyAI



OpenAI最新的“推理”模型存在基本错误

OpenAI 演示视频表明该模型容易出错

OpenAI 模型的用途与预期相反

相关文章

美联储降息：罗素2000将跑赢标普500？

Uranium Energy (UEC)财报预览：铀矿资源还有多少？

SoFi的降息红利：贷款需求激增与FSPL战略加速

破冰！马斯克与特朗普“握手言和”，白宫合作有望重启？

黄金交易提醒：涨势停不下！美联储降息后，金价直奔4000美元大关？