近日,一则关于世界首个AI程序员Devin的视频涉嫌造假的消息引发了广泛关注。据了解,一位拥有35年软件工程师经验的YouTube博主对Devin完成Upwork任务的宣传视频进行了逐帧复现,结果却发现了令人震惊的事实。
该博主在仔细分析了Devin完成任务的视频后,发现AI程序员的表现并不如宣传中那么出色,甚至可以说是非常糟糕。他指出,尽管Devin在某些环节上展现了一定的能力,但在整体任务完成度上却表现得相当糟糕,远远不能达到人类工程师的水平。
更为引人注目的是,博主自己复制了Devin尝试做的任务,仅花费了大约36分钟的时间,而Devin却用了至少6个小时,甚至可能超过一天。这一对比结果无疑给Devin的能力画上了一个大大的问号。
网友们对于这一事件也纷纷发表了自己的看法。有人认为,正如博主所详细解释的那样,Devin并不能像宣传中那样独立完成Upwork的工作,它创建的代码过于混乱和复杂。也有人表示,Devin从一开始就更像是一个营销和炒作的产物,而非现实可用的工具。
那么,Devin的视频真的是造假了吗?AI旋风认为,从博主逐帧分析的结果来看,虽然不能断定视频完全造假,但至少可以肯定的是,Devin在完成Upwork任务时的表现并不如宣传中那么出色。这也引发了人们对于AI技术能力的思考和质疑。
据了解,Devin发布之初,其背后的初创公司Cognition AI通过一系列视频展示了这一AI的“魔力”。其中一个视频展示了Devin自主完成了Upwork平台上的一项任务,这一表现让网友们惊叹不已,纷纷表示AI智能体已经可以做副业了。然而,随着博主逐帧分析的深入,这一美好的幻想似乎开始破灭。
在博主看来,Devin在完成任务时存在诸多不足。首先,它并不能像人类工程师那样与客户进行有效的沟通,无法明确客户的需求和期望。其次,在代码编写方面,Devin也表现得相当糟糕,无法独立完成高质量的代码。此外,博主还指出,Devin在任务执行过程中遇到了许多错误和困难,这些都是人类工程师可以轻松解决的问题。
当然,也有人认为,Devin的表现并不代表所有AI技术的水平。毕竟,AI技术还在不断发展和完善中,每个AI系统都有其独特的优势和局限性。然而,无论如何,这一事件都引发了人们对于AI技术能力和应用前景的深入思考和讨论。
综上所述,AI旋风认为,虽然Devin作为世界首个AI程序员备受关注,但其在实际任务中的表现却令人失望。这也提醒我们,在看待AI技术时,需要保持理性和客观的态度,既不能盲目崇拜,也不能一概否定。同时,我们也应该积极推动AI技术的研发和应用,为人类社会的发展和进步贡献更多的力量。