一个新兴公司”Cognition”成功打造了世界上首个虚拟AI工程师,名为Devin AI。这一创举并非出自微软、OpenAI、Google等科技巨头,而是由Cognition这家成立仅两个月的初创公司完成。Devin AI展现出了超越其他AI模型的编程能力,能够熟练编写软件、搭建网站,并且拥有自主性。
“Cognition”在其官网上表示:“让我们来认识Devin,他是世界上第一个完全自主的AI软件工程师。”他们进一步指出,Devin是一位从不知疲倦、技术娴熟的合作伙伴,随时准备与您一起完成工作,或者独自完成任务供您审阅。
Devin AI的能力相当惊人。据彭博社报道,Devin AI类似于微软推出的AI助手Copilot,但功能更为强大。它不仅可以提供编写程序的建议、完成部分任务,还能够独立承担整个软件或网站开发项目。例如,如果要它“建立一个收集悉尼所有意大利餐厅信息的网站”,Devin将自动收集餐厅的电话、地址等信息,并建立网站展示这些信息。
根据Cognition官网的介绍,Devin甚至具有“成长”的能力。它可以通过阅读文章学习之前不了解的技术,并自主检查程序代码中是否存在错误,并进行修正。此外,Devin还能够训练和微调自己的AI模型,只需提供GitHub存储库的链接即可。
Cognition表示,他们利用SWE-bench测试了Devin解决编程问题的能力,并成功解决了13.86%的问题,远远超过了之前由Claude 2创造的1.96%。即使在有人协助的情况下,过去的AI模型也只能解决4.8%的问题。
SWE-bench是一个测试系统自动化解决现实问题能力的数据库,从12个领域收集了多达2,294个问题。
目前,Devin尚未完全对外开放使用。想要提前体验的人需要在官网提交申请,进入等待列表排队。但根据外界的实际测试体验,Devin可以在5到10分钟内从零开始构建一个网站,并且可以在同样的时间内建立网页版的《乒乓球》——史上第一款电子游戏。尽管仍需要多次输入提示来改进,但成果已经令人满意。
计算机科学家Silas Alberti指出,Devin给人的感觉不像只是一个能够编写程序的AI助手,更像是一个可以独立操作的真正员工,“这感觉非常不一样,因为它是一个真正可以帮你做事的自主系统。”
Cognition指出,有了Devin后,工程师可以专注于更有趣的难题,团队能够实现更具雄心的目标。在某种程度上,这表明Devin并不是为了取代工程师,而是为了辅助工程师而生的AI助手。
许多人可能都没有听说过Cognition这家公司,因为它才成立了短短2个月,直到发布Devin之前一直低调行事。然而,Cognition目前已经获得了知名创投家Peter Thiel旗下Founder Fund领投的2100万美元,其他投资者还包括前Twitter高管Elad Gil。
Cognition由27岁的CEO Scott Wu、技术总监Steven Hao和产品总监Walden Yan共同创立,目前团队仅有10人。然而,每个人都是人才,据称他们已经从国际奥林匹克信息竞赛中获得了多达10枚金牌,并且曾在DeepMind、Scale AI、Waymo等许多公司从事过AI相关工作。
技术总监Steven Hao之前是AI标注公司Scale AI的顶尖工程师,而产品总监Walden Yan直到最近还是哈佛的学生——甚至还没有告诉父母辍学的事。Scott Wu和在公司的兄弟Neal Wu从青少年时期就是国际编程比赛的常胜军,还是国家队选手。
“我9岁开始学习编程,那时候我就爱上了这种能够让想法成真的能力。”Scott Wu曾在某次访谈中提到。
值得一提的是,Cognition亮相后,网络上也开始流传一段据称是2010年Scott Wu参加Raytheon Mathcounts数学比赛的视频。他以极快的速度解答问题,并且在出题者还没读完整个题目时就已经算出了正确答案。
Scott Wu表示,教导AI成为工程师很像他们过去参加比赛一直在做的事情,只不过现在有机会将大型语言模型与强化学习结合起来。至于他们究竟如何打造Devin,
他只是声称团队找到了将大型语言模型与强化学习相结合的独特方法,并没有透露技术细节。
Peter Thiel在一份声明中表示,他的创投公司并不经常投资于AI公司,但他认为Cognition有足以与DeepMind、OpenAI、Scale AI等知名AI公司媲美的实力。
早就災阿
天啊~~~~~~
看来机器人要准备征服世界了
Erer