赞助商
立即入驻

Devin-首个全自主AI软件工程师智能体

2个月前更新 153 0 0

Devin 是由AI初创公司 Cognit...

收录时间:
2024-03-18
Devin-首个全自主AI软件工程师智能体Devin-首个全自主AI软件工程师智能体
Devin-首个全自主AI软件工程师智能体

Devin-首个全自主AI软件工程师智能体

Devin是什么?

Devin 是由AI初创公司 Cognition 开发的全球首个全自主 AI 软件工程师,具备自主学习新技术、端到端构建和部署应用、自主查找和修复代码 Bug、训练和微调 AI 模型的能力。在 SWE-bench 基准测试中,Devin 展现出超越其他 AI 模型的性能,正确解决了实际编程问题。

Devin-首个全自主AI软件工程师智能体插图

Devin的主要功能

Devin具备以下能力:

  1. 长期推理与规划:能够规划和执行需要数千个决策的复杂工程任务,记住每一步的相关上下文,随时间学习,并修复错误。
  2. 使用开发者工具:配备了包括 shell、代码编辑器和浏览器在内的常见开发者工具,在一个沙盒化计算环境中工作。
  3. 主动协作:能够实时报告进度,接受反馈,并根据需要与用户共同进行设计选择。
  4. 学习新技术:通过阅读博客文章等资料,学习如何使用不熟悉的技术。
  5. 端到端应用构建和部署:能够从头开始构建并部署应用程序,如模拟生命游戏的交互式网站,并将其部署到 Netlify。
  6. 自主查找和修复代码库中的 Bug:帮助维护和调试开源竞赛编程书籍。
  7. 训练和微调 AI 模型:设置大型语言模型的微调,只需提供一个 GitHub 研究仓库的链接。
  8. 处理开源仓库的问题:只需提供一个 GitHub 问题的链接,Devin 就能完成所有设置和上下文收集工作。
  9. 对成熟生产仓库做出贡献:作为 SWE-bench 基准测试的一部分,Devin 解决了 sympy Python 代数系统中的对数计算错误。
  10. 执行实际工作:在 Upwork 上完成实际的编程工作,编写和调试运行计算机视觉模型的代码,并在最后编译报告。
Devin-首个全自主AI软件工程师智能体插图1

Devin的评测结果

Devin 在 SWE-bench 基准测试中的表现非常出色,这是一个挑战性的基准测试,要求参与者解决开源项目(如 Django 和 scikit-learn)中的实际 GitHub 问题。Devin 正确解决了 13.86% 的问题,这一比例远远超过了之前的技术水平,后者只能解决 1.96% 的问题。即使在只给定要编辑的确切文件的情况下,以往的最佳模型也只能解决 4.80% 的问题。Devin 在评估时是独立完成的,而其他模型则得到了辅助(即模型被告知需要编辑哪些文件)。这一结果显示了 Devin 在理解和解决实际编程问题方面的巨大优势。

Devin-首个全自主AI软件工程师智能体插图2

如何使用Devin?

目前Devin还在内测中,感兴趣的用户可以访问Cognition的官网了解更多信息,并填写内测申请表以抢先体验。

申请通过后,即可在Devin官网体验

数据评估

Devin-首个全自主AI软件工程师智能体浏览人数已经达到153,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议大家请以爱站数据为准,更多网站价值评估因素如:Devin-首个全自主AI软件工程师智能体的访问速度、搜索引擎收录以及索引量、用户体验等;当然要评估一个站的价值,最主要还是需要根据您自身的需求以及需要,一些确切的数据则需要找Devin-首个全自主AI软件工程师智能体的站长进行洽谈提供。如该站的IP、PV、跳出率等!

关于Devin-首个全自主AI软件工程师智能体特别声明

本站做视频AI导航网提供的Devin-首个全自主AI软件工程师智能体都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由做视频AI导航网实际控制,在2024年3月18日 下午11:24收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,做视频AI导航网不承担任何责任。

相关导航

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...