Replit:“人人可编程”的探索者代码生成时代的Figma
AI 的浪潮为开发者带来了新的要素,其中最引入关注的是显著增强的理解能力和生成能力,GPT-4 将“草图生成网站代码”,如何将该能力产品化,并带入开发者的主要工作流是我们所关注的课题。对于全方位服务于枯燥业务逻辑的 IDE(在线集成开发环境)及其他 SaaS 产品,AI 作为武器,可以扩大产品的应用场景,帮助用户解决更深层次、更复杂的问题:如 IDE 产品中可以嵌入代码生成能力,协作软件中可以增加内容生成和推理的功能模块。公司自身根据使用场景和可使用数据的 Finetune 能力进一步决定了 AI 和业务的吻合程度。
作为 IDE 产品,Replit 被 Y Combinator 发现的契机是,在 Hacker news 上用户开始自发传播云和协作在编程工作中带来的好处。除此以外,Replit 的易用性、协作性和国际化为产品打开了更大的空间。在 Web3 的时代和 AI 时代来临时,Replit 都成为了广大用户快速搭建新兴应用而采用的平台。特别是当 AI 技术发生突破性变化时,Replit 最先在 AI 功能套件 Ghostwritter 中加入 GPT-4 的强大能力,为程序员的完整开发流程赋能。
Replit 的产品和愿景代表了事物的强大组合。目前平台上的月活用户已经超过了 100 万。2022 年的 2000 万用户中有大量未成年用户的占比,这也是和微软等传统且专业的 VS code 最大的不同。没有编程基础的年轻用户的积累可以为产品的长期发展,和使用场景的迭代打下基础,而 VS code 等产品难以让小白用户上手。产品的社区也可以创建出一个强大的生态系统,AI 模型也在这个过程中受益,共同帮助用户成为“更有能力”的创造者。这带来的最大变化是,UGC(用户原创内容)可能会变成 UGA(用户原创应用程序),Replit 将是最好的载体。
Replit 本身的发展也遇到了很大的挑战,除了在当下的 AI 浪潮中代码输出的目标形态如果不再是软件,AI 应用开发的工作流可能受到更大的干扰,未来 LangChain 这样的产品可能会占据更多的用户时间。除此以外,VS code 等产品的免费、开源本身也对 Replit 的商业化加大难度,公司的企业端的付费情况需要进一步跟踪,特别要关注 Ghostwritter 是否会带来显著的付费提升。
但 Notion AI 等将 AI 能力嵌入自身产品里的工作流软件的表现也让我们进一步增强了对 Replit 的信心,软件作为主要载体的几十年基础很难被快速打破,未来在工作流环境中更有可能的情景还是像 Microsoft 365 Copilot 这样,将 AI 能力充分应用在现有的软件产品中。如此而言,Replit 在开发者使用中的地位依然有很大渗透空间。
1. AI 为开发者带来了新的生成要素,新的大场景正在构建,代码生成是其中作为基础环节的重要一环,该领域产品值得被关注:
AI 扩充了整个市场,面向程序员的代码生成和在线集成开发产品在 LLM 有了突破性发展后,变成门槛降低,天花板显著扩大。曾经 AI 只能有效生成部分逻辑简单的重复性代码,GPT 3.5-4 后能够写出更复杂的代码,理解更核心的命令,从而完成更核心、更需要动脑的工作。AI 武器能够进入的工作环节、使用场景和应用时长都发生了质的飞跃,甚至有可能重塑整个工作流,带来上下游的改变。在当下的变动期,代码生成环节及相关产品值得被关注。
2. LLM 等有了更好的理解和推理能力,代码生成的效率基座已经建立,作为该基础上的软件产品,云上 IDE 需要被重点关注。
作为毋庸置疑的通用大模型龙头,ChatGPT 可以生成代码,但却无法在部署、提示和协同等更日常的工作环节中提供价值。以 Replit 为代表的云端 IDE 产品可以更好地和 AI 武器打配合,在该基础上形成完整的工具链,从而实现“1+1>2”的效果,来推进一个完整的项目,承载各类协作,服务于开发者工作的全环节。未来
3. Replit 拥有强大的产品能力,可以同 AI 功能套件做好配合,成为年轻用户做轻量级开发的最好选择,也会在未来延伸出更大的用户基础。
作为编程领域的 Google Docs,他给初学者和高级的开发人员都提供了简单易用的产品基座,并且可以扩充到更加强大的能力,可以成为底层的操作系统;在此基础上提供 AI 功能套件 Ghostwriter,辅助完整的代码生成和修整流程,产品上的积累和良好的 Finetune 能力,使 Ghostwritter 和 Replit 搭配使用的体验广受好评。大量的年轻用户积累和非严肃场景的渗透,也为后续爆发奠定了基础。Replit 有能力成为 AI/ML 的浪潮中年轻用户主要应用的、降低软件开发门槛的基础设施。
4. 作为 SaaS 公司,Replit 拥有很强的穿越周期的能力及用户基础;公司能否抓住 AI 带来的全新生产要素值得长期关注:
和微软的 VS code 等产品相比,Replit 在轻量级、非严肃的开发场景中有更明显的优势,从用户利用 GPT-4 在 Replit 上做出“贪吃蛇”的案例可见一斑。在 AI 来临的时候以最快的速度拥抱变化,和大模型打“配合战”。作为典型的“抓住年轻人”的产品,Replit 以其易于使用的产品设计和编程教育基础抓住了年轻的用户群体,在此基础上掀起了一波又一波与软件开发相关的浪潮。无论是在 Web3 的时代还是 AI 时代,都是用户在体验制作相关项目时最先想到的产品之一。
作为主打年轻用户的编程产品,初学者在 Replit 上学会编程之后是否会转移到 VS code 等更加专业的离线平台,以及对付费的意愿和能力的衡量,是我们对 Replit 的顾虑。作为典型的软件产品,Replit 的主要付费群体应该是企业端。因为缺乏公司在客户侧的销售表现数据,我们仍然需要关注企业客户对云上 IDE 的使用和付费情况。
正如当年智能手机为开发者带来了新要素,而推动巨大的移动互联网的浪潮和应用程序开发生态,Fred Wilson 将其概括为:
而 AI 的大浪潮也让我们开始思考新一波的迭代:大模型为开发者带来了什么样的新要素?开发者的 workflow 是否会因此产生新的改变?目前看来,AI 作为生产环境为开发者带来最显著的变化,是远超乎曾经的理解能力和生成能力,也会由此变革生产力和生产关系。未来的格局种也会慢慢出现除了人力替代以外的更多可能,比如直接调取大模型来成为软件中的“功能”,从而真正实现“大模型即服务”。
代码生成行业的发展可以追溯到计算机编程的早期。从最初的简单代码生成工具到现今的复杂人工智能驱动的系统,代码生成行业已经经历了多次重大变革。
• 早期代码生成器:在计算机编程的早期,简单的代码生成器可以用于生成常见的代码模板和结构,以提高编程效率。比如基于 Java 的模板引擎 Apache Velocity,可以在开发人员创建的模板中,根据数据自动生成 Java 类代码,从而减少手动编写重复代码的工作量;
• 集成开发环境(IDE):IDE 则是更加贴合程序员工作流的产品,包含了诸如代码补全、错误提示和代码重构等功能,进一步提高了开发人员的工作效率;
• 模型驱动架构(MDA):在21世纪初,模型驱动架构(MDA)开始受到关注。MDA 通过将业务逻辑与技术实现分离,开发人员可以使用统一的模型描述系统来自动生成代码。如 No Magic,用户可以基于它实现从抽象模型到具体代码的自动化转换;
• 人工智能和自然语言处理:随着 AI 和自然语言处理 NLP 技术的进步,代码生成领域取得了突破性进展。OpenAI 的 GPT-3 和 GPT-4 等大型预训练语言模型可以根据自然语言描述生成代码,可以理解业务逻辑后完成核心代码的搭建,在项目完成的过程中的效率和表现甚至超过大厂程序员。
GPT-4 可以通过输入粗糙的手绘草图来生成网站,并在短短几秒钟内生成几乎与草图一样的网页代码。
基于这些发展,软件开发的速度正在不断加快。根据市场调研公司 MarketsandMarkets 的报告,全球代码生成市场规模预计将从 2020 年的 20 亿美元增长到 2025 年的 60 亿美元,年复合增长率为 24.4%。而 AI 本身可以为这个市场带来更大的增长,除了 GPT-4 等更强能力的出现所带来的场景突破以外,使用者门槛也有了大幅降低,能够触达到更广泛的人群,我们预计未来的市场规模可以翻倍。
Replit 成立于 2016 年,其核心产品是基于浏览器的集成开发环境软件,并于 2022 年上线了 GhostWritter 这一 AI 编程助手,用户可以在其中使用 50 多种语言开发、编译、运行和托管应用程序。该产品被认为是初学者最容易开启编程的地方,同时也能让更富有经验的程序员测试和构建应用程序。
Replit 的使命是让下一代的十亿人实现在线开发,让所有人都有能力创造软件并以此获得财富。公司认为,在现代社会,写代码的能力应该和写论文的能力一样普遍。它希望引领从软件创建的堆叠模型到网络模型的转变,并创建世界上第一个大规模分布式和协作操作系统。目前全球开发者仅有千万量级,而未来的十亿开发者中预计九亿以上都是做轻量级开发的非专业人员。而在 AI 的赋能下,这一操作系统中的代码生成能力有了质的飞跃,自然语言来实现业务逻辑的本领大大增加。
Replit 可以帮助开发者将代码更完整、生成代码、转换代码和解释代码。基于 Replit,用户可以在浏览器中运行代码、创建项目、与他人协作和共享项目。Replit 还提供了一系列工具和功能,例如代码自动完成、调试器、版本控制和部署工具等,以便用户能够更轻松地进行编程工作。另外,Replit 还提供了大量的编程语言和框架支持,包括 Python、Java、Ruby、JavaScript、React 和 Flask 等,还可以一键部署 Github 的开源代码。
类似软件开发领域的 Google docs,用户不需要在本地安装、配置任何软件,就可以非常简单的在网页端写代码、构建、部署和托管应用等几乎所有流程,同时可以实现实时协作。产品类似软件领域的 Roblox,因为除了开发的整个流程外,用户也可以将自己开发的产品在 Replit 里进行售卖。所以它不只是一个开发者工具,而是逐渐形成了一个从开发到交易的完整平台,因此其愿景里把这些开发者叫做软件创作者(software creators)。
对此,程序员的感叹是,“编程 1 分钟配置半个月,只想学开车,却要从如何造车开始学”。
首先需要在电脑上配置好代码编辑器,还需要在 Github 等网站上搭建好源代码托管的服务。若是手动配置处理上述问题,将会非常费事。比如,环境配置遇到的问题,代码控制日志出现的问题,程序运行出现的 bug,过程中需要切换多种软件和平台。对于用户来说,既要清楚它们各自如何使用,也要会处理它们之间协作会遇到的问题。
起初,Replit 想要做的就是消除掉“繁杂事务”的门槛,让开发者可以更快地进入编程的核心地带。在当时云计算的大趋势下,Replit 将编程环境在云端提前配置好,也不再需要处理各种程序间的协作问题。
它一开始针对的是编程的初学者或者兴趣爱好者,让大家可以非常简单的学习编程,目标成为人们开始编程并发布自己第一个产品的地方。在这个基础上,整个产品的设计简洁清晰,编程的全流程中需要的配置和各环节中的支持,操作简单。
用户可以在 Replit 上共享计算引擎,实时协作进行编写、检查和调试,且可以在评论处@协作者,整体的使用体验类似于 Google 文档。
身为软件,Replit 的易用性和完整性为其打造了更高的天花板。刚开始编程之旅的初学者可以在浏览器上,设置免费帐户,并学习基础知识;也可以从现有的公共代码获得灵感并进行试验。除此以外,更高级的开发人员可以构建、测试和部署应用程序或机器人。
“今天相同的产品界面向截然不同的用户,从儿童到成人,从新手到专家。我们的使命是让 Replit 的计算环境更容易为新手所用,同时使过渡到更强大的界面成为可能。Replit 从一个简单的编辑器开始,和学习者一起开启更远的旅程。另外,用户界面具有适应性,可以为不同的用户和用例呈现不同的面孔。”
2022 年 9 月 8 日,Replit 推出了 Ghostwritter,直接将“代码生成能力”引入到了现有的开发环境中。它可以用对话的形式来写代码、调试代码,给出相关建议和对代码的解释。
它将智能能力融入几乎所有 IDE(在线集成开发环境) 功能中。Ghostwriter 拥有支持 ML 的超强软件能力,可以实时完成代码,生成、转换和解释代码的任务,也可以实现编辑器内搜索实用程序,可以让用户在不离开编辑器的情况下查找和导入开源代码。
其中,CodeGen 可以在多轮语言互动中指定编码要求,它也是业界认为唯一能与 Codex 竞争的开源模型。据 Newcomer 在 Youtube 上的视频说,Replit 对模型的选择可以追溯到 2019 年,Replit 就在用 GPT-2 来构建代码模型。但微软同时期也在做Copilot,OpenAI 不允许 Replit 发布。同期,Salesforce 也发布了一个代码模型 CodeGen,虽然对 Salesforce 的动机不明确,但 Replit 测试之后发现 Salesforce 的模型很好用。团队经过微调、部署等一系列步骤之后发布了自己的产品。
• 完成代码:Ghostwriter 在用户输入代码时利用上下文提供建议,用户可按 tab 接受建议。
• 生成代码:提供自然语言提示,Ghostwriter 可以帮助生成代码(仅有这一部分更像是 ChatGPT 可以代替的功能)。
• 解释代码:突出显示代码,Ghostwriter 将通俗易懂地逐步解释。当用户试图理解其他人的代码或过去编写的代码时,可以使用该功能。
• 转换代码:用户可以突出显示代码块,描述所需的调整(如更改变量名称),Ghostwriter 将提供代码块的重写建议。
“我和我所有的朋友注意到的第一件事是它比 GitHub Copilot 快多少。它至少快 2 倍,也许 3 倍。这是一个小细节,但有很大的不同。”;
在 GPT-4 爆发之后,Replit 在当天内发布了开箱即用、可以支持 GPT-4 的模板。在 Twitter 上,Replit 被自己的用户称为“开始使用 GPT-4 构建最快的地方”,比如 twitter 上 GPT-4 最著名的用例“重新构建贪吃蛇游戏”就托管在了 Replit 上。
AI 武器和 IDE 究竟会怎么配合?研发流程中的大部分工作是“实现无聊的业务逻辑”。
这个漫长的过程中需要的正是 Replit 所做的提示、辅助和解释等功能,帮助程序员流畅且高效地完成开发。而“根据自然语言或者其他输入来进行部分代码生成”只是流程中的一部分,工程师们真正排斥的重复性代码和类库逻辑寻找,以及协作进行编程才是 IDE 等软件产品所解决的问题。因此 GPT-4 等工具作为辅助使用的 feature,可以帮助初学者生成能使用的代码来放到 Replit 上,同时,Ghostwritter 依然有作为完整流程的提示和解释等价值。
除了作为工具,Replit 还推出了 Bounties(赏金猎人),用户可以在上面进行产品的买卖。Replit 在该过程中充当创意型 Application 需求和供给的 market place。这也是我们能看到的 UGA 发展的雏形场景,轻量级的开发结果可以被交易。若年轻用户能够形成 “Replit 上开发产品,并在 Bounties 上进行售卖”的使用场景,平台的未来发展将有更大的可能性。
Replit 的创始人 Amjad Masad 出生于约旦,他 6 岁就开始接触编程,15 岁时凭借自己开发的游戏管理软件赚到了第一桶金。在雅虎做了 8 个月程序员后,他于 2011 年作为联合创始人成立了编程教育平台 Codecademy,2013 年加入 Facebook。Masad 一直在探索如何降低编程门槛,帮助大家更高效、更轻松地做好编程。
Replit 的增长是一个曲折的过程。从 0 到 100 万花了将近四年。直到 2022 年,用户数达到了 2000万。前几年创始人因为资金匮乏,甚至需要家庭成员出钱来养活团队。YC 则是通过 Hacker news,发现用户开始自发传播云和协作在编程工作中带来的好处后,然后联系到了 Replit。
从第一天起,Replit 就在国际客户的增长处发力,在孟买和伦敦设立了计算中心。2022 年初的 1000 万用户中,80% 的用户来自美国以外的地区,其中超过 50% 的用户都是 18 岁以下的未成年人,而且经常有 12 岁左右的小朋友通过自己做的产品获得一些收入。年轻的用户基础也是他们的特色之一,因为新时代的更多年轻人将从小就具备技术素养,对编程能力的需求也不太可能消失。
另外,Replit 提供了可以用移动设备进行访问的方式。他们希望国际化、使用方便的 Replit 可以帮助使一个 14 岁的孩子在肯尼亚用手机编码,并在 AI 的支持下,拥有和硅谷的专业程序员类似的编程能力。
年轻用户将为 Replit 的发展带来复利能力。投资人 Not Boring 曾说:
“如果你能获得最年轻的用户,且随着他们年龄的增长也能留住他们,并且持续吸引新的年轻用户群,随着时间的推移,你将赢得最终的胜利。”
目前在 Tegus 等其他的信息源,我们能看到的企业端用例也多是基于经典的 IDE 产品进行付费,而基于其他开发者服务产品的付费情况,如付费情况不理想的 Kite,以及微软 VS Code 坚持开源的情况来看,Replit 的商业化路径不会太好走。
DevOps 一直是竞争激烈的领域,多数大厂在大规模开发和软件部署的时候都有成熟的 DevOps 工作流。公司的 DevOps 工具链应覆盖需求规划、创建、测试、发布和监控等阶段。大多数 DevOps 供应商将专注于工具链的特定领域,例如需求规划源代码控制、代码生成、配置管理、部署或监控。而工具链的整合和 AI/ML 能力的嵌入是 DevOps 最重要的趋势。
1. 微软 VS Code 是典型的传统 IDE,主要服务于本地。它拥有丰富的插件和功能,可以满足不同类型的开发需求,尤其是针对需要在本地环境下进行大型项目开发的开发者。相比之下,Replit 则是基于云的在线编程平台,主要面向初学者和团队协作开发。VS Code 和 Replit 不是直接的竞争关系,而是可以相互补充的工具。
• 根据 Tegus 的用户访谈,pair programming 等需要协作的工作场景中,Replit 的确更快捷和丝滑,但大型项目中大家更习惯使用 VS code,VS code 本身是免费的;
3. CodePen:更注重社区的的代码模块分享网站,可以在其中创建,共享和发现前端代码片段。与 Replit 不同的是,CodePen 侧重于前端开发,而不是全栈开发。
4. Glitch:Glitch 是一个在线的 Web应用程序开发平台,可以在其中创建、编辑和部署 Web 应用程序。它与 Replit 类似,但重点是 Web 应用程序开发,而不是代码编辑和学习。
5. Cloud9:Cloud9 是一个在线的代码编辑器和开发环境,可以在其中进行代码编辑,调试和部署。它提供了类似 Replit 的功能,但更侧重于团队协作和企业应用。
6. Roblox:可以让孩子们构建游戏和编写代码的游戏创建平台。尽管在 Roblox 上构建和销售软件仅限于游戏,但年轻程序员在 Replit 以外的地方编写他们的第一行代码的原则其实是一个潜在的威胁。
随着 AI/ML 的进步和开源的大量数据,更多模型可以基于软件语义构建了。因此,DevOps 平台可以融入自动化开发过程的各个方面,包括 AI 助手在 IDE 中提出代码建议,以及自动化安全漏洞扫描,因为这些模型了解要查找什么问题。去年,构建开发工具的公司共融资 370 亿美元。因为软件开发人员的需求不断增加,平台有机会成为日益重要的核心组成部分。AI/ML 的结构性变化,也会让之后的市场更加有想象力。
在未来,我们预计代码的生成将会有以下几种趋势,进而带来更综合角度的提升:
1. 跨领域集成:代码生成技术可能会与其他领域结合,例如数据科学、视觉设计和产品管理等,进一步重塑工作流;
2. 个性化和定制化:代码生成将更加符合开发人员的个性化需求和编码风格,与业务习惯连接更紧密;
3. 缩小技能差距:更多的编程环境更符合 no code 的逻辑,越来越多的非技术人员可以参与到应用。
Replit 提供免费产品和付费订阅产品的组合。对于个人使用,Replit 提供免费访问其基于浏览器的协作 IDE。个人用户还可以选择每月支付 7 美元购买“Hacker”计划,用于解锁更多功能、隐私和存储空间。截至 2022 年,Replit 的大部分收入来自购买“Hacker”计划的个人用户。Replit 还为企业提供“Teams Pro”,每位用户每月订阅费用为 15 美元。对于教育机构,Replit 提供以创建学校项目和作业为中心的免费服务。Ghostwritter 的专业版需要 20 美元/月。
2021 年 12 月,Replit 以 8 亿美元的估值获得由 Coatue 领投的 8000 万美元 B 轮融资。Replit 没有公开具体收入,但根据多数代码开发产品的经验来看,Replit 的商业化可能是该项目最大的 concern。AI 功能推出和迭代后的付费是否有显著提升,这也是我们关注的另一个重点。基于对 SaaS 产品的理解,我们认为公司在企业端的销售情况也是未来增长的重头戏。
Replit 本身的 IDE 产品模式已经不算创新了,在 AI 对一切模式发起挑战的当下依然面临着巨大的危机,未来软件的开发过程是否依然符合当下的流程,需要打一个问号。如果日后软件这一形态被 AI 取代,那么即使在 IDE 中加入再多的新时代武器也无法改变产品整体落伍的事实。若真如此,LangChain 及 ChatGPT 插件才是开发者所使用平台的未来。
但正如 Notion 在加入 AI 支持后使产品变得更强大一样,人们对于软件载体几十年的使用习惯还是很难被完全改变,在工作流程软件中加入 AI 能力是最好的解法之一,Ghostwritter 将开源模型 Finetune 后引入自身软件即是如此。如果其他软件公司本身不具备 Finetune 大模型的能力,而是选择调用 API 来引入 AI 能力,那么整体的 cost 结构就会有比较大的改变,每次调用都是一次花费。公司需要重新构建 UE 模型,让 AI 能力带来的新增收费(包括付费用户数量的增加和客单价的提升)与 API 调用带来的可变成本之间的平衡,这也决定了 AI 的引入是否能带来更高效的盈利。