作者:IOSG Ventures
感谢来自 Zhenyang@Upshot, Fran@Giza, Ashely@Neuronets, Matt@Valence, Dylan@Pond 的反馈。
本研究旨在探讨对开发者而言哪些人工智能领域最为重要,以及在 Web3 和人工智能领域哪些可能是爆发的下一个机遇。
在分享新的研究观点之前,首先很高兴我们参与了RedPill总计 500 万美元的第一轮融资,也非常激动,期待接下来能够和RedPill共同成长!
随着 Web3 与 AI 的结合成为加密货币界的瞩目话题,加密世界的 AI 基础设施构建兴旺起来,但实际利用 AI 或为 AI 构建的应用程序并不多,AI 基础设施的同质化问题逐渐显现。近期我们参与的 RedPill 的第一轮融资,引发了一些更深入的理解。
Source:IOSG
Source:IOSGVentures
前文所提到的我们参投的 RedPill 是一个很好的引入点。
OpenAI 拥有几种世界级强大的模型,如 GPT-4-vision、GPT-4-turbo 和 GPT-4o,是构建先进人工智能 Dapp 的优选。
开发者可以通过预言机或前端接口调用 OpenAI API 以将其集成到 dApp 中。
RedPill 将不同开发者的 OpenAI API 整合在一个接口下,为全球用户提供快速、经济且可验证的人工智能服务,从而实现了对顶尖人工智能模型资源的民主化。RedPill 的路由算法会将开发者的请求定向到单一贡献者处。API 请求将通过其分发网络执行,从而绕过任何来自 OpenAI 的可能限制,解决了加密开发者面临的一些常见问题,如:
通过使用相同的请求代码但更换主机名,开发者能以低廉的成本、高扩展性和无限制的方式访问 OpenAI 模型。
除了使用 OpenAI 的 API,许多开发人员还会选择自行在家中托管模型。他们可以依托去中心化 GPU 网络,如 io.net、Aethir、Akash 等流行的网络,自行建立 GPU 集群并部署及运行各种强大的内部或开源模型。
这样的去中心化 GPU 网络,能够借助个人或小型数据中心的计算力,提供灵活的配置、更多的服务器位置选择以及更低的成本,让开发人员可以在有限的预算内轻松进行 AI 相关的试验。然而,由于去中心化的性质,此类 GPU 网络在功能性、可用性和数据隐私方面还存在一定的局限。
过去几个月,GPU 的需求火爆,超过了之前的比特币挖矿热潮。此现象的原因包括:
推荐:对于不太重视 SLA 的 Web2 开发者,io.net 提供了简洁易用的体验,是个性价比很高的选择。
这是加密原生 AI 基础设施的核心。它将在未来支持数十亿次 AI 推理操作。许多 AI layer1 或 layer2 为开发者提供了在链上原生调用 AI 推理的能力。市场领导者包括 Ritual、Valence 和 Fetch.ai。
这些网络在以下方面存在差异:
理想的情况是,开发者可以在任何地方,通过任何形式的证明,轻松地访问自定义的 AI 推理服务,整合过程中几乎没有任何阻碍。
推理网络提供了开发者所需的全部基础支持,包括按需生成和验证证明、进行推理计算、推理数据的中继和验证、提供 Web2 和 Web3 的接口、一键式模型部署、系统监测、跨链操作、同步集成及定时执行等功能。
Source:IOSGVentures
借助这些功能,开发者可以将推理服务无缝集成到他们现有的智能合约中。例如,在构建 DeFi 交易机器人时,这些机器人会利用机器学习模型寻找特定交易对的买卖时机,并在基础交易平台上执行相应的交易策略。
在完全理想的状态下,所有的基础结构都是云托管的。开发者只需将他们的交易策略模型以通用格式如 torch 上传,推理网络就会存储并为 Web2 和 Web3 查询提供模型。
所有模型部署步骤完成后,开发者可以直接通过 Web3 API 或智能合约调用模型推理。推理网络将持续执行这些交易策略,并将结果反馈给基础智能合约。如果开发者管理的社区资金量很大,还需要提供推理结果的验证。一旦收到推理结果,智能合约就会根据这些结果进行交易。
Source:IOSGVentures
3.1.1异步与同步
从理论上讲,异步执行的推理操作可以带来更好的性能表现;然而,这种方式在开发体验上可能让人感到不便。
在采用异步方式时,开发者需要先将任务提交到推理网络的智在合约中。当推理任务完成后,推理网络的智能合约会将结果返回。在这种编程模式下,逻辑被分为推理调用和推理结果处理两个部分。
Source:IOSGVentures
如果开发者有嵌套的推理调用和大量的控制逻辑,情况会变得更糟。
Source:IOSGVentures
异步编程模式使得它难以与现有的智能合约集成。这需要开发者编写大量额外的代码,并进行错误处理和管理依赖关系。
相对地,同步编程对于开发者来说更加直观,但它在响应时间和区块链设计上引入了问题。例如,如果输入数据是区块时间或者价格这种快速变动的数据,那么在推理完成后数据已不再新鲜,这可能会导致在特定情况下智能合约的执行需要回滚。想象一下,你用一个过时的价格来做交易。
Source:IOSGVentures
大部分 AI 基础架构采用异步处理,但 Valence 正在尝试解决这些问题。
实际上,许多新的推理网络还在测试阶段,如 Ritual 网络。根据他们的公开文件,这些网络目前的功能较为有限(诸如验证、证明等功能还未上线)。他们目前没有提供一个云基础设施以支持链上 AI 计算,而是提供了一个框架,用于自我托管 AI 计算并将结果传递至链上。
这是一个运行 AIGC NFT 的体系结构。扩散模型生成 NFT 并上传至 Arweave。推理网络会用这个 Arweave 地址在链上铸造该 NFT。
Source:IOSGVentures
这个过程非常复杂,开发者需要自己部署和维护大多数基础设施,如配有定制服务逻辑的 Ritual 节点、Stable Diffusion 节点及 NFT 智能合约。
推荐:目前的推理网络在整合和部署自定义模型方面相当复杂,且在这一阶段大多数网络还不支持验证功能。将 AI 技术应用到前端会为开发者提供一个相对简单的选择。如果你非常需要验证功能,ZKML 提供商 Giza 是个不错的选择。
代理网络让用户能轻松自定义代理。这样的网络由能自主执行任务、相互交云以及与区块链网络交互的实体或智能合约组成,这一切无需人工直接干预。它主要针对 LLM 技术。例如,它可以提供一个深入了解以太坊的 GPT 聊天机器人。这种聊天机器人目前的工具较为有限,开发者还不能在此基础上开发复杂的应用。
Source:IOSGVentures
但是将来,代理网络将提供更多的工具给代理使用,不仅仅是知识,还包括调用外部 API、执行特定任务的能力等。开发者将能够将多个代理连接起来构建工作流。例如,编写 Solidity 智能合约会涉及多个专门的代理,包括协议设计代理、Solidity 开发代理、代码安全审查代理以及 Solidity 部署代理。
Source:IOSGVentures
我们通过使用提示和场景来协调这些代理的合作。
一些代理网络的例子包括 Flock.ai、Myshell、Theoriq。
推荐:当今大部分代理的功能都相对有限。对于特定用例,Web2 代理能够更好的服务,并且拥有成熟的编排工具,例如 Langchain、Llamaindex。
代理网络更侧重于 LLM,提供了如 Langchain 这样的工具来整合多个代理。通常情况下,开发者无需亲自开发机器学习模型,代理网络已经将模型开发和部署的过程简化。他们只需要链接必要的代理和工具即可。大多数情况下,最终用户将直接使用这些代理。
推理网络则是代理网络的基础设施支撑。它提供给开发者较低层次的接入权限。正常情况下,终端用户不直接使用推理网络。开发者需要部署自己的模型,这不仅限于 LLM,并且他们可以通过链下或链上接入点使用它们。
代理网络和推理网络并非完全独立的产品。我们已经开始看到一些竖向整合的产品。他们因为这两种功能依赖相似的基础设施,所以同时提供代理和推理能力。
除了模型推理、训练和代理网络外,web3 领域还有很多值得探索的新领域:
我们目前观察到了垂直整合的发展趋势。通过构建一个基础的计算层,网络能够为多种机器学习任务提供支持,包括训练、推理及代理网络服务。这种模式意在为 Web3 的机器学习开发者们提供全方位的一站式解决方案。
目前,链上推理尽管成本高昂且速度较慢,但它提供了出色的可验证性及与后端系统(例如智能合约)的无缝集成。我认为未来将走向混合应用的道路。一部分推理处理将在前端或链下进行,而那些关键的、决策性的推理则会在链上完成。这种模式已经在移动设备上得到了应用。通过利用移动设备的本质特点,它能够在本地快速运行小型模型,并将更复杂的任务迁移到云端,利用较大的 LLM 处理。