架构¶

Firefox AI 平台使用 ONNX 运行时来运行模型，并利用 Transformers.js 库简化推理工作。

(1)(2) 当内容进程调用推理 API 时，Firefox 会调用远程设置服务以获取所需的 ONNX WASM 运行时，并获取将要执行的推理任务的默认选项。

(3) 然后，Firefox 创建一个推理进程，这是一种特定类型的內容进程。该进程加载 Transformers.js 和 ONNX WASM 运行时。然后它触发推理调用。

(4) Transformers.js 库将根据要执行的推理任务和传递的不同选项来请求模型文件。这些调用会转发到 Firefox，Firefox 会查看 IndexDB 中有哪些可用文件。如果所需文件存在，它会将它们返回给推理进程。

(5) 如果不存在，它将通过访问模型中心触发下载过程。然后将其存储在 IndexDB 中