[Inference Providers] Async calls for text-to-video with fal.ai (#1292)

hanouticelina · julien-c · SBrandeis · web-flow · commit c0f38b032074 · 2025-03-24T15:18:40.000+01:00
## What does this PR do? This PR adds asynchronous polling to the fal.ai text-to-video generation. This allows running inference with models that may take > 2 min to generate results. The other motivation behind this PR is to align the Python and JS clients, the Python client has already been merged into main: huggingface/huggingface_hub#2927 ## Main Changes - Replaced static `baseUrl` property with `makeBaseUrl()` function across all providers. This is needed to be able to customize the base url based on the task. We want to use `FAL_AI_API_BASE_URL_QUEUE` for `text-to-video` only. I'm not convinced if it's the simplest and the best way to do that. - Added a `pollFalResponse()` for `text-to-video`(similarly to what it's done with BFL for `text-to-image`). Any refactoring suggestions are welcome! I'm willing to spend some additional time to make provider-specific updates easier to implement and better align our two clients 🙂 btw, I did not update the VCR tests as we've discussed that it'd be best to remove the VCR for `text-to-video`. Maybe we should remove them here? **EDIT**: removed the text-to-video tests in [f8a6386](f8a6386). I've tested it locally with [tencent/HunyuanVideo](https://huggingface.co/tencent/HunyuanVideo) for which the generation takes more than 2min and it works fine: https://github.com/user-attachments/assets/3cd38900-c4ed-4b28-ae79-8a4e724f58d1 --------- Co-authored-by: Julien Chaumond <julien@huggingface.co> Co-authored-by: Simon Brandeis <33657802+SBrandeis@users.noreply.github.com>
diff --git a/packages/inference/src/lib/makeRequestOptions.ts b/packages/inference/src/lib/makeRequestOptions.ts
@@ -143,10 +143,11 @@ export function makeRequestOptionsFromResolvedModel(
 			? endpointUrl + `/v1/chat/completions`
 			: endpointUrl
 		: providerConfig.makeUrl({
+				authMethod,
 				baseUrl:
 					authMethod !== "provider-key"
 						? HF_HUB_INFERENCE_PROXY_TEMPLATE.replace("{{PROVIDER}}", provider)
-						: providerConfig.baseUrl,
+						: providerConfig.makeBaseUrl(task),
 				model: resolvedModel,
 				chatCompletion,
 				task,
diff --git a/packages/inference/src/providers/black-forest-labs.ts b/packages/inference/src/providers/black-forest-labs.ts
@@ -14,10 +14,14 @@
  *
  * Thanks!
  */
-import type { ProviderConfig, UrlParams, HeaderParams, BodyParams } from "../types";
+import type { BodyParams, HeaderParams, ProviderConfig, UrlParams } from "../types";
 
 const BLACK_FOREST_LABS_AI_API_BASE_URL = "https://api.us1.bfl.ai";
 
+const makeBaseUrl = (): string => {
+	return BLACK_FOREST_LABS_AI_API_BASE_URL;
+};
+
 const makeBody = (params: BodyParams): Record<string, unknown> => {
 	return params.args;
 };
@@ -35,7 +39,7 @@ const makeUrl = (params: UrlParams): string => {
 };
 
 export const BLACK_FOREST_LABS_CONFIG: ProviderConfig = {
-	baseUrl: BLACK_FOREST_LABS_AI_API_BASE_URL,
+	makeBaseUrl,
 	makeBody,
 	makeHeaders,
 	makeUrl,
diff --git a/packages/inference/src/providers/cerebras.ts b/packages/inference/src/providers/cerebras.ts
@@ -14,10 +14,14 @@
  *
  * Thanks!
  */
-import type { ProviderConfig, UrlParams, HeaderParams, BodyParams } from "../types";
+import type { BodyParams, HeaderParams, ProviderConfig, UrlParams } from "../types";
 
 const CEREBRAS_API_BASE_URL = "https://api.cerebras.ai";
 
+const makeBaseUrl = (): string => {
+	return CEREBRAS_API_BASE_URL;
+};
+
 const makeBody = (params: BodyParams): Record<string, unknown> => {
 	return {
 		...params.args,
@@ -34,7 +38,7 @@ const makeUrl = (params: UrlParams): string => {
 };
 
 export const CEREBRAS_CONFIG: ProviderConfig = {
-	baseUrl: CEREBRAS_API_BASE_URL,
+	makeBaseUrl,
 	makeBody,
 	makeHeaders,
 	makeUrl,
diff --git a/packages/inference/src/providers/cohere.ts b/packages/inference/src/providers/cohere.ts
@@ -14,10 +14,14 @@
  *
  * Thanks!
  */
-import type { ProviderConfig, UrlParams, HeaderParams, BodyParams } from "../types";
+import type { BodyParams, HeaderParams, ProviderConfig, UrlParams } from "../types";
 
 const COHERE_API_BASE_URL = "https://api.cohere.com";
 
+const makeBaseUrl = (): string => {
+	return COHERE_API_BASE_URL;
+};
+
 const makeBody = (params: BodyParams): Record<string, unknown> => {
 	return {
 		...params.args,
@@ -34,7 +38,7 @@ const makeUrl = (params: UrlParams): string => {
 };
 
 export const COHERE_CONFIG: ProviderConfig = {
-	baseUrl: COHERE_API_BASE_URL,
+	makeBaseUrl,
 	makeBody,
 	makeHeaders,
 	makeUrl,
diff --git a/packages/inference/src/providers/fal-ai.ts b/packages/inference/src/providers/fal-ai.ts
@@ -14,9 +14,17 @@
  *
  * Thanks!
  */
-import type { ProviderConfig, UrlParams, HeaderParams, BodyParams } from "../types";
+import { InferenceOutputError } from "../lib/InferenceOutputError";
+import { isUrl } from "../lib/isUrl";
+import type { BodyParams, HeaderParams, InferenceTask, ProviderConfig, UrlParams } from "../types";
+import { delay } from "../utils/delay";
 
 const FAL_AI_API_BASE_URL = "https://fal.run";
+const FAL_AI_API_BASE_URL_QUEUE = "https://queue.fal.run";
+
+const makeBaseUrl = (task?: InferenceTask): string => {
+	return task === "text-to-video" ? FAL_AI_API_BASE_URL_QUEUE : FAL_AI_API_BASE_URL;
+};
 
 const makeBody = (params: BodyParams): Record<string, unknown> => {
 	return params.args;
@@ -29,12 +37,86 @@ const makeHeaders = (params: HeaderParams): Record<string, string> => {
 };
 
 const makeUrl = (params: UrlParams): string => {
-	return `${params.baseUrl}/${params.model}`;
+	const baseUrl = `${params.baseUrl}/${params.model}`;
+	if (params.authMethod !== "provider-key" && params.task === "text-to-video") {
+		return `${baseUrl}?_subdomain=queue`;
+	}
+	return baseUrl;
 };
 
 export const FAL_AI_CONFIG: ProviderConfig = {
-	baseUrl: FAL_AI_API_BASE_URL,
+	makeBaseUrl,
 	makeBody,
 	makeHeaders,
 	makeUrl,
 };
+
+export interface FalAiQueueOutput {
+	request_id: string;
+	status: string;
+	response_url: string;
+}
+
+export async function pollFalResponse(
+	res: FalAiQueueOutput,
+	url: string,
+	headers: Record<string, string>
+): Promise<Blob> {
+	const requestId = res.request_id;
+	if (!requestId) {
+		throw new InferenceOutputError("No request ID found in the response");
+	}
+	let status = res.status;
+
+	const parsedUrl = new URL(url);
+	const baseUrl = `${parsedUrl.protocol}//${parsedUrl.host}${
+		parsedUrl.host === "router.huggingface.co" ? "/fal-ai" : ""
+	}`;
+
+	// extracting the provider model id for status and result urls
+	// from the response as it might be different from the mapped model in `url`
+	const modelId = new URL(res.response_url).pathname;
+	const queryParams = parsedUrl.search;
+
+	const statusUrl = `${baseUrl}${modelId}/status${queryParams}`;
+	const resultUrl = `${baseUrl}${modelId}${queryParams}`;
+
+	while (status !== "COMPLETED") {
+		await delay(500);
+		const statusResponse = await fetch(statusUrl, { headers });
+
+		if (!statusResponse.ok) {
+			throw new InferenceOutputError("Failed to fetch response status from fal-ai API");
+		}
+		try {
+			status = (await statusResponse.json()).status;
+		} catch (error) {
+			throw new InferenceOutputError("Failed to parse status response from fal-ai API");
+		}
+	}
+
+	const resultResponse = await fetch(resultUrl, { headers });
+	let result: unknown;
+	try {
+		result = await resultResponse.json();
+	} catch (error) {
+		throw new InferenceOutputError("Failed to parse result response from fal-ai API");
+	}
+	if (
+		typeof result === "object" &&
+		!!result &&
+		"video" in result &&
+		typeof result.video === "object" &&
+		!!result.video &&
+		"url" in result.video &&
+		typeof result.video.url === "string" &&
+		isUrl(result.video.url)
+	) {
+		const urlResponse = await fetch(result.video.url);
+		return await urlResponse.blob();
+	} else {
+		throw new InferenceOutputError(
+			"Expected { video: { url: string } } result format, got instead: " + JSON.stringify(result)
+		);
+	}
+}
diff --git a/packages/inference/src/providers/fireworks-ai.ts b/packages/inference/src/providers/fireworks-ai.ts
@@ -14,10 +14,14 @@
  *
  * Thanks!
  */
-import type { ProviderConfig, UrlParams, HeaderParams, BodyParams } from "../types";
+import type { BodyParams, HeaderParams, ProviderConfig, UrlParams } from "../types";
 
 const FIREWORKS_AI_API_BASE_URL = "https://api.fireworks.ai";
 
+const makeBaseUrl = (): string => {
+	return FIREWORKS_AI_API_BASE_URL;
+};
+
 const makeBody = (params: BodyParams): Record<string, unknown> => {
 	return {
 		...params.args,
@@ -37,7 +41,7 @@ const makeUrl = (params: UrlParams): string => {
 };
 
 export const FIREWORKS_AI_CONFIG: ProviderConfig = {
-	baseUrl: FIREWORKS_AI_API_BASE_URL,
+	makeBaseUrl,
 	makeBody,
 	makeHeaders,
 	makeUrl,
diff --git a/packages/inference/src/providers/hf-inference.ts b/packages/inference/src/providers/hf-inference.ts
@@ -11,7 +11,11 @@
  * Thanks!
  */
 import { HF_ROUTER_URL } from "../config";
-import type { ProviderConfig, UrlParams, HeaderParams, BodyParams } from "../types";
+import type { BodyParams, HeaderParams, ProviderConfig, UrlParams } from "../types";
+
+const makeBaseUrl = (): string => {
+	return `${HF_ROUTER_URL}/hf-inference`;
+};
 
 const makeBody = (params: BodyParams): Record<string, unknown> => {
 	return {
@@ -36,7 +40,7 @@ const makeUrl = (params: UrlParams): string => {
 };
 
 export const HF_INFERENCE_CONFIG: ProviderConfig = {
-	baseUrl: `${HF_ROUTER_URL}/hf-inference`,
+	makeBaseUrl,
 	makeBody,
 	makeHeaders,
 	makeUrl,
diff --git a/packages/inference/src/providers/hyperbolic.ts b/packages/inference/src/providers/hyperbolic.ts
@@ -14,10 +14,14 @@
  *
  * Thanks!
  */
-import type { ProviderConfig, UrlParams, HeaderParams, BodyParams } from "../types";
+import type { BodyParams, HeaderParams, ProviderConfig, UrlParams } from "../types";
 
 const HYPERBOLIC_API_BASE_URL = "https://api.hyperbolic.xyz";
 
+const makeBaseUrl = (): string => {
+	return HYPERBOLIC_API_BASE_URL;
+};
+
 const makeBody = (params: BodyParams): Record<string, unknown> => {
 	return {
 		...params.args,
@@ -37,7 +41,7 @@ const makeUrl = (params: UrlParams): string => {
 };
 
 export const HYPERBOLIC_CONFIG: ProviderConfig = {
-	baseUrl: HYPERBOLIC_API_BASE_URL,
+	makeBaseUrl,
 	makeBody,
 	makeHeaders,
 	makeUrl,
diff --git a/packages/inference/src/providers/nebius.ts b/packages/inference/src/providers/nebius.ts
@@ -14,10 +14,14 @@
  *
  * Thanks!
  */
-import type { ProviderConfig, UrlParams, HeaderParams, BodyParams } from "../types";
+import type { BodyParams, HeaderParams, ProviderConfig, UrlParams } from "../types";
 
 const NEBIUS_API_BASE_URL = "https://api.studio.nebius.ai";
 
+const makeBaseUrl = (): string => {
+	return NEBIUS_API_BASE_URL;
+};
+
 const makeBody = (params: BodyParams): Record<string, unknown> => {
 	return {
 		...params.args,
@@ -43,7 +47,7 @@ const makeUrl = (params: UrlParams): string => {
 };
 
 export const NEBIUS_CONFIG: ProviderConfig = {
-	baseUrl: NEBIUS_API_BASE_URL,
+	makeBaseUrl,
 	makeBody,
 	makeHeaders,
 	makeUrl,
diff --git a/packages/inference/src/providers/novita.ts b/packages/inference/src/providers/novita.ts
@@ -14,10 +14,13 @@
  *
  * Thanks!
  */
-import type { ProviderConfig, UrlParams, HeaderParams, BodyParams } from "../types";
+import type { BodyParams, HeaderParams, ProviderConfig, UrlParams } from "../types";
 
 const NOVITA_API_BASE_URL = "https://api.novita.ai";
 
+const makeBaseUrl = (): string => {
+	return NOVITA_API_BASE_URL;
+};
 const makeBody = (params: BodyParams): Record<string, unknown> => {
 	return {
 		...params.args,
@@ -41,7 +44,7 @@ const makeUrl = (params: UrlParams): string => {
 };
 
 export const NOVITA_CONFIG: ProviderConfig = {
-	baseUrl: NOVITA_API_BASE_URL,
+	makeBaseUrl,
 	makeBody,
 	makeHeaders,
 	makeUrl,
diff --git a/packages/inference/src/providers/openai.ts b/packages/inference/src/providers/openai.ts
@@ -1,10 +1,14 @@
 /**
  * Special case: provider configuration for a private models provider (OpenAI in this case).
  */
-import type { ProviderConfig, UrlParams, HeaderParams, BodyParams } from "../types";
+import type { BodyParams, HeaderParams, ProviderConfig, UrlParams } from "../types";
 
 const OPENAI_API_BASE_URL = "https://api.openai.com";
 
+const makeBaseUrl = (): string => {
+	return OPENAI_API_BASE_URL;
+};
+
 const makeBody = (params: BodyParams): Record<string, unknown> => {
 	if (!params.chatCompletion) {
 		throw new Error("OpenAI only supports chat completions.");
@@ -27,7 +31,7 @@ const makeUrl = (params: UrlParams): string => {
 };
 
 export const OPENAI_CONFIG: ProviderConfig = {
-	baseUrl: OPENAI_API_BASE_URL,
+	makeBaseUrl,
 	makeBody,
 	makeHeaders,
 	makeUrl,
diff --git a/packages/inference/src/providers/replicate.ts b/packages/inference/src/providers/replicate.ts
@@ -14,10 +14,14 @@
  *
  * Thanks!
  */
-import type { ProviderConfig, UrlParams, HeaderParams, BodyParams } from "../types";
+import type { BodyParams, HeaderParams, ProviderConfig, UrlParams } from "../types";
 
 export const REPLICATE_API_BASE_URL = "https://api.replicate.com";
 
+const makeBaseUrl = (): string => {
+	return REPLICATE_API_BASE_URL;
+};
+
 const makeBody = (params: BodyParams): Record<string, unknown> => {
 	return {
 		input: params.args,
@@ -39,7 +43,7 @@ const makeUrl = (params: UrlParams): string => {
 };
 
 export const REPLICATE_CONFIG: ProviderConfig = {
-	baseUrl: REPLICATE_API_BASE_URL,
+	makeBaseUrl,
 	makeBody,
 	makeHeaders,
 	makeUrl,
diff --git a/packages/inference/src/providers/sambanova.ts b/packages/inference/src/providers/sambanova.ts
@@ -14,10 +14,14 @@
  *
  * Thanks!
  */
-import type { ProviderConfig, UrlParams, HeaderParams, BodyParams } from "../types";
+import type { BodyParams, HeaderParams, ProviderConfig, UrlParams } from "../types";
 
 const SAMBANOVA_API_BASE_URL = "https://api.sambanova.ai";
 
+const makeBaseUrl = (): string => {
+	return SAMBANOVA_API_BASE_URL;
+};
+
 const makeBody = (params: BodyParams): Record<string, unknown> => {
 	return {
 		...params.args,
@@ -37,7 +41,7 @@ const makeUrl = (params: UrlParams): string => {
 };
 
 export const SAMBANOVA_CONFIG: ProviderConfig = {
-	baseUrl: SAMBANOVA_API_BASE_URL,
+	makeBaseUrl,
 	makeBody,
 	makeHeaders,
 	makeUrl,
diff --git a/packages/inference/src/providers/together.ts b/packages/inference/src/providers/together.ts
diff --git a/packages/inference/src/tasks/cv/textToVideo.ts b/packages/inference/src/tasks/cv/textToVideo.ts
diff --git a/packages/inference/src/types.ts b/packages/inference/src/types.ts
diff --git a/packages/inference/test/InferenceClient.spec.ts b/packages/inference/test/InferenceClient.spec.ts
diff --git a/packages/inference/test/tapes.json b/packages/inference/test/tapes.json