huggingface
diff --git a/‎packages/inference/package.json‎
Lines changed: 2 additions & 1 deletion b/‎packages/inference/package.json‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎packages/inference/src/lib/makeRequestOptions.ts‎
Lines changed: 43 additions & 20 deletions b/‎packages/inference/src/lib/makeRequestOptions.ts‎
Lines changed: 43 additions & 20 deletions
diff --git a/‎packages/inference/src/providers/fireworks-ai.ts‎
Lines changed: 1 addition & 1 deletion b/‎packages/inference/src/providers/fireworks-ai.ts‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎packages/inference/src/providers/hf-inference.ts‎
Lines changed: 1 addition & 1 deletion b/‎packages/inference/src/providers/hf-inference.ts‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎packages/inference/src/providers/nebius.ts‎
Lines changed: 3 additions & 3 deletions b/‎packages/inference/src/providers/nebius.ts‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎packages/inference/src/providers/novita.ts‎
Lines changed: 3 additions & 4 deletions b/‎packages/inference/src/providers/novita.ts‎
Lines changed: 3 additions & 4 deletions
diff --git a/‎packages/inference/src/providers/sambanova.ts‎
Lines changed: 1 addition & 1 deletion b/‎packages/inference/src/providers/sambanova.ts‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎packages/inference/src/providers/together.ts‎
Lines changed: 3 additions & 3 deletions b/‎packages/inference/src/providers/together.ts‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎packages/inference/src/snippets/curl.ts‎
Lines changed: 0 additions & 177 deletions b/‎packages/inference/src/snippets/curl.ts‎
Lines changed: 0 additions & 177 deletions
@@ -56,7 +56,8 @@
 		"prepublishOnly": "pnpm run build",
 		"test": "vitest run --config vitest.config.mts",
 		"test:browser": "vitest run --browser.name=chrome --browser.headless --config vitest.config.mts",
-		"check": "tsc"
+		"check": "tsc",
+		"dev": "tsup src/index.ts --format cjs,esm --watch"
 	},
 	"dependencies": {
 		"@huggingface/tasks": "workspace:^",
 
@@ -45,7 +45,8 @@ const providerConfigs: Record<InferenceProvider, ProviderConfig> = {
 };
 
 /**
- * Helper that prepares request arguments
+ * Helper that prepares request arguments.
+ * This async version handle the model ID resolution step.
  */
 export async function makeRequestOptions(
 	args: RequestArgs & {
@@ -56,17 +57,15 @@ export async function makeRequestOptions(
 		/** In most cases (unless we pass a endpointUrl) we know the task */
 		task?: InferenceTask;
 		chatCompletion?: boolean;
-		/* Used internally to generate inference snippets (in which case model mapping is done separately) */
-		skipModelIdResolution?: boolean;
 	}
 ): Promise<{ url: string; info: RequestInit }> {
-	const { accessToken, endpointUrl, provider: maybeProvider, model: maybeModel, ...remainingArgs } = args;
+	const { provider: maybeProvider, model: maybeModel } = args;
 	const provider = maybeProvider ?? "hf-inference";
 	const providerConfig = providerConfigs[provider];
+	const { task, chatCompletion } = options ?? {};
 
-	const { includeCredentials, task, chatCompletion, signal, skipModelIdResolution } = options ?? {};
-
-	if (endpointUrl && provider !== "hf-inference") {
+	// Validate inputs
+	if (args.endpointUrl && provider !== "hf-inference") {
 		throw new Error(`Cannot use endpointUrl with a third-party provider.`);
 	}
 	if (maybeModel && isUrl(maybeModel)) {
@@ -81,19 +80,43 @@ export async function makeRequestOptions(
 	if (providerConfig.clientSideRoutingOnly && !maybeModel) {
 		throw new Error(`Provider ${provider} requires a model ID to be passed directly.`);
 	}
+
 	// eslint-disable-next-line @typescript-eslint/no-non-null-assertion
 	const hfModel = maybeModel ?? (await loadDefaultModel(task!));
-	const model = skipModelIdResolution
-		? hfModel
-		: providerConfig.clientSideRoutingOnly
-		  ? // eslint-disable-next-line @typescript-eslint/no-non-null-assertion
-		    removeProviderPrefix(maybeModel!, provider)
-		  : // For closed-models API providers, one needs to pass the model ID directly (e.g. "gpt-3.5-turbo")
-		    await getProviderModelId({ model: hfModel, provider }, args, {
-					task,
-					chatCompletion,
-					fetch: options?.fetch,
-		    });
+	const resolvedModel = providerConfig.clientSideRoutingOnly
+		? // eslint-disable-next-line @typescript-eslint/no-non-null-assertion
+		  removeProviderPrefix(maybeModel!, provider)
+		: await getProviderModelId({ model: hfModel, provider }, args, {
+				task,
+				chatCompletion,
+				fetch: options?.fetch,
+		  });
+
+	// Use the sync version with the resolved model
+	return makeRequestOptionsFromResolvedModel(resolvedModel, args, options);
+}
+
+/**
+ * Helper that prepares request arguments. - for internal use only
+ * This sync version skips the model ID resolution step
+ */
+export function makeRequestOptionsFromResolvedModel(
+	resolvedModel: string,
+	args: RequestArgs & {
+		data?: Blob | ArrayBuffer;
+		stream?: boolean;
+	},
+	options?: Options & {
+		task?: InferenceTask;
+		chatCompletion?: boolean;
+	}
+): { url: string; info: RequestInit } {
+	const { accessToken, endpointUrl, provider: maybeProvider, model, ...remainingArgs } = args;
+
+	const provider = maybeProvider ?? "hf-inference";
+	const providerConfig = providerConfigs[provider];
+
+	const { includeCredentials, task, chatCompletion, signal } = options ?? {};
 
 	const authMethod = (() => {
 		if (providerConfig.clientSideRoutingOnly) {
@@ -123,7 +146,7 @@ export async function makeRequestOptions(
 					authMethod !== "provider-key"
 						? HF_HUB_INFERENCE_PROXY_TEMPLATE.replace("{{PROVIDER}}", provider)
 						: providerConfig.baseUrl,
-				model,
+				model: resolvedModel,
 				chatCompletion,
 				task,
 		  });
@@ -154,7 +177,7 @@ export async function makeRequestOptions(
 		: JSON.stringify(
 				providerConfig.makeBody({
 					args: remainingArgs as Record<string, unknown>,
-					model,
+					model: resolvedModel,
 					task,
 					chatCompletion,
 				})
 
@@ -30,7 +30,7 @@ const makeHeaders = (params: HeaderParams): Record<string, string> => {
 };
 
 const makeUrl = (params: UrlParams): string => {
-	if (params.task === "text-generation" && params.chatCompletion) {
+	if (params.chatCompletion) {
 		return `${params.baseUrl}/inference/v1/chat/completions`;
 	}
 	return `${params.baseUrl}/inference`;
 
@@ -29,7 +29,7 @@ const makeUrl = (params: UrlParams): string => {
 		/// when deployed on hf-inference, those two tasks are automatically compatible with one another.
 		return `${params.baseUrl}/pipeline/${params.task}/${params.model}`;
 	}
-	if (params.task === "text-generation" && params.chatCompletion) {
+	if (params.chatCompletion) {
 		return `${params.baseUrl}/models/${params.model}/v1/chat/completions`;
 	}
 	return `${params.baseUrl}/models/${params.model}`;
 
@@ -33,10 +33,10 @@ const makeUrl = (params: UrlParams): string => {
 	if (params.task === "text-to-image") {
 		return `${params.baseUrl}/v1/images/generations`;
 	}
+	if (params.chatCompletion) {
+		return `${params.baseUrl}/v1/chat/completions`;
+	}
 	if (params.task === "text-generation") {
-		if (params.chatCompletion) {
-			return `${params.baseUrl}/v1/chat/completions`;
-		}
 		return `${params.baseUrl}/v1/completions`;
 	}
 	return params.baseUrl;
 
@@ -30,10 +30,9 @@ const makeHeaders = (params: HeaderParams): Record<string, string> => {
 };
 
 const makeUrl = (params: UrlParams): string => {
-	if (params.task === "text-generation") {
-		if (params.chatCompletion) {
-			return `${params.baseUrl}/v3/openai/chat/completions`;
-		}
+	if (params.chatCompletion) {
+		return `${params.baseUrl}/v3/openai/chat/completions`;
+	} else if (params.task === "text-generation") {
 		return `${params.baseUrl}/v3/openai/completions`;
 	} else if (params.task === "text-to-video") {
 		return `${params.baseUrl}/v3/hf/${params.model}`;
 
@@ -30,7 +30,7 @@ const makeHeaders = (params: HeaderParams): Record<string, string> => {
 };
 
 const makeUrl = (params: UrlParams): string => {
-	if (params.task === "text-generation" && params.chatCompletion) {
+	if (params.chatCompletion) {
 		return `${params.baseUrl}/v1/chat/completions`;
 	}
 	return params.baseUrl;
 
@@ -33,10 +33,10 @@ const makeUrl = (params: UrlParams): string => {
 	if (params.task === "text-to-image") {
 		return `${params.baseUrl}/v1/images/generations`;
 	}
+	if (params.chatCompletion) {
+		return `${params.baseUrl}/v1/chat/completions`;
+	}
 	if (params.task === "text-generation") {
-		if (params.chatCompletion) {
-			return `${params.baseUrl}/v1/chat/completions`;
-		}
 		return `${params.baseUrl}/v1/completions`;
 	}
 	return params.baseUrl;
Original file line number	Diff line number	Diff line change
`@@ -30,7 +30,7 @@ const makeHeaders = (params: HeaderParams): Record<string, string> => {`
`30`	`30`	`};`
`31`	`31`
`32`	`32`	`const makeUrl = (params: UrlParams): string => {`
`33`		`- if (params.task === "text-generation" && params.chatCompletion) {`
	`33`	`+ if (params.chatCompletion) {`
`34`	`34`	return `${params.baseUrl}/inference/v1/chat/completions`;
`35`	`35`	`}`
`36`	`36`	return `${params.baseUrl}/inference`;
Original file line number	Diff line number	Diff line change
`@@ -29,7 +29,7 @@ const makeUrl = (params: UrlParams): string => {`
`29`	`29`	`/// when deployed on hf-inference, those two tasks are automatically compatible with one another.`
`30`	`30`	return `${params.baseUrl}/pipeline/${params.task}/${params.model}`;
`31`	`31`	`}`
`32`		`- if (params.task === "text-generation" && params.chatCompletion) {`
	`32`	`+ if (params.chatCompletion) {`
`33`	`33`	return `${params.baseUrl}/models/${params.model}/v1/chat/completions`;
`34`	`34`	`}`
`35`	`35`	return `${params.baseUrl}/models/${params.model}`;
Original file line number	Diff line number	Diff line change
`@@ -33,10 +33,10 @@ const makeUrl = (params: UrlParams): string => {`
`33`	`33`	`if (params.task === "text-to-image") {`
`34`	`34`	return `${params.baseUrl}/v1/images/generations`;
`35`	`35`	`}`
	`36`	`+ if (params.chatCompletion) {`
	`37`	+ return `${params.baseUrl}/v1/chat/completions`;
	`38`	`+ }`
`36`	`39`	`if (params.task === "text-generation") {`
`37`		`- if (params.chatCompletion) {`
`38`		- return `${params.baseUrl}/v1/chat/completions`;
`39`		`- }`
`40`	`40`	return `${params.baseUrl}/v1/completions`;
`41`	`41`	`}`
`42`	`42`	`return params.baseUrl;`