Marker-Inc-Korea
diff --git a/‎autorag/autorag/nodes/generator/openai_llm.py‎
Lines changed: 36 additions & 14 deletions b/‎autorag/autorag/nodes/generator/openai_llm.py‎
Lines changed: 36 additions & 14 deletions
@@ -17,10 +17,14 @@
 logger = logging.getLogger("AutoRAG")
 
 MAX_TOKEN_DICT = {  # model name : token limit
+	"gpt-4.5-preview": 128_000,
+	"gpt-4.5-preview-2025-02-27": 128_000,
+	"o1": 200_000,
 	"o1-preview": 128_000,
 	"o1-preview-2024-09-12": 128_000,
 	"o1-mini": 128_000,
 	"o1-mini-2024-09-12": 128_000,
+	"o3-mini": 200_000,
 	"gpt-4o-mini": 128_000,
 	"gpt-4o-mini-2024-07-18": 128_000,
 	"gpt-4o": 128_000,
@@ -57,7 +61,7 @@ def __init__(self, project_dir, llm: str, batch: int = 16, *args, **kwargs):
 		client_init_params = pop_params(AsyncOpenAI.__init__, kwargs)
 		self.client = AsyncOpenAI(**client_init_params)
 
-		if self.llm.startswith("o1"):
+		if self.llm.startswith("gpt-4.5"):
 			self.tokenizer = tiktoken.get_encoding("o200k_base")
 		else:
 			self.tokenizer = tiktoken.encoding_for_model(self.llm)
@@ -112,7 +116,7 @@ def _pure(
 			kwargs.pop("n")
 			logger.warning("parameter n does not effective. It always set to 1.")
 
-		# TODO: fix this after updating tiktoken for the o1 model. It is not yet supported yet.
+		# TODO: fix this after updating tiktoken for the gpt-4.5 model. It is not yet supported yet.
 		if truncate:
 			prompts = list(
 				map(
@@ -125,7 +129,7 @@ def _pure(
 
 		openai_chat_params = pop_params(self.client.chat.completions.create, kwargs)
 		loop = get_event_loop()
-		if self.llm.startswith("o1"):
+		if self.llm.startswith("o1") or self.llm.startswith("o3"):
 			tasks = [
 				self.get_result_o1(prompt, **openai_chat_params) for prompt in prompts
 			]
@@ -159,7 +163,7 @@ def structured_output(self, prompts: List[str], output_cls, **kwargs):
 			kwargs.pop("n")
 			logger.warning("parameter n does not effective. It always set to 1.")
 
-		# TODO: fix this after updating tiktoken for the o1 model. It is not yet supported yet.
+		# TODO: fix this after updating tiktoken for the gpt-4.5 model. It is not yet supported yet.
 		prompts = list(
 			map(
 				lambda prompt: truncate_by_token(
@@ -179,6 +183,7 @@ def structured_output(self, prompts: List[str], output_cls, **kwargs):
 		return result
 
 	async def astream(self, prompt: str, **kwargs):
+		# TODO: gpt-4.5-preview does not support logprobs. It should be fixed after the openai update.
 		if kwargs.get("logprobs") is not None:
 			kwargs.pop("logprobs")
 			logger.warning(
@@ -212,42 +217,59 @@ def stream(self, prompt: str, **kwargs):
 		raise NotImplementedError("stream method is not implemented yet.")
 
 	async def get_structured_result(self, prompt: str, output_cls, **kwargs):
+		logprobs = True
+		if self.llm.startswith("gpt-4.5"):
+			logprobs = False
 		response = await self.client.beta.chat.completions.parse(
 			model=self.llm,
 			messages=[
 				{"role": "user", "content": prompt},
 			],
 			response_format=output_cls,
-			logprobs=False,
+			logprobs=logprobs,
 			n=1,
 			**kwargs,
 		)
 		return response.choices[0].message.parsed
 
 	async def get_result(self, prompt: str, **kwargs):
+		# TODO: gpt-4.5-preview does not support logprobs. It should be fixed after the openai update.
+		logprobs = True
+		if self.llm.startswith("gpt-4.5"):
+			logprobs = False
 		response = await self.client.chat.completions.create(
 			model=self.llm,
 			messages=[
 				{"role": "user", "content": prompt},
 			],
-			logprobs=True,
+			logprobs=logprobs,
 			n=1,
 			**kwargs,
 		)
 		choice = response.choices[0]
 		answer = choice.message.content
-		logprobs = list(map(lambda x: x.logprob, choice.logprobs.content))
-		tokens = list(
-			map(
-				lambda x: self.tokenizer.encode(x.token, allowed_special="all")[0],
-				choice.logprobs.content,
+		# TODO: gpt-4.5-preview does not support logprobs. It should be fixed after the openai update.
+		if self.llm.startswith("gpt-4.5"):
+			tokens = self.tokenizer.encode(answer, allowed_special="all")
+			logprobs = [0.5] * len(tokens)
+			logger.warning("gpt-4.5-preview does not support logprobs yet.")
+		else:
+			logprobs = list(map(lambda x: x.logprob, choice.logprobs.content))
+			tokens = list(
+				map(
+					lambda x: self.tokenizer.encode(x.token, allowed_special="all")[0],
+					choice.logprobs.content,
+				)
 			)
-		)
-		assert len(tokens) == len(logprobs), "tokens and logprobs size is different."
+			assert len(tokens) == len(
+				logprobs
+			), "tokens and logprobs size is different."
 		return answer, tokens, logprobs
 
 	async def get_result_o1(self, prompt: str, **kwargs):
-		assert self.llm.startswith("o1"), "This function only supports o1 model."
+		assert self.llm.startswith("o1") or self.llm.startswith(
+			"o3"
+		), "This function only supports o1 or o3 model."
 		# The default temperature for the o1 model is 1. 1 is only supported.
 		# See https://platform.openai.com/docs/guides/reasoning about beta limitation of o1 models.
 		kwargs["temperature"] = 1