1Panel-dev
diff --git a/‎apps/application/flow/step_node/__init__.py‎
Lines changed: 4 additions & 1 deletion b/‎apps/application/flow/step_node/__init__.py‎
Lines changed: 4 additions & 1 deletion
diff --git a/‎apps/application/flow/step_node/image_to_video_step_node/__init__.py‎
Lines changed: 3 additions & 0 deletions b/‎apps/application/flow/step_node/image_to_video_step_node/__init__.py‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎apps/application/flow/step_node/image_to_video_step_node/i_image_to_video_node.py‎
Lines changed: 64 additions & 0 deletions b/‎apps/application/flow/step_node/image_to_video_step_node/i_image_to_video_node.py‎
Lines changed: 64 additions & 0 deletions
diff --git a/‎apps/application/flow/step_node/image_to_video_step_node/impl/__init__.py‎
Lines changed: 3 additions & 0 deletions b/‎apps/application/flow/step_node/image_to_video_step_node/impl/__init__.py‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎apps/application/flow/step_node/image_to_video_step_node/impl/base_image_to_video_node.py‎
Lines changed: 153 additions & 0 deletions b/‎apps/application/flow/step_node/image_to_video_step_node/impl/base_image_to_video_node.py‎
Lines changed: 153 additions & 0 deletions
diff --git a/‎apps/application/flow/step_node/text_to_video_step_node/__init__.py‎
Lines changed: 3 additions & 0 deletions b/‎apps/application/flow/step_node/text_to_video_step_node/__init__.py‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎apps/application/flow/step_node/text_to_video_step_node/i_text_to_video_node.py‎
Lines changed: 45 additions & 0 deletions b/‎apps/application/flow/step_node/text_to_video_step_node/i_text_to_video_node.py‎
Lines changed: 45 additions & 0 deletions
diff --git a/‎apps/application/flow/step_node/text_to_video_step_node/impl/__init__.py‎
Lines changed: 3 additions & 0 deletions b/‎apps/application/flow/step_node/text_to_video_step_node/impl/__init__.py‎
Lines changed: 3 additions & 0 deletions
@@ -13,6 +13,7 @@
 from .document_extract_node import *
 from .form_node import *
 from .image_generate_step_node import *
+from .image_to_video_step_node import BaseImageToVideoNode
 from .image_understand_step_node import *
 from .mcp_node import BaseMcpNode
 from .question_node import *
@@ -21,6 +22,7 @@
 from .speech_to_text_step_node import BaseSpeechToTextNode
 from .start_node import *
 from .text_to_speech_step_node.impl.base_text_to_speech_node import BaseTextToSpeechNode
+from .text_to_video_step_node.impl.base_text_to_video_node import BaseTextToVideoNode
 from .tool_lib_node import *
 from .tool_node import *
 from .variable_assign_node import BaseVariableAssignNode
@@ -31,7 +33,8 @@
              BaseToolNodeNode, BaseToolLibNodeNode, BaseRerankerNode, BaseApplicationNode,
              BaseDocumentExtractNode,
              BaseImageUnderstandNode, BaseFormNode, BaseSpeechToTextNode, BaseTextToSpeechNode,
-             BaseImageGenerateNode, BaseVariableAssignNode, BaseMcpNode,BaseIntentNode]
+             BaseImageGenerateNode, BaseVariableAssignNode, BaseMcpNode, BaseTextToVideoNode, BaseImageToVideoNode,
+             BaseIntentNode]
 
 
 def get_node(node_type):
 
@@ -0,0 +1,3 @@
+# coding=utf-8
+
+from .impl import *
@@ -0,0 +1,64 @@
+# coding=utf-8
+
+from typing import Type
+
+from django.utils.translation import gettext_lazy as _
+from rest_framework import serializers
+
+from application.flow.i_step_node import INode, NodeResult
+
+
+class ImageToVideoNodeSerializer(serializers.Serializer):
+    model_id = serializers.CharField(required=True, label=_("Model id"))
+
+    prompt = serializers.CharField(required=True, label=_("Prompt word (positive)"))
+
+    negative_prompt = serializers.CharField(required=False, label=_("Prompt word (negative)"),
+                                            allow_null=True, allow_blank=True, )
+    # 多轮对话数量
+    dialogue_number = serializers.IntegerField(required=False, default=0,
+                                               label=_("Number of multi-round conversations"))
+
+    dialogue_type = serializers.CharField(required=False, default='NODE',
+                                          label=_("Conversation storage type"))
+
+    is_result = serializers.BooleanField(required=False,
+                                         label=_('Whether to return content'))
+
+    model_params_setting = serializers.JSONField(required=False, default=dict,
+                                                 label=_("Model parameter settings"))
+
+    first_frame_url = serializers.ListField(required=True, label=_("First frame url"))
+    last_frame_url = serializers.ListField(required=False, label=_("Last frame url"))
+
+
+class IImageToVideoNode(INode):
+    type = 'image-to-video-node'
+
+    def get_node_params_serializer_class(self) -> Type[serializers.Serializer]:
+        return ImageToVideoNodeSerializer
+
+    def _run(self):
+        first_frame_url = self.workflow_manage.get_reference_field(
+            self.node_params_serializer.data.get('first_frame_url')[0],
+            self.node_params_serializer.data.get('first_frame_url')[1:])
+        if first_frame_url is []:
+            raise ValueError(
+                _("First frame url cannot be empty"))
+        last_frame_url = None
+        if self.node_params_serializer.data.get('last_frame_url') is not None and self.node_params_serializer.data.get(
+                'last_frame_url') != []:
+            last_frame_url = self.workflow_manage.get_reference_field(
+                self.node_params_serializer.data.get('last_frame_url')[0],
+                self.node_params_serializer.data.get('last_frame_url')[1:])
+        node_params_data = {k: v for k, v in self.node_params_serializer.data.items()
+                            if k not in ['first_frame_url', 'last_frame_url']}
+        return self.execute(first_frame_url=first_frame_url, last_frame_url=last_frame_url,
+                            **node_params_data, **self.flow_params_serializer.data)
+
+    def execute(self, model_id, prompt, negative_prompt, dialogue_number, dialogue_type, history_chat_record, chat_id,
+                model_params_setting,
+                chat_record_id,
+                first_frame_url, last_frame_url,
+                **kwargs) -> NodeResult:
+        pass
@@ -0,0 +1,3 @@
+# coding=utf-8
+
+from .base_image_to_video_node import BaseImageToVideoNode
@@ -0,0 +1,153 @@
+# coding=utf-8
+import base64
+from functools import reduce
+from typing import List
+
+import requests
+from django.db.models import QuerySet
+from langchain_core.messages import BaseMessage, HumanMessage, AIMessage
+
+from application.flow.i_step_node import NodeResult
+from application.flow.step_node.image_to_video_step_node.i_image_to_video_node import IImageToVideoNode
+from common.utils.common import bytes_to_uploaded_file
+from knowledge.models import FileSourceType, File
+from oss.serializers.file import FileSerializer, mime_types
+from models_provider.tools import get_model_instance_by_model_workspace_id
+
+
+class BaseImageToVideoNode(IImageToVideoNode):
+    def save_context(self, details, workflow_manage):
+        self.context['answer'] = details.get('answer')
+        self.context['question'] = details.get('question')
+        if self.node_params.get('is_result', False):
+            self.answer_text = details.get('answer')
+
+    def execute(self, model_id, prompt, negative_prompt, dialogue_number, dialogue_type, history_chat_record, chat_id,
+                model_params_setting,
+                chat_record_id,
+                first_frame_url, last_frame_url=None,
+                **kwargs) -> NodeResult:
+        application = self.workflow_manage.work_flow_post_handler.chat_info.application
+        workspace_id = self.workflow_manage.get_body().get('workspace_id')
+        ttv_model = get_model_instance_by_model_workspace_id(model_id, workspace_id,
+                                                             **model_params_setting)
+        history_message = self.get_history_message(history_chat_record, dialogue_number)
+        self.context['history_message'] = history_message
+        question = self.generate_prompt_question(prompt)
+        self.context['question'] = question
+        message_list = self.generate_message_list(question, history_message)
+        self.context['message_list'] = message_list
+        self.context['dialogue_type'] = dialogue_type
+        self.context['negative_prompt'] = negative_prompt
+        self.context['first_frame_url'] = first_frame_url
+        self.context['last_frame_url'] = last_frame_url
+        # 处理首尾帧图片 这块可以是url 也可以是file_id 如果是url 可以直接传递给模型  如果是file_id 需要传base64
+        # 判断是不是 url
+        first_frame_url = self.get_file_base64(first_frame_url)
+        last_frame_url = self.get_file_base64(last_frame_url)
+        video_urls = ttv_model.generate_video(question, negative_prompt, first_frame_url, last_frame_url)
+        # 保存图片
+        if video_urls is None:
+            return NodeResult({'answer': '生成视频失败'}, {})
+        file_name = 'generated_video.mp4'
+        if isinstance(video_urls, str) and video_urls.startswith('http'):
+            video_urls = requests.get(video_urls).content
+        file = bytes_to_uploaded_file(video_urls, file_name)
+        meta = {
+            'debug': False if application.id else True,
+            'chat_id': chat_id,
+            'application_id': str(application.id) if application.id else None,
+        }
+        file_url = FileSerializer(data={
+            'file': file,
+            'meta': meta,
+            'source_id': meta['application_id'],
+            'source_type': FileSourceType.APPLICATION.value
+        }).upload()
+        video_label = f'<video src="{file_url}" controls style="max-width: 100%; width: 100%; height: auto; max-height: 60vh;"></video>'
+        video_list = [{'file_id': file_url.split('/')[-1], 'file_name': file_name, 'url': file_url}]
+        return NodeResult({'answer': video_label, 'chat_model': ttv_model, 'message_list': message_list,
+                           'video': video_list,
+                           'history_message': history_message, 'question': question}, {})
+
+    def get_file_base64(self, image_url):
+        if isinstance(image_url, list):
+            image_url = image_url[0].get('file_id')
+        if isinstance(image_url, str) and not image_url.startswith('http'):
+            file = QuerySet(File).filter(id=image_url).first()
+            file_bytes = file.get_bytes()
+            # 如果我不知道content_type 可以用 magic 库去检测
+            file_type = file.file_name.split(".")[-1].lower()
+            content_type = mime_types.get(file_type, 'application/octet-stream')
+            encoded_bytes = base64.b64encode(file_bytes)
+            return f'data:{content_type};base64,{encoded_bytes.decode()}'
+        return image_url
+
+    def generate_history_ai_message(self, chat_record):
+        for val in chat_record.details.values():
+            if self.node.id == val['node_id'] and 'image_list' in val:
+                if val['dialogue_type'] == 'WORKFLOW':
+                    return chat_record.get_ai_message()
+                image_list = val['image_list']
+                return AIMessage(content=[
+                    *[{'type': 'image_url', 'image_url': {'url': f'{file_url}'}} for file_url in image_list]
+                ])
+        return chat_record.get_ai_message()
+
+    def get_history_message(self, history_chat_record, dialogue_number):
+        start_index = len(history_chat_record) - dialogue_number
+        history_message = reduce(lambda x, y: [*x, *y], [
+            [self.generate_history_human_message(history_chat_record[index]),
+             self.generate_history_ai_message(history_chat_record[index])]
+            for index in
+            range(start_index if start_index > 0 else 0, len(history_chat_record))], [])
+        return history_message
+
+    def generate_history_human_message(self, chat_record):
+
+        for data in chat_record.details.values():
+            if self.node.id == data['node_id'] and 'image_list' in data:
+                image_list = data['image_list']
+                if len(image_list) == 0 or data['dialogue_type'] == 'WORKFLOW':
+                    return HumanMessage(content=chat_record.problem_text)
+                return HumanMessage(content=data['question'])
+        return HumanMessage(content=chat_record.problem_text)
+
+    def generate_prompt_question(self, prompt):
+        return self.workflow_manage.generate_prompt(prompt)
+
+    def generate_message_list(self, question: str, history_message):
+        return [
+            *history_message,
+            question
+        ]
+
+    @staticmethod
+    def reset_message_list(message_list: List[BaseMessage], answer_text):
+        result = [{'role': 'user' if isinstance(message, HumanMessage) else 'ai', 'content': message.content} for
+                  message
+                  in
+                  message_list]
+        result.append({'role': 'ai', 'content': answer_text})
+        return result
+
+    def get_details(self, index: int, **kwargs):
+        return {
+            'name': self.node.properties.get('stepName'),
+            "index": index,
+            'run_time': self.context.get('run_time'),
+            'history_message': [{'content': message.content, 'role': message.type} for message in
+                                (self.context.get('history_message') if self.context.get(
+                                    'history_message') is not None else [])],
+            'question': self.context.get('question'),
+            'answer': self.context.get('answer'),
+            'type': self.node.type,
+            'message_tokens': self.context.get('message_tokens'),
+            'answer_tokens': self.context.get('answer_tokens'),
+            'status': self.status,
+            'err_message': self.err_message,
+            'first_frame_url': self.context.get('first_frame_url'),
+            'last_frame_url': self.context.get('last_frame_url'),
+            'dialogue_type': self.context.get('dialogue_type'),
+            'negative_prompt': self.context.get('negative_prompt'),
+        }
@@ -0,0 +1,3 @@
+# coding=utf-8
+
+from .impl import *
@@ -0,0 +1,45 @@
+# coding=utf-8
+
+from typing import Type
+
+from django.utils.translation import gettext_lazy as _
+from rest_framework import serializers
+
+from application.flow.i_step_node import INode, NodeResult
+
+
+class TextToVideoNodeSerializer(serializers.Serializer):
+    model_id = serializers.CharField(required=True, label=_("Model id"))
+
+    prompt = serializers.CharField(required=True, label=_("Prompt word (positive)"))
+
+    negative_prompt = serializers.CharField(required=False, label=_("Prompt word (negative)"),
+                                            allow_null=True, allow_blank=True, )
+    # 多轮对话数量
+    dialogue_number = serializers.IntegerField(required=False, default=0,
+                                               label=_("Number of multi-round conversations"))
+
+    dialogue_type = serializers.CharField(required=False, default='NODE',
+                                          label=_("Conversation storage type"))
+
+    is_result = serializers.BooleanField(required=False,
+                                         label=_('Whether to return content'))
+
+    model_params_setting = serializers.JSONField(required=False, default=dict,
+                                                 label=_("Model parameter settings"))
+
+
+class ITextToVideoNode(INode):
+    type = 'text-to-video-node'
+
+    def get_node_params_serializer_class(self) -> Type[serializers.Serializer]:
+        return TextToVideoNodeSerializer
+
+    def _run(self):
+        return self.execute(**self.node_params_serializer.data, **self.flow_params_serializer.data)
+
+    def execute(self, model_id, prompt, negative_prompt, dialogue_number, dialogue_type, history_chat_record, chat_id,
+                model_params_setting,
+                chat_record_id,
+                **kwargs) -> NodeResult:
+        pass
@@ -0,0 +1,3 @@
+# coding=utf-8
+
+from .base_text_to_video_node import BaseTextToVideoNode
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,3 @@`
	`1`	`+# coding=utf-8`
	`2`	`+`
	`3`	`+from .impl import *`
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,3 @@`
	`1`	`+# coding=utf-8`
	`2`	`+`
	`3`	`+from .base_image_to_video_node import BaseImageToVideoNode`
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,3 @@`
	`1`	`+# coding=utf-8`
	`2`	`+`
	`3`	`+from .base_text_to_video_node import BaseTextToVideoNode`