|
553 | 553 | 'cache_dir': 'BAAI--bge-small-en-v1.5', |
554 | 554 | 'type': 'vector', |
555 | 555 | 'parameters': '33.4m', |
556 | | - 'precision': 'float32' |
| 556 | + 'precision': 'float32', |
| 557 | + 'license': 'mit', |
557 | 558 | }, |
558 | 559 | { |
559 | 560 | 'name': 'bge-base-en-v1.5', |
|
564 | 565 | 'cache_dir': 'BAAI--bge-base-en-v1.5', |
565 | 566 | 'type': 'vector', |
566 | 567 | 'parameters': '109m', |
567 | | - 'precision': 'float32' |
| 568 | + 'precision': 'float32', |
| 569 | + 'license': 'mit', |
568 | 570 | }, |
569 | 571 | { |
570 | 572 | 'name': 'bge-large-en-v1.5', |
|
575 | 577 | 'cache_dir': 'BAAI--bge-large-en-v1.5', |
576 | 578 | 'type': 'vector', |
577 | 579 | 'parameters': '335m', |
578 | | - 'precision': 'float32' |
| 580 | + 'precision': 'float32', |
| 581 | + 'license': 'mit', |
579 | 582 | }, |
580 | 583 | # { |
581 | 584 | # 'name': 'bge-code-v1',# transformers 4.49.0 |
|
586 | 589 | # 'cache_dir': 'BAAI--bge-code-v1', |
587 | 590 | # 'type': 'vector', |
588 | 591 | # 'parameters': '1540m', |
589 | | - # 'precision': 'float32' |
| 592 | + # 'precision': 'float32', |
| 593 | + # 'license': 'apache-2.0', |
590 | 594 | # }, |
591 | 595 | ], |
592 | 596 | 'IBM': [ |
|
599 | 603 | 'cache_dir': 'ibm-granite--granite-embedding-30m-english', |
600 | 604 | 'type': 'vector', |
601 | 605 | 'parameters': '30.3m', |
602 | | - 'precision': 'bfloat16' |
| 606 | + 'precision': 'bfloat16', |
| 607 | + 'license': 'apache-2.0', |
603 | 608 | }, |
604 | 609 | { |
605 | 610 | 'name': 'Granite-125m-English', |
|
610 | 615 | 'cache_dir': 'ibm-granite--granite-embedding-125m-english', |
611 | 616 | 'type': 'vector', |
612 | 617 | 'parameters': '125m', |
613 | | - 'precision': 'bfloat16' |
| 618 | + 'precision': 'bfloat16', |
| 619 | + 'license': 'apache-2.0', |
614 | 620 | }, |
615 | 621 | ], |
616 | 622 | 'infly': [ |
|
623 | 629 | 'cache_dir': 'infly--inf-retriever-v1-1.5b', |
624 | 630 | 'type': 'vector', |
625 | 631 | 'parameters': '1540m', |
626 | | - 'precision': 'bfloat16' |
| 632 | + 'precision': 'bfloat16', |
| 633 | + 'license': 'apache-2.0', |
627 | 634 | }, |
628 | 635 | { |
629 | 636 | 'name': 'inf-retriever-v1-7b',# transformers 4.44.2 |
|
634 | 641 | 'cache_dir': 'infly--inf-retriever-v1-7b', |
635 | 642 | 'type': 'vector', |
636 | 643 | 'parameters': '7070m', |
637 | | - 'precision': 'bfloat16' |
| 644 | + 'precision': 'bfloat16', |
| 645 | + 'license': 'apache-2.0', |
638 | 646 | }, |
639 | 647 | ], |
640 | 648 | 'intfloat': [ |
|
647 | 655 | 'cache_dir': 'intfloat--e5-small-v2', |
648 | 656 | 'type': 'vector', |
649 | 657 | 'parameters': '33.4m', |
650 | | - 'precision': 'float32' |
| 658 | + 'precision': 'float32', |
| 659 | + 'license': 'mit', |
651 | 660 | }, |
652 | 661 | { |
653 | 662 | 'name': 'e5-base-v2', |
|
658 | 667 | 'cache_dir': 'intfloat--e5-base-v2', |
659 | 668 | 'type': 'vector', |
660 | 669 | 'parameters': '109m', |
661 | | - 'precision': 'float32' |
| 670 | + 'precision': 'float32', |
| 671 | + 'license': 'mit', |
662 | 672 | }, |
663 | 673 | { |
664 | 674 | 'name': 'e5-large-v2', |
|
669 | 679 | 'cache_dir': 'intfloat--e5-large-v2', |
670 | 680 | 'type': 'vector', |
671 | 681 | 'parameters': '335m', |
672 | | - 'precision': 'float32' |
| 682 | + 'precision': 'float32', |
| 683 | + 'license': 'mit', |
673 | 684 | }, |
674 | 685 | ], |
675 | 686 | 'Qwen': [ |
|
682 | 693 | 'cache_dir': 'Qwen--Qwen3-Embedding-0.6B', |
683 | 694 | 'type': 'vector', |
684 | 695 | 'parameters': '596m', |
685 | | - 'precision': 'bfloat16' |
| 696 | + 'precision': 'bfloat16', |
| 697 | + 'license': 'apache-2.0', |
686 | 698 | }, |
687 | 699 | { |
688 | 700 | 'name': 'Qwen3-Embedding-4B', |
|
693 | 705 | 'cache_dir': 'Qwen--Qwen3-Embedding-4B', |
694 | 706 | 'type': 'vector', |
695 | 707 | 'parameters': '4020m', |
696 | | - 'precision': 'bfloat16' |
| 708 | + 'precision': 'bfloat16', |
| 709 | + 'license': 'apache-2.0', |
697 | 710 | }, |
698 | 711 | { |
699 | 712 | 'name': 'Qwen3-Embedding-8B', |
|
704 | 717 | 'cache_dir': 'Qwen--Qwen3-Embedding-8B', |
705 | 718 | 'type': 'vector', |
706 | 719 | 'parameters': '7570m', |
707 | | - 'precision': 'bfloat16' |
| 720 | + 'precision': 'bfloat16', |
| 721 | + 'license': 'apache-2.0', |
708 | 722 | }, |
709 | 723 | ], |
710 | 724 | 'Snowflake': [ |
|
717 | 731 | 'cache_dir': 'Snowflake--snowflake-arctic-embed-m-v2.0', |
718 | 732 | 'type': 'vector', |
719 | 733 | 'parameters': '305m', |
720 | | - 'precision': 'float32' |
| 734 | + 'precision': 'float32', |
| 735 | + 'license': 'apache-2.0', |
721 | 736 | }, |
722 | 737 | { |
723 | 738 | 'name': 'arctic-embed-l-v2.0', |
|
728 | 743 | 'cache_dir': 'Snowflake--snowflake-arctic-embed-l-v2.0', |
729 | 744 | 'type': 'vector', |
730 | 745 | 'parameters': '568m', |
731 | | - 'precision': 'float32' |
| 746 | + 'precision': 'float32', |
| 747 | + 'license': 'apache-2.0', |
732 | 748 | }, |
733 | 749 | ], |
734 | 750 | } |
|
742 | 758 | 'cache_dir': 'OpenGVLab--InternVL3-1B', |
743 | 759 | 'requires_cuda': False, |
744 | 760 | 'vram': '2.4 GB', |
745 | | - 'loader': 'loader_internvl' |
| 761 | + 'loader': 'loader_internvl', |
| 762 | + 'license': 'apache-2.0', |
746 | 763 | }, |
747 | 764 | 'Ovis2 - 1b': { |
748 | 765 | 'precision': 'bfloat16', |
|
752 | 769 | 'cache_dir': 'AIDC-AI--Ovis2-1B', |
753 | 770 | 'requires_cuda': False, |
754 | 771 | 'vram': '2.4 GB', |
755 | | - 'loader': 'loader_ovis' |
| 772 | + 'loader': 'loader_ovis', |
| 773 | + 'license': 'apache-2.0', |
756 | 774 | }, |
757 | 775 | 'InternVL3 - 2b': { |
758 | 776 | 'precision': 'bfloat16', |
|
762 | 780 | 'cache_dir': 'OpenGVLab--InternVL3-2B', |
763 | 781 | 'requires_cuda': False, |
764 | 782 | 'vram': '3.2 GB', |
765 | | - 'loader': 'loader_internvl' |
| 783 | + 'loader': 'loader_internvl', |
| 784 | + 'license': 'apache-2.0', |
766 | 785 | }, |
767 | 786 | 'Granite Vision - 2b': {# transformers 4.46.0.dev0 |
768 | 787 | 'precision': 'bfloat16', |
|
772 | 791 | 'cache_dir': 'ibm-granite--granite-vision-3.2-2b', |
773 | 792 | 'requires_cuda': False, |
774 | 793 | 'vram': '4.1 GB', |
775 | | - 'loader': 'loader_granite' |
| 794 | + 'loader': 'loader_granite', |
| 795 | + 'license': 'apache-2.0', |
776 | 796 | }, |
777 | 797 | 'Ovis2 - 2b': { |
778 | 798 | 'precision': 'bfloat16', |
|
782 | 802 | 'cache_dir': 'AIDC-AI--Ovis2-2B', |
783 | 803 | 'requires_cuda': False, |
784 | 804 | 'vram': '2.4 GB', |
785 | | - 'loader': 'loader_ovis' |
| 805 | + 'loader': 'loader_ovis', |
| 806 | + 'license': 'apache-2.0', |
786 | 807 | }, |
787 | 808 | 'Qwen VL - 3b': { |
788 | 809 | 'precision': 'bfloat16', |
|
792 | 813 | 'cache_dir': 'Qwen--Qwen2.5-VL-3B-Instruct', |
793 | 814 | 'requires_cuda': True, |
794 | 815 | 'vram': '6.3 GB', |
795 | | - 'loader': 'loader_qwenvl' |
| 816 | + 'loader': 'loader_qwenvl', |
| 817 | + 'license': 'Custom Non-Commercial', |
796 | 818 | }, |
797 | 819 | 'InternVL3 - 8b': { |
798 | 820 | 'precision': 'bfloat16', |
|
802 | 824 | 'cache_dir': 'OpenGVLab--InternVL3-8B', |
803 | 825 | 'requires_cuda': True, |
804 | 826 | 'vram': '8.2 GB', |
805 | | - 'loader': 'loader_internvl' |
| 827 | + 'loader': 'loader_internvl', |
| 828 | + 'license': 'apache-2.0', |
806 | 829 | }, |
807 | 830 | 'Qwen VL - 7b': {# transformers 4.41.2 |
808 | 831 | 'precision': 'bfloat16', |
|
812 | 835 | 'cache_dir': 'Qwen--Qwen2.5-VL-7B-Instruct', |
813 | 836 | 'requires_cuda': True, |
814 | 837 | 'vram': '9.6 GB', |
815 | | - 'loader': 'loader_qwenvl' |
| 838 | + 'loader': 'loader_qwenvl', |
| 839 | + 'license': 'Custom Non-Commercial', |
| 840 | + }, |
| 841 | + 'GLM-4.1V-9B-Thinking': {# transformers 4.53.2 |
| 842 | + 'precision': 'bfloat16', |
| 843 | + 'quant': '4-bit', |
| 844 | + 'size': '9b', |
| 845 | + 'repo_id': 'THUDM/GLM-4.1V-9B-Thinking', |
| 846 | + 'cache_dir': 'THUDM--GLM-4.1V-9B-Thinking', |
| 847 | + 'requires_cuda': True, |
| 848 | + 'vram': '9.9 GB', |
| 849 | + 'loader': 'loader_glmv4_thinking', |
| 850 | + 'license': 'mit', |
816 | 851 | }, |
817 | 852 | 'THUDM glm4v - 9b': {# transformers 4.44.0 |
818 | 853 | 'precision': 'bfloat16', |
|
832 | 867 | 'cache_dir': 'ctranslate2-4you--molmo-7B-D-0924-bnb-4bit', |
833 | 868 | 'requires_cuda': True, |
834 | 869 | 'vram': '10.5 GB', |
835 | | - 'loader': 'loader_molmo' |
| 870 | + 'loader': 'loader_molmo', |
| 871 | + 'license': 'apache-2.0', |
836 | 872 | }, |
837 | 873 | 'InternVL3 - 14b': { |
838 | 874 | 'precision': 'bfloat16', |
|
842 | 878 | 'cache_dir': 'OpenGVLab--InternVL3-14B', |
843 | 879 | 'requires_cuda': True, |
844 | 880 | 'vram': '12.6 GB', |
845 | | - 'loader': 'loader_internvl' |
| 881 | + 'loader': 'loader_internvl', |
| 882 | + 'license': 'apache-2.0', |
846 | 883 | }, |
847 | 884 | } |
848 | 885 |
|
|
853 | 890 | 'repo_id': 'ctranslate2-4you/GOT-OCR2_0-Customized', |
854 | 891 | 'cache_dir': 'ctranslate2-4you--GOT-OCR2_0-Customized', |
855 | 892 | 'requires_cuda': True, |
| 893 | + 'license': 'apache-2.0', |
856 | 894 | }, |
857 | 895 | } |
858 | 896 |
|
|
865 | 903 | "vram": "2GB", |
866 | 904 | "precision": "float32", |
867 | 905 | "gated": False, |
| 906 | + 'license': 'apache-2.0', |
868 | 907 | "allow_patterns": [ |
869 | 908 | "voices/**", |
870 | 909 | "config.json", |
|
883 | 922 | "vram": "4GB", |
884 | 923 | "precision": "float32", |
885 | 924 | "gated": False, |
| 925 | + 'license': 'mit', |
886 | 926 | "allow_patterns": [ |
887 | 927 | "voices/**", |
888 | 928 | "config.json", |
|
909 | 949 | "vram": "4GB", |
910 | 950 | "precision": "float32", |
911 | 951 | "gated": False, |
| 952 | + 'license': 'mit', |
912 | 953 | "allow_patterns": [ |
913 | 954 | "voices/**", |
914 | 955 | "config.json", |
|
935 | 976 | "vram": "4GB", |
936 | 977 | "precision": "fp32", |
937 | 978 | "gated": False, |
| 979 | + 'license': 'mit', |
938 | 980 | "allow_patterns": [ |
939 | 981 | "voices/**", |
940 | 982 | "config.json", |
|
961 | 1003 | "vram": "4GB", |
962 | 1004 | "precision": "fp32", |
963 | 1005 | "gated": False, |
| 1006 | + 'license': 'CCA Non-Commercial 4.0', |
964 | 1007 | "allow_patterns": [ |
965 | 1008 | "asset/**", |
966 | 1009 | "config/**", |
|
977 | 1020 | } |
978 | 1021 |
|
979 | 1022 | JEEVES_MODELS = { |
980 | | - "Exaone - 2.4b": { |
981 | | - "original_repo": "LGAI-EXAONE/EXAONE-3.5-2.4B-Instruct", |
982 | | - "repo": "ctranslate2-4you/EXAONE-3.5-2.4B-Instruct-ct2-int8", |
983 | | - "folder_name": "ctranslate2-4you--EXAONE-3.5-2.4B-Instruct-Llamafied-ct2-int8", |
984 | | - "prompt_format": """[|system|]{jeeves_system_message}[|endofturn|] |
985 | | -[|user|]{user_message} |
986 | | -[|endofturn|] |
987 | | -[|assistant|]""" |
988 | | - }, |
989 | 1023 | "Llama - 3b": { |
990 | 1024 | "original_repo": "meta-llama/Llama-3.2-3B-Instruct", |
991 | 1025 | "repo": "ctranslate2-4you/Llama-3.2-3B-Instruct-ct2-int8", |
|
1016 | 1050 | "folder_name": "ctranslate2-4you--h2o-danube3.1-4b-chat-ct2-int8", |
1017 | 1051 | "prompt_format": """<|system|>{jeeves_system_message}</s><|prompt|>{user_message}</s><|answer|>""" |
1018 | 1052 | }, |
1019 | | - "Exaone - 7.8b": { |
1020 | | - "original_repo": "LGAI-EXAONE/EXAONE-3.5-7.8B-Instruct", |
1021 | | - "repo": "ctranslate2-4you/EXAONE-3.5-7.8B-Instruct-ct2-int8", |
1022 | | - "folder_name": "ctranslate2-4you--EXAONE-3.5-7.8B-Instruct-Llamafied-ct2-int8", |
1023 | | - "prompt_format": """[|system|]{jeeves_system_message}[|endofturn|] |
1024 | | -[|user|]{user_message} |
1025 | | -[|endofturn|] |
1026 | | -[|assistant|]""" |
1027 | | - }, |
1028 | 1053 | } |
1029 | 1054 |
|
1030 | 1055 | WHISPER_SPEECH_MODELS = { |
|
0 commit comments