seqeralabs
diff --git a/‎assets/test_data/2VSM_seq.Uniref30_2302.a3m‎
Lines changed: 48 additions & 0 deletions b/‎assets/test_data/2VSM_seq.Uniref30_2302.a3m‎
Lines changed: 48 additions & 0 deletions
diff --git a/‎assets/test_data/samplesheet_design_protein.csv‎
Lines changed: 1 addition & 1 deletion b/‎assets/test_data/samplesheet_design_protein.csv‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎bin/prepare_boltz2_input.py‎
Lines changed: 28 additions & 51 deletions b/‎bin/prepare_boltz2_input.py‎
Lines changed: 28 additions & 51 deletions
diff --git a/‎conf/base.config‎
Lines changed: 6 additions & 0 deletions b/‎conf/base.config‎
Lines changed: 6 additions & 0 deletions
diff --git a/‎conf/test_design_nanobody.config‎
Lines changed: 0 additions & 6 deletions b/‎conf/test_design_nanobody.config‎
Lines changed: 0 additions & 6 deletions
diff --git a/‎conf/test_design_peptide.config‎
Lines changed: 0 additions & 6 deletions b/‎conf/test_design_peptide.config‎
Lines changed: 0 additions & 6 deletions
diff --git a/‎conf/test_design_protein.config‎
Lines changed: 0 additions & 6 deletions b/‎conf/test_design_protein.config‎
Lines changed: 0 additions & 6 deletions
@@ -0,0 +1,48 @@
+>Query|-|Query
+ICLQKTSNQILKPKLISYTLGQSGTCITDPLLAMDEGYFAYSHLERIGSCSRGVSKQRIIGVGEVLDRGDEVPSLFMTNVWTPPNPNTVYHCSAVYNNEFYYVLCAVSTVGDPILNSTYWSGSLMMTRLAVKPKSNGGGYNQHQLALRSIEKGRYDKVMPYGPSGIKQGDTLYFPAVGFLVRTEFKYNDSNCPITKCQYSKPENCRLSMGIRPNSHYILRSGLLKYNLSDGENPKVVFIEISDQRLSIGSPSKIYDSLGQPVFYQASFSWDTMIKFGDVLTVNPLVVNWRNNTVISRPGQSQCPRFNTCPEICWEGVYNDAFLIDRINWISAGVFLDSNQTAENPVFTVFKDNEILYRAQLASEDTNAQKTITNCFLLKNKIWCISLVEIYDTGDNVIRPKLFAVKIPEQCTH
+>UniRef100_A0A8T5UKK0	718	0.821	5.691E-231	0	410	413	5	418	433
+ICLQKTKDPILKPKLISYTLpvqQDRGICITDPLLAIDDGFFAYSHLEGIGSCKRGDSKQRIIGVGEVLDRGDYVPSLFMTNVWTPPNPMTVIHCSPVYCNQFYYVLCAVSNVGDPILNSTYWSDSLYITRLAVRPKSKKGPYNQHYIAINMTEDGRYDKVMPYGPSGIKQGDTLYFPAVGFLNRTEFTYNDSNCPITQCGYSKKENCRLSMGSPTNSHYILRSGLLKYNLSNGTDFKIQFIEITDNRLSIGSPSKIYKSLGQPVFYQASMSWDTMIKAGDVETVKPLTVNWRNNTVISRPGQSQCPRFNKCPEICWEGTYNDAFLIDRGNWMSAGVILDSNQTAENPVFTVFKDNEILYKERLAKDDTNAQKTITSCFLLLNEIWCISLVEIYDTGDKVIRPKLFAVKIPKQC--
+>UniRef100_UPI0005CF1739	700	0.805	8.121E-225	0	407	413	187	597	603
+ICLQKTKDPILKPKLISYTLpvqQDRGICITDPLLAIDDGFFAYSHLEKIGSCKRGDSKQRIIGVGEVLDRGDYVPSLFMTNVWTPPNPMTVIHCSPVYCNQFYYVLCAVSNVGDPILNSTYWSDSLYITRLAVRPKNGIDRYNQKKIAINNMEDGKYDKVMPYGPSGIKQGDTLYFPAVGFLNRTEFTYNDSNCPIIQCGYSKKENCRLSMGSPTNSHYILRSGLLKYNLSNMTDFKIQFIEITDNRLSIGSPSKIYKSLGQPVFYQASMSWDTMIKAGDVETVKPLTVNWRNNTVISRPGQSQCPRFNKCPEVCWEGTYNDAFLIDRGNWMSAGVILDSNQTAENPVFTVFKDNEILYKERLAKDDTNAQKTITSCFLLLNEIWCISLVEIYDTGDKVIRPKLFAVKIP-----
+>UniRef100_A4P076	207	0.279	1.647E-54	25	410	413	36	415	454
+-------------------------CILNPRLTISSTKFAYVHSEYDKNCTRGFKYYELMTFGEILEGPEKEPRMFSRSFYSPTNAVNYHSCTPIVTVNEGYFLCLECTSSDPLYKANLSNSTFHLVILRHNKDEKIVSMPSFNLSTDQ----EYVQIIPAEGGGTAESGNLYFPCIGRLLHK--RVTHPLCKKSNCSRTDDESCLKSYYNQGSPQHQVVNCLIRIRNAQRDNPTWDVITVDLTNTYPGSRSRIFGSFSKPMLYQSSVSWHTLLQVAEITDLDKYQLDWLDTPYISRPGGSECPFGNYCPTVCWEGTYNDVYSLTPNNDLFVTVYLKSEQVAENPYFAIFSRDQILKEFPLDAWISSARTTTISCFMFNNEIWCIAALEITRLNDDIIRPIYYSFWLPTDC--
+>UniRef100_UPI001362B71E	207	0.279	1.647E-54	25	410	413	231	610	632
+-------------------------CILNPRLTISSTKFAYVHSEYDKNCTRGFKYYELMTFGEILEGPEKEPRMFSRSFYSPTNAVNYHSCTPIVTVNEGYFLCLECTSSDPLYKANLSNSTFHLVILRHNKDEKIVSMPSFNLSTDQ----EYVQIIPAEGGGTAESGNLYFPCIGRLLHK--RVTHPLCKKSNCSRTDDESCLKSYYNQGSPQHQVVNCLIRIRNAQRDNPTWDVITVDLTNTYPGSRSRIFGSFSKPMLYQSSVSWHTLLQVAEITDLDKYQLDWLDTPYISRPGGSECPFGNYCPTVCWEGTYNDVYSLTPNNDLFVTVYLKSEQVAENPYFAIFSRDQILKEFPLDAWISSARTTTISCFMFNNEIWCIAALEITRLNDDIIRPIYYSFWLPTDC--
+>UniRef100_A0A4T0A5B2	133	0.235	6.916E-30	23	410	413	183	566	854
+-----------------------GGCMRDPSFDIGQKIFAYTHNVVDQGCQNEQQSTQYWSIGRITDVADDMPKFETLTQWYLNDGLNRKSCSVAVIDYGAWMLCIIMTESEEDDYQSPGIGRLFIGYMDIYGRKKSWILDESEISFDYKYAALYFSV----GSGIVSKGKVYFLVYGGL--TNPVSGNVMCHAPGCENPNQDVCNNASKPKSFGNRQMVNGILSFDDNPSEKPRLTVKTIPPSQNWFGAEGRLYKSyyTRNTFIYIRSSSWHALPQIGIINLTDDTYTQWVDNVAISRPGTNGCPFGNRCPKECVTGVYTDLFPLDSNYQYAITVTLKSQNTFVNPVLMVVNQTKIIYEKTVTTADQQAHYTTTTCFKFSRSLWCLSIVELEPGTVGERQPVPFLYKLPLEC--
+>UniRef100_A0A6M1UA71	127	0.216	6.125E-28	23	410	413	191	574	1602
+-----------------------GSCVRLPSFSLSSTIFAYTHTIMGHGCSELDVGDHYFSIGRIADHGHDQPVFETITEWFINDKINRRSCTVAAGKYEAWMGCVImtETFYDDMMSED--TGKVSISYLDVYGRKREWMYSRSEIRYDYNYASLYFSI----GSGVVIGDNVYFLVWGSLMYP--IEQNAYCNAPGCRNWTQQMCNQAQRPQTFGNHQMVNGILSFKTNTDGKPVLSVRTFTPGLIPLGTEGRLiyFENTNKTYIYLRSTTWHALPLTGEITFGPPLAIRWFQQTAVSRPGDAPCGASNRCPRQCVTGVYTDLFPLGTNYEYSMTAYLDSETRRVNPTLAFINTNSIIYEKTLTNSTQRAEYTTTTCFTFKLRIWCLSIVELSPSTITSFEPVPFLYQLDVGC--
+>UniRef100_A0A812SP11	123	0.243	1.621E-26	23	411	413	181	561	562
+-----------------------GGCVRIPSFSLT--IYAYTHNLITQGCQDIGKSYQYWQIGYITTNSDGVPEPNPSHTWDINDGMNRKSCSTAASGTGAWLGCSIPTVDE---RDDYASPGI--EDIVLDYQDIFGRRKSWRYTNSEIDFDRpYAALYPSVGSGIVVKGKVYFLGYGGLMHP--IQGNAYCNAPGCPSPTQEDCNKAQKPPWFGGRQIVNGILTFDDTGNDKPTLRVRTIPPTQNWMGAEGRLLYLGGKIYIYTRSTSWHSLLQIGIIDLGDPIRINWVPHTVLSRPGNDPCGWGNRCPKGCLTGVYTDAYPLSPDYSLVATVILNSQTSRVNPTITYSTPTEIVNMKQITNNTQEAAYTTTTCFTHFNKGWCFSIVEINPGTLNTYQPVLFKTEIPKSCS-
+>UniRef100_A0A7W3N9H6	123	0.229	2.181E-26	23	410	413	191	574	1052
+-----------------------GSCVRLPSFSLSSTVFAYTHTIMGHGCSELDVGDHYFAVGRIADAGHEIPQFETISSWFINDKINRRSCTVAAGAMEAWMGCVIMTETFYDDLDSLDTGKLTISYLDVFGRKKEWIYTRSEILYDYTYTSVYFSI----GSGVVVGDTVYFLIWGSLSSpiEETAY----CFAPGCSNYNQRMCNEAQRPSKFGHRQMVNGILRFKTTSTGKPLLSVRTLSPSVIPFGTEGRlIYSDITKIIYlYLRSTSWHALPLTGLLVLGPPTSISWVTQEAVSRPGEYPCGASNRCPKDCVTGVYTDLFPLGARYEYAATVYLNAETYRVNPTLALINQTSIIARKKITTESQKAGYTTTTCFVFKLRVWCVSVVELAPATMTAYEPIPFLYQLDLTC--
+>UniRef100_A0A936IHT9	112	0.238	6.427E-23	12	401	413	65	449	450
+------------PSLLSMPTTIDG-CVRTPSLSINDAIYAYtSNLITQGCQDIGKSYQ-VLQIGYITVNSDMYPDLNPRISHTYNINDNRKSCSVIAANTDVYQLCSTPTVNERTDYSSSGIEDIVFDIVNYDGSTSTHRYKNNNITFDHPYSAMYPSVGP----GIYYKNTIIFLGYGGLEHP--IQENTKCNTNRCPNKNQRDCNQASHSPWFSDRQMVNSIIRINNYLNSRPRIKVWTIPMRQNYWGSEGRLL-KLGNKIYiYTRSTSWHSNLQIGsiDINDYNPMRINWTWHNVLSRPGNPECPWFHSCPDECITGVYTDAYPLNPTGSNVSTTTLYSQTSRVNPTIMYSTTTERINMLRIRNKTLPAGYTTTSCITHYNKGYCFHIVEINHISLNTFQPML-----------
+>UniRef100_UPI00061BAB72	111	0.266	1.554E-22	154	411	413	29	284	288
+----------------------------------------------------------------------------------------------------------------------------------------------------------YSAMYPSVGPGIYYENTIIFLGYGGL--THPIQENTKCNTTSCPNKNQRDCNQASHSPWFSDRQMVNSIIHINNYLNDRPKIKVWTIPMTQNYWGSEGRLL-KLGNKIYiYTRSTSWHSNLQIGSIDINSPMTINWTWHNVLSRPGNPDCPWFHSCPRECITGVYTDAYPLNPTGFNVSTTTLYSQTSRVNPTIMYSTTTERINMLRIRNKQLEAGYTTTSCITHYNKGYCFHIVEINHTSLNTFQPMLFKTEIPKSCS-
+>UniRef100_UPI0011440D73	103	0.270	5.458E-20	154	410	413	73	331	363
+----------------------------------------------------------------------------------------------------------------------------------------------------------YTALYPSVGSGVSIGTTVYFLMYGGL---ETPHNDqSYCPRHMCndQTKNQQQCNKAQQPNWRSYKQMVNAIMSFNDQIESQPNFTIRTIPPSTQWMGSEGRLmYNWYSQKNYiYTRSTSWYPKMQFGFINLTPPHTIKWQNYTSISRPGERVCKSNNRCPAECVTGVYTDAYPLTSQDDLAMTVEHNDDYQRRSPTMKSVTPNNKTEQYDIYNNTQNADYTTTTCFMFNFQPWCISIVEMPPATINSMMPTPYLYPIWSNC--
+>UniRef100_F4LQG9	102	0.227	7.307E-20	25	410	413	208	589	930
+-------------------------CARIPTFSLSPYIWAYGHnVIRNGCADHGMSDQ-YFSIGVISESWGETPHFETLTSWYMDDETNRKSCSVAAGVSGAWMGC---TVVWQSFRDDYCSDGILPLHLSymdIFGRKRYWTYDPRVLGFASRFAAFYFGV----GSGVIVDGVVYLPFYAGL--ADNLTQSSFCHAPDCNNPQTSECDSAAQLVWLCSKVIVNGILYFNDDPIVRPVLRVAVINTRSNWLGAEMRLIHNyqLGITYIYTRSSGWHALPQVGLINLQNIAQVVWIDVTAIGRPGRDTCSAGSRCPSTCLSGVYNDIFPLGRYYEFGATVYLQSDTDRVHPTIAFLNTTRVFESMTLTTAEQRAQYSTTTCFVFKSKPWCLSIVEMEPSVVGTTTPVPFTYTLPLVC--
+>UniRef100_M0DWW1	96	0.232	5.743E-18	22	410	413	52	440	471
+----------------------SDECYTNPSFSIGSSIYMFSQEIRKTDCTAGEILSIQIVLGRIVDKGQQGPQASPLLVWAVPNPKIINSCAVAAGDEMGWVLCSVTLTaasGEPIphMFDGFWLYKLEPDTEVVSYRITGYAY--------LLDK-QYDSVFIGKGGGIQKGNDLYFQMYGLsRNRQSFK---ALCEHGSCLGTGGGGyqvlCDRAVMSFGSEESLITNAYLKVNDLASGKPVIIGQTFPPSDSYKGSNGRMYTIGDKYGLYLAPSSWNRYLRFGITPDISVRSTTWLKSQDPIMKILSTCTNTdrDMCPEICNTRGYQDIFPLseDSEYYTYIGITPNNGGTKN---FVAVRDSD----GHIASIDIlqnyySITSATISCFMYKDEIWCIAITEGKKQKDNPQRIYAHSYKIRQMC--
+>UniRef100_UPI000FE14678	96	0.232	5.743E-18	22	410	413	215	603	625
+----------------------SDECYTNPSFSIGSSIYMFSQEIRKTDCTAGEILSIQIVLGRIVDKGQQGPQASPLLVWAVPNPKIINSCAVAAGDEMGWVLCSVTLTaasGEPIphMFDGFWLYKLEPDTEVVSYRITGYAY--------LLDK-QYDSVFIGKGGGIQKGNDLYFQMYGLsRNRQSFK---ALCEHGSCLGTGGGGyqvlCDRAVMSFGSEESLITNAYLKVNDLASGKPVIIGQTFPPSDSYKGSNGRMYTIGDKYGLYLAPSSWNRYLRFGITPDISVRSTTWLKSQDPIMKILSTCTNTdrDMCPEICNTRGYQDIFPLseDSEYYTYIGITPNNGGTKN---FVAVRDSD----GHIASIDIlqnyySITSATISCFMYKDEIWCIAITEGKKQKDNPQRIYAHSYKIRQMC--
+>UniRef100_A0A8J2V3C9	78	0.266	4.214E-12	105	344	413	14	238	239
+---------------------------------------------------------------------------------------------------------ASSGIEDIVLDIVNYDGSISTTRF----KNNNISFDQPYAAL-------YPSVGP----GIYYKGKIIFLGYGGL---EHPINENvICNTTECPGKTQRDCNQASHSPWFSDRRMVNSIIVVDKGLNSIPKLKVWTISMRQNYWGSEGRLL-LLGNKIYiYTRSTSWHSKLQLGiiDITDYSDIRIKWTWHNVLSRPGNNECPWGHSCPNGCITGVYTDAYPLNPTGSIVSSVILDSQKSRVNP--------------------------------------------------------------------
+>UniRef100_UPI00203C3497	76	0.226	1.748E-11	153	395	413	401	644	665
+---------------------------------------------------------------------------------------------------------------------------------------------------------QYAALYPATGPGIFIGDHLVFLMWGGLMTK--AEGDAYCQASGCNDAHRTSCNIAQMPSAYGHRQLVNGLLMLPIKElGSHLIQPSLETISPKINwAGGHGRLYYNweINTTYIYIEGKTWRSRPNLGIISWSKPLSIRWIDHSVARRPGARPCDSANDCPEDCLVGGYYDMFPMSSDYKTAITIIPTHHQWPSSPALKLFNTNREVRVVMILRPPNNVKKTTISCIRIMQTNWCLGFI-IFKEGNN-----------------
+>UniRef100_A0A4R9BG17	72	0.226	2.250E-10	5	411	413	218	623	625
+-----TANPKRVPIFVSNVGGMlENSCTKEPVISMANGVFASTYLYLRDSCTDYQSSIRFFEMGIVKRLSDNDPYLSVIHTWDQASPFVLQPCSLAVAYDNGYALCAESVTG---VDNDLVTGNTI--RLVLFTFTLFGSLERKVIYYENFKRPReFVYIIPGAGQGVIIDNVMY--SIGYYVSENTPQGNLKCPTTGCPNLQYSTCDQFSRTQVSNHRHKFLTLIQVNLTQYPLPVHNLLVIPRSYYSIISHGNLYyrNSNDSVLFQLYNVGWYHKPLVGSINLTTPLSLEFLNKDYDLLSSVTNCvPGFG-CPSSCEISAYgaytpldynfNDAVsLIPRTSGAYPSVSYGSGNTR--------IDFRIILNQQLALRESSLV-----CYLptIQNtgHPYCVGLMTFEVTGQTA--PQLYSVgwKQTYQCS-
+>UniRef100_UPI00227ACD99	66	0.228	2.755E-08	25	391	413	188	574	595
+-------------------------CTRIPSFSLSKTHWCYSHNIIASGCqDHGHSSQYIsMGVLQVTSNG--TPSFRTTASQYLSDGLNRKSCSIIATPYGCDLLCSVVTetenddyASDPptemILGRLFFNGT--YTERVINPPGFFGDWVANYPGVGSgVVYGGKILFPIYG--GVKQNTSLFNQLSG-------KYFFPHNPKYPCSNSTQQQIQRA----KNSYYppkfsgrLWQQGILICPLSQFLTTDCRIKVFNNSTVMMGAEGRLYLIGNNLYYYQRSSSWwpvgllyKLSLNFSNSV---PSITNikWIPIYQFPRPGSGPCTGPNVCPAVCVTGVYQDIWPLSNpstanpnlSNIVWVGQYLNAPTARKNP--TIYIANQYSWKNQvrLFNSNTEAAYSTTTCF--KNtgtdRVYCLIIIELGD---------------------
+>UniRef100_A0A7J8PBV8	59	0.236	2.495E-06	152	325	413	101	290	302
+--------------------------------------------------------------------------------------------------------------------------------------------------------GQWATINPAVGSGIYHPGFILFPVYGGLINGTTSYNEQSSryfipkhPNITCagnSSTQAAIARSSYVIRYHSNRLIQSAVLICPLSDMHTEECNLVMFNNSQVMMGAEGRLYVIGNNLYYYQRSSSWWSASLFYRINTdfskgIPPIIeAQWVPSYQVPRPGVMPCNATSFCPANCITGVYADVWPLNN---------------------------------------------------------------------------------------
+>UniRef100_UPI0002A41B43	59	0.274	4.377E-06	230	409	413	382	569	571
+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------GKDP---VLSVLDNNVTLmGAEARVMTIGGKLYLYQRGTSW-----FPSAL-LYPLTITNGTATFSSpyifdnftRPGSHPCSAASRCPNSCVTGVYTDAYpLVFSRNHKVRGVYgmmLNDRTARLNPVAAVFFRISMSNVTRVSSSPTKAAYTTSTCFkvVKTGRVYCISIAEIGNTlfGEFRIVPLLVEILSDER---
+>UniRef100_A0A0Q4Q434	56	0.196	2.361E-05	25	405	413	55	457	468
+-------------------------CSRFPSYSNHYGLWCYSHTVSNDTCDGSNPSVQILSVGKLITGDNGQPEHKTLYTQQLSQTDRLYHCSVTMTTLGCYILCS-----KPRVNETQDYETIGIEPMIIGMLGLDGVYTDLGNPVGISDNSLY--AMYPGPgGGVMYKDFLVFPLHGGVRFSEaskmlgknitfrgFPPSDTCTEHEKSLTQEPANMLTSPYY---GEVLVLDFLYVCTLLDNIPGECSIQLIPPDNMTMGSESKLYKLNNSLLLYKRSSSWwpyTEVYQLSLRVSKNSMKVRESvrlNITSTTRPGVEGCNINKVCPKVCVTGVFQAPGIIRKAlspkesneDLLFFQAWTSDSIARQGPLISLCRADSCVLTIPLGNSDVFIGYTDSFCLSDRDneKIYCVALLELDNMpySEMTIRSFLYLIK-------
+>UniRef100_UPI001F11728C	56	0.219	2.361E-05	20	389	413	173	564	587
+--------------------GKSKGCTRFPSFSVYFGFWCYTHAVSDQNCEGSSPTYQRVRIGIIkknLSDGSPYKTLGTT---TLPRGNRRRGCSVTSSIYGCYLLCSKPNVSETDDYKT--QGIEPMTILFL---SRDGITTDLFDNIQSTTE-SWNALYPGEGSGVWHMGYLIFPLWGGIpFKTPFAENIWNITLrgfpvgPSCKETLPDKFNLGNkdSVLFSPYYgenVMVFGLLVcYMLENLPGHCQVQI-LNPSNLTMGSESQLYVLNGILYLYQRSASW---WPYTQLYRLNLRSTNRKLRvrsiiripiTSTTRPGYEGCNIYKVCPKVCVTGVFQAPWIInidsirdrDVRNLLFFQAWSGDFNTRQGPLVSLCSQDTCPLTTPLANSKSHMGYTTTYCYpsRSENKLYCTVFIEL-----------------------
+>UniRef100_A0A7W4H6B0	55	0.252	7.253E-05	191	309	413	1	119	120
+-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------CQAPECTSATQESCNSNQLIGYFSGRQIVNCIIEIITVGTEKPIIRIRTIPNSQVWLGAEGRIQTLGGVLYLYIRSSGWHALAQTGIILTLDPIRISWIENTGYSRPGNRPCPASSRCP-------------------------------------------------------------------------------------------------------
@@ -1,2 +1,2 @@
 sample_id,design_yaml,structure_files,protocol,num_designs,budget,reuse,target_msa
-2vsm_protein_binder,assets/test_data/2VSM_protein_design.yaml,assets/test_data/2VSM.cif,protein-anything,3,2,,assets/test_data/nipah_glycoprotein_msa_Uniref30_2302.a3m
+2vsm_protein_binder,assets/test_data/2VSM_protein_design.yaml,assets/test_data/2VSM.cif,protein-anything,3,2,,assets/test_data/2VSM_seq.Uniref30_2302.a3m
@@ -14,6 +14,7 @@ def parse_args():
     parser.add_argument('--parent_id', required=True, help='Parent ID')
     parser.add_argument('--predict_affinity', action='store_true', help='Enable affinity prediction')
     parser.add_argument('--output_dir', default='yaml_inputs', help='Directory to save YAML files')
+    parser.add_argument('--treat_as_designed', action='store_true', help='Treat the first sequence as a designed sequence (do not skip)')
     return parser.parse_args()
 
 def main():
@@ -65,81 +66,57 @@ def main():
 
         print(f"Found {len(sequences)} sequences in {fasta_file}")
 
-        # Skip the first sequence (it's always the original sequence from Boltzgen)
-        # We only want to refold the NEW sequences generated by ProteinMPNN
-        sequences_to_process = sequences[1:] if len(sequences) > 1 else []
+        # Determine which sequences to process
+        if args.treat_as_designed:
+            # If treating as designed, process ALL sequences (including the first one)
+            sequences_to_process = sequences
+            print(f"Processing all {len(sequences_to_process)} sequences (treating first as designed)")
+        else:
+            # Default behavior: Skip the first sequence (original from Boltzgen)
+            sequences_to_process = sequences[1:] if len(sequences) > 1 else []
+            print(f"Processing {len(sequences_to_process)} new MPNN sequences (skipping original)")
 
         if not sequences_to_process:
-            print(f"⚠  Warning: Only found 1 sequence (original), no new MPNN sequences to refold")
+            print(f"⚠  Warning: No sequences to process in {fasta_file}")
             continue
 
-        print(f"Processing {len(sequences_to_process)} new MPNN sequences (skipping original)")
-        
-        # Create Boltz-2 YAML for each NEW sequence (skip first one)
+        # Create Boltz-2 YAML for each sequence
         for idx, (header, binder_seq) in enumerate(sequences_to_process):
             # Create YAML input for Boltz-2
             # Format: binder (designed sequence) + target (original protein)
             # Note: Only target gets MSA; Boltz-2 will infer missing MSA info for binder
+            # Ensure binder sequence contains only the first chain (strip any '/' separators)
+            binder_seq_clean = binder_seq.split('/')[0] if '/' in binder_seq else binder_seq
             binder_entry = {
                 'protein': {
-                    'id': 'BINDER',
-                    'sequence': binder_seq,
+                    'id': 'A',
+                    'sequence': binder_seq_clean,
                     'msa': 'empty'
                 }
             }
 
             target_entry = {
                 'protein': {
-                    'id': 'TARGET', 
+                    'id': 'B',
                     'sequence': target_seq
                 }
             }
-            
-            # Add target MSA if available (binder MSA will be inferred by Boltz-2)
             if has_target_msa and target_msa_path:
                 target_entry['protein']['msa'] = os.path.abspath(target_msa_path)
                 print(f"    Adding target MSA: {target_msa_path}")
-            
-            # Check for multi-chain sequence (ProteinMPNN uses / separator)
-            if '/' in binder_seq:
-                # Multi-chain case: ProteinMPNN output includes all chains
-                # We split them and create separate entities
-                parts = binder_seq.split('/')
-                seq_list = []
-                for i, part in enumerate(parts):
-                    # Use simple IDs: A, B, C...
-                    chain_id = chr(65+i)
-                    seq_list.append({
-                        'protein': {
-                            'id': chain_id,
-                            'sequence': part,
-                            'msa': 'empty'
-                        }
-                    })
-                # Add the target entry (with MSA if available) to the sequences list
-                seq_list.append(target_entry)
-                
-                boltz2_input = {
-                    'version': 1,
-                    'sequences': seq_list
-                }
-                print(f"  Detected multi-chain sequence ({len(parts)} chains)")
-                
-            else:
-                # Single chain case: Binder + Target
-                boltz2_input = {
-                    'version': 1,
-                    'sequences': [binder_entry, target_entry]
-                }
-                
-                # Add affinity prediction property (only for single binder case)
-                # Note: Boltz-2 currently only supports affinity for ligands, so this might fail for proteins
-                if args.predict_affinity:
-                    boltz2_input['properties'] = [
-                        {'affinity': {'binder': 'BINDER'}}
-                    ]
+            # Build final YAML input with exactly two entries
+            boltz2_input = {
+                'version': 1,
+                'sequences': [binder_entry, target_entry]
+            }
+            # Add affinity prediction property (only for single binder case)
+            if args.predict_affinity:
+                boltz2_input['properties'] = [
+                    {'affinity': {'binder': 'A'}}
+                ]
 
             # Write YAML file
+            # Use a unique suffix based on the loop index to avoid overwriting
             yaml_file = f"{args.output_dir}/{output_base}_seq_{yaml_count}.yaml"
             with open(yaml_file, 'w') as yf:
                 yaml.dump(boltz2_input, yf, default_flow_style=False)
 
@@ -113,4 +113,10 @@ process {
         // Container GPU access for Docker
         containerOptions = '--gpus all'
     }
+
+    withName:BOLTZ2_REFOLD {
+        accelerator = { check_max( 1, 'gpus' ) }
+        memory = { check_max( 32.GB * task.attempt, 'memory'  ) }
+        containerOptions = '--gpus all -e TORCH_FLOAT32_MATMUL_PRECISION=medium'
+    }
 }
@@ -18,12 +18,6 @@ params {
     config_profile_name        = 'Test profile - Design Mode (Nanobody)'
     config_profile_description = 'Test dataset for design mode using 2VSM with pre-made nanobody YAML spec'
 
-    // Limit resources for fast testing
-    max_cpus   = 2
-    max_memory = '6.GB'
-    max_time   = '6.h'
-    max_gpus   = 1
-
     // Input data - design mode with 2VSM nanobody
     input       = "${projectDir}/assets/test_data/samplesheet_design_nanobody.csv"
     mode        = 'design'
 
@@ -18,12 +18,6 @@ params {
     config_profile_name        = 'Test profile - Design Mode (Peptide)'
     config_profile_description = 'Test dataset for design mode using 2VSM with pre-made peptide YAML spec'
 
-    // Limit resources for fast testing
-    max_cpus   = 2
-    max_memory = '6.GB'
-    max_time   = '6.h'
-    max_gpus   = 1
-
     // Input data - design mode with 2VSM peptide
     input       = "${projectDir}/assets/test_data/samplesheet_design_peptide.csv"
     mode        = 'design'
 
@@ -18,12 +18,6 @@ params {
     config_profile_name        = 'Test profile - Design Mode (Protein)'
     config_profile_description = 'Test dataset for design mode using 2VSM with pre-made protein YAML spec'
 
-    // Limit resources for fast testing
-    max_cpus   = 2
-    max_memory = '6.GB'
-    max_time   = '6.h'
-    max_gpus   = 1
-
     // Input data - design mode with 2VSM protein
     input       = "${projectDir}/assets/test_data/samplesheet_design_protein.csv"
     mode        = 'design'
Original file line number	Diff line number	Diff line change
`@@ -1,2 +1,2 @@`
`1`	`1`	`sample_id,design_yaml,structure_files,protocol,num_designs,budget,reuse,target_msa`
`2`		`-2vsm_protein_binder,assets/test_data/2VSM_protein_design.yaml,assets/test_data/2VSM.cif,protein-anything,3,2,,assets/test_data/nipah_glycoprotein_msa_Uniref30_2302.a3m`
	`2`	`+2vsm_protein_binder,assets/test_data/2VSM_protein_design.yaml,assets/test_data/2VSM.cif,protein-anything,3,2,,assets/test_data/2VSM_seq.Uniref30_2302.a3m`
Original file line number	Diff line number	Diff line change
`@@ -113,4 +113,10 @@ process {`
`113`	`113`	`// Container GPU access for Docker`
`114`	`114`	`containerOptions = '--gpus all'`
`115`	`115`	`}`
	`116`	`+`
	`117`	`+ withName:BOLTZ2_REFOLD {`
	`118`	`+ accelerator = { check_max( 1, 'gpus' ) }`
	`119`	`+ memory = { check_max( 32.GB * task.attempt, 'memory' ) }`
	`120`	`+ containerOptions = '--gpus all -e TORCH_FLOAT32_MATMUL_PRECISION=medium'`
	`121`	`+ }`
`116`	`122`	`}`