lucidrains
diff --git a/‎README.md‎
Lines changed: 3 additions & 12 deletions b/‎README.md‎
Lines changed: 3 additions & 12 deletions
diff --git a/‎alphafold3_pytorch/__init__.py‎
Lines changed: 3 additions & 3 deletions b/‎alphafold3_pytorch/__init__.py‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎alphafold3_pytorch/alphafold3.py‎
Lines changed: 15 additions & 1 deletion b/‎alphafold3_pytorch/alphafold3.py‎
Lines changed: 15 additions & 1 deletion
diff --git a/‎alphafold3_pytorch/app.py‎
Lines changed: 1 addition & 3 deletions b/‎alphafold3_pytorch/app.py‎
Lines changed: 1 addition & 3 deletions
diff --git a/‎alphafold3_pytorch/cli.py‎
Lines changed: 2 additions & 5 deletions b/‎alphafold3_pytorch/cli.py‎
Lines changed: 2 additions & 5 deletions
diff --git a/‎alphafold3_pytorch/inputs.py‎
Lines changed: 170 additions & 1 deletion b/‎alphafold3_pytorch/inputs.py‎
Lines changed: 170 additions & 1 deletion
@@ -170,12 +170,7 @@ An example with molecule level input handling
 
 ```python
 import torch
-
-from alphafold3_pytorch import (
-    Alphafold3,
-    Alphafold3Input,
-    alphafold3_inputs_to_batched_atom_input
-)
+from alphafold3_pytorch import Alphafold3, Alphafold3Input
 
 contrived_protein = 'AG'
 
@@ -193,8 +188,6 @@ eval_alphafold3_input = Alphafold3Input(
     proteins = [contrived_protein]
 )
 
-batched_atom_input = alphafold3_inputs_to_batched_atom_input(train_alphafold3_input, atoms_per_window = 27)
-
 # training
 
 alphafold3 = Alphafold3(
@@ -222,15 +215,13 @@ alphafold3 = Alphafold3(
     )
 )
 
-loss = alphafold3(**batched_atom_input.model_forward_dict())
+loss = alphafold3.forward_with_alphafold3_inputs([train_alphafold3_input])
 loss.backward()
 
 # sampling
 
-batched_eval_atom_input = alphafold3_inputs_to_batched_atom_input(eval_alphafold3_input, atoms_per_window = 27)
-
 alphafold3.eval()
-sampled_atom_pos = alphafold3(**batched_eval_atom_input.model_forward_dict())
+sampled_atom_pos = alphafold3.forward_with_alphafold3_inputs(eval_alphafold3_input)
 
 assert sampled_atom_pos.shape == (1, (5 + 4), 3)
 ```
 
@@ -50,14 +50,14 @@
     PDBDataset,
     maybe_transform_to_atom_input,
     maybe_transform_to_atom_inputs,
+    alphafold3_inputs_to_batched_atom_input,
+    collate_inputs_to_batched_atom_input,
+    pdb_inputs_to_batched_atom_input,
 )
 
 from alphafold3_pytorch.trainer import (
     Trainer,
     DataLoader,
-    collate_inputs_to_batched_atom_input,
-    alphafold3_inputs_to_batched_atom_input,
-    pdb_inputs_to_batched_atom_input,
 )
 
 from alphafold3_pytorch.configs import (
 
@@ -67,8 +67,10 @@
     NUM_MSA_ONE_HOT,
     DEFAULT_NUM_MOLECULE_MODS,
     ADDITIONAL_MOLECULE_FEATS,
+    hard_validate_atom_indices_ascending,
     BatchedAtomInput,
-    hard_validate_atom_indices_ascending
+    Alphafold3Input,
+    alphafold3_inputs_to_batched_atom_input,
 )
 
 from alphafold3_pytorch.common.biomolecule import (
@@ -6345,6 +6347,18 @@ def shrink_and_perturb_(
 
         return self
 
+    @typecheck
+    def forward_with_alphafold3_inputs(
+        self,
+        alphafold3_inputs: Alphafold3Input | list[Alphafold3Input],
+        **kwargs
+    ):
+        if not isinstance(alphafold3_inputs, list):
+            alphafold3_inputs = [alphafold3_inputs]
+
+        batched_atom_inputs = alphafold3_inputs_to_batched_atom_input(alphafold3_inputs, atoms_per_window = self.w)
+        return self.forward(**batched_atom_inputs.model_forward_dict(), **kwargs)
+
     @typecheck
     def forward(
         self,
 
@@ -20,10 +20,8 @@ def fold(protein):
         proteins = [protein]
     )
 
-    batched_atom_input = alphafold3_inputs_to_batched_atom_input(alphafold3_input, atoms_per_window = model.atoms_per_window)
-
     model.eval()
-    atom_pos, = model(**batched_atom_input.model_forward_dict())
+    atom_pos, = model.forward_with_alphafold3_inputs(alphafold3_input)
 
     return str(atom_pos.tolist())
 
 
@@ -7,8 +7,7 @@
 
 from alphafold3_pytorch import (
     Alphafold3,
-    Alphafold3Input,
-    alphafold3_inputs_to_batched_atom_input
+    Alphafold3Input
 )
 
 from Bio.PDB.mmcifio import MMCIFIO
@@ -40,10 +39,8 @@ def cli(
 
     alphafold3 = Alphafold3.init_and_load(checkpoint_path)
 
-    batched_atom_input = alphafold3_inputs_to_batched_atom_input(alphafold3_input, atoms_per_window = alphafold3.atoms_per_window)
-
     alphafold3.eval()
-    structure, = alphafold3(**batched_atom_input.model_forward_dict(), return_bio_pdb_structures = True)
+    structure, = alphafold3.forward_with_alphafold3_inputs(alphafold3_input, return_bio_pdb_structures = True)
 
     output_path = Path(output)
     output_path.parents[0].mkdir(exist_ok = True, parents = True)
 
@@ -41,7 +41,11 @@
 from torch.nn.utils.rnn import pad_sequence
 from torch.utils.data import Dataset
 
-from alphafold3_pytorch.common import amino_acid_constants, dna_constants, rna_constants
+from alphafold3_pytorch.common import (
+    amino_acid_constants,
+    dna_constants,
+    rna_constants
+)
 from alphafold3_pytorch.common.biomolecule import (
     Biomolecule,
     _from_mmcif_object,
@@ -86,6 +90,13 @@
 from alphafold3_pytorch.tensor_typing import Bool, Float, Int, typecheck
 from alphafold3_pytorch.utils.utils import default, exists, first, not_exists
 
+from alphafold3_pytorch.attention import (
+    full_pairwise_repr_to_windowed,
+    full_attn_bias_to_windowed,
+    pad_at_dim,
+    pad_or_slice_to
+)
+
 # silence RDKit's warnings
 
 RDLogger.DisableLog("rdApp.*")
@@ -1821,6 +1832,17 @@ def get_num_atoms_per_chain(chains: List[List[Mol]]) -> List[int]:
 
     return molecule_input
 
+@typecheck
+def alphafold3_inputs_to_batched_atom_input(
+    inp: Alphafold3Input | List[Alphafold3Input],
+    **collate_kwargs
+) -> BatchedAtomInput:
+
+    if isinstance(inp, Alphafold3Input):
+        inp = [inp]
+
+    atom_inputs = maybe_transform_to_atom_inputs(inp)
+    return collate_inputs_to_batched_atom_input(atom_inputs, **collate_kwargs)
 
 # pdb input
 
@@ -3366,6 +3388,17 @@ def pdb_input_to_molecule_input(
 
     return molecule_input
 
+@typecheck
+def pdb_inputs_to_batched_atom_input(
+    inp: PDBInput | List[PDBInput],
+    **collate_kwargs
+) -> BatchedAtomInput:
+
+    if isinstance(inp, PDBInput):
+        inp = [inp]
+
+    atom_inputs = maybe_transform_to_atom_inputs(inp)
+    return collate_inputs_to_batched_atom_input(atom_inputs, **collate_kwargs)
 
 # datasets
 
@@ -3517,6 +3550,142 @@ def __getitem__(self, idx: int | str, max_attempts: int = 10) -> PDBInput | Atom
 
         return i
 
+# collation function
+
+@typecheck
+def collate_inputs_to_batched_atom_input(
+    inputs: List,
+    int_pad_value = -1,
+    atoms_per_window: int | None = None,
+    map_input_fn: Callable | None = None,
+    transform_to_atom_inputs: bool = True,
+) -> BatchedAtomInput:
+
+    if exists(map_input_fn):
+        inputs = [map_input_fn(i) for i in inputs]
+
+    # go through all the inputs
+    # and for any that is not AtomInput, try to transform it with the registered input type to corresponding registered function
+
+    if transform_to_atom_inputs:
+        atom_inputs = maybe_transform_to_atom_inputs(inputs)
+
+        if len(atom_inputs) < len(inputs):
+            # if some of the `inputs` could not be converted into `atom_inputs`,
+            # randomly select a subset of the `atom_inputs` to duplicate to match
+            # the expected number of `atom_inputs`
+            assert (
+                len(atom_inputs) > 0
+            ), "No `AtomInput` objects could be created for the current batch."
+            atom_inputs = random.choices(atom_inputs, k=len(inputs))  # nosec
+    else:
+        assert all(isinstance(i, AtomInput) for i in inputs), (
+            "When `transform_to_atom_inputs=False`, all provided "
+            "inputs must be of type `AtomInput`."
+        )
+        atom_inputs = inputs
+
+    assert all(isinstance(i, AtomInput) for i in atom_inputs), (
+        "All inputs must be of type `AtomInput`. "
+        "If you want to transform the inputs to `AtomInput`, "
+        "set `transform_to_atom_inputs=True`."
+    )
+
+    # take care of windowing the atompair_inputs and atompair_ids if they are not windowed already
+
+    if exists(atoms_per_window):
+        for atom_input in atom_inputs:
+            atompair_inputs = atom_input.atompair_inputs
+            atompair_ids = atom_input.atompair_ids
+
+            atompair_inputs_is_windowed = atompair_inputs.ndim == 4
+
+            if not atompair_inputs_is_windowed:
+                atom_input.atompair_inputs = full_pairwise_repr_to_windowed(atompair_inputs, window_size = atoms_per_window)
+
+            if exists(atompair_ids):
+                atompair_ids_is_windowed = atompair_ids.ndim == 3
+
+                if not atompair_ids_is_windowed:
+                    atom_input.atompair_ids = full_attn_bias_to_windowed(atompair_ids, window_size = atoms_per_window)
+
+    # separate input dictionary into keys and values
+
+    keys = list(atom_inputs[0].dict().keys())
+    atom_inputs = [i.dict().values() for i in atom_inputs]
+
+    outputs = []
+
+    for key, grouped in zip(keys, zip(*atom_inputs)):
+        # if all None, just return None
+
+        not_none_grouped = [*filter(exists, grouped)]
+
+        if len(not_none_grouped) == 0:
+            outputs.append(None)
+            continue
+
+        # collate lists for uncollatable fields
+
+        if key in UNCOLLATABLE_ATOM_INPUT_FIELDS:
+            outputs.append(grouped)
+            continue
+
+        # default to empty tensor for any Nones
+
+        one_tensor = not_none_grouped[0]
+
+        dtype = one_tensor.dtype
+        ndim = one_tensor.ndim
+
+        # use -1 for padding int values, for assuming int are labels - if not, handle within alphafold3
+
+        if key in ATOM_DEFAULT_PAD_VALUES:
+            pad_value = ATOM_DEFAULT_PAD_VALUES[key]
+        elif dtype in (torch.int, torch.long):
+            pad_value = int_pad_value
+        elif dtype == torch.bool:
+            pad_value = False
+        else:
+            pad_value = 0.
+
+        # get the max lengths across all dimensions
+
+        shapes_as_tensor = torch.stack([tensor(tuple(g.shape) if exists(g) else ((0,) * ndim)).int() for g in grouped], dim = -1)
+
+        max_lengths = shapes_as_tensor.amax(dim = -1)
+
+        default_tensor = torch.full(max_lengths.tolist(), pad_value, dtype = dtype)
+
+        # pad across all dimensions
+
+        padded_inputs = []
+
+        for inp in grouped:
+
+            if not exists(inp):
+                padded_inputs.append(default_tensor)
+                continue
+
+            for dim, max_length in enumerate(max_lengths.tolist()):
+                inp = pad_at_dim(inp, (0, max_length - inp.shape[dim]), value = pad_value, dim = dim)
+
+            padded_inputs.append(inp)
+
+        # stack
+
+        stacked = torch.stack(padded_inputs)
+
+        outputs.append(stacked)
+
+    # batched atom input dictionary
+
+    batched_atom_input_dict = dict(tuple(zip(keys, outputs)))
+
+    # reconstitute dictionary
+
+    batched_atom_inputs = BatchedAtomInput(**batched_atom_input_dict)
+    return batched_atom_inputs
 
 # the config used for keeping track of all the disparate inputs and their transforms down to AtomInput
 # this can be preprocessed or will be taken care of automatically within the Trainer during data collation
Original file line number	Diff line number	Diff line change
`@@ -20,10 +20,8 @@ def fold(protein):`
`20`	`20`	`proteins = [protein]`
`21`	`21`	`)`
`22`	`22`
`23`		`- batched_atom_input = alphafold3_inputs_to_batched_atom_input(alphafold3_input, atoms_per_window = model.atoms_per_window)`
`24`		`-`
`25`	`23`	`model.eval()`
`26`		`- atom_pos, = model(**batched_atom_input.model_forward_dict())`
	`24`	`+ atom_pos, = model.forward_with_alphafold3_inputs(alphafold3_input)`
`27`	`25`
`28`	`26`	`return str(atom_pos.tolist())`
`29`	`27`