Source code for biom3d.train

"""Main code interface for training."""

import argparse
import os
from biom3d.builder import Builder
from biom3d.utils import load_python_config
from biom3d.eval import eval

from typing import Any
from biom3d.utils import AttrDict
#---------------------------------------------------------------------------
# utils

[docs]
def train(config:str|dict[str,Any]|AttrDict|None=None, 
          path:str|list[str]|None=None,
          )->Builder: 
    """
    Interface function to do a training.

    Parameters
    ----------
    config : str, dict or biom3d.utils.AttrDict, optional
            Path to a Python configuration file (in either .py or .yaml format) or dictionary of a configuration file. Please refer to biom3d.config_default.py to see the default configuration file format.
    path : str, list of str, optional
        Path to a builder folder which contains the model folder, the model configuration and the training logs.
        If path is a list of strings, then it is considered that it is intended to run multi-model predictions. Training is not compatible with this mode.

    Raises
    ------
    same as Builder.__init__

    Returns
    -------
    builder: biom3d.builder.Builder
        Builder used for the training.
    """
    builder = Builder(config=config, path=path)
    builder.run_training()
    print("Training done!")
    return builder


#---------------------------------------------------------------------------
# main unet segmentation

[docs]
def main_seg_pred_eval(
    config_path:str|None=None,
    path:str|None=None,
    path_in:str|None=None,
    path_out:str|None=None,
    path_lab:str|None=None,
    freeze_encoder:bool=False,
    ):
    """
    Interface function to do a training., then prediction and evaluation.

    Do 3 tasks:

    - train the model
    - compute predictions on the test set (path_in) and store the results in path_out
    - evaluate the prediction stored in path_out and print the result

    Parameters
    ----------
    config_path : str, optional
            Path to a Python configuration file (in either .py or .yaml format).
    path : str , optional
        Path to a builder folder which contains the model folder, the model configuration and the training logs.
    path_in: str, optional
        Path to raw image collection used for prediction.
    path_out: str, optional
        Path to prediction output.
    path_lab:str, optional
        Path to mask collection corresponding to the raws, for evaluation.
    freeze_encoder:bool, default=False
        Whether to freeze the encoder during training (useful for transfer learning).

    Raises
    ------
    same as Builder.__init__

    Returns
    -------
    None

    Notes
    -----
    - If `path_in` or `path_out` is `None`, then this function is equivalent to `train`
    - If `path_lab` is `None`, then evaluation will not be done.
    - Altough all parameter can be written as `None`, it would not work if `config_path` and `path` are both `None`.
    - Evaluation result is only printed in terminal.
    """
    # train
    print("Start training")
    builder_train = Builder(config=config_path,path=path)
    if freeze_encoder:
        builder_train.model.freeze_encoder()
    builder_train.run_training()

    train_base_dir = builder_train.base_dir
    del builder_train

    # pred
    if path_in is not None and path_out is not None:
        print("Start inference")
        builder_pred = Builder(
            config=None,
            path=train_base_dir,
            training=False)

        path_out = os.path.join(path_out,os.path.split(train_base_dir)[-1]) # name the prediction folder with the last model folder name

        out = builder_pred.run_prediction_folder(path_in=path_in, path_out=path_out, return_logit=False)
        print("Inference done!")

        if path_lab is not None:
            # eval
            print("Start evaluation")
            eval(path_lab,out,builder_pred.config.NUM_CLASSES+1)        



#---------------------------------------------------------------------------
# self-supervised training

[docs]
def main_pretrain_seg_pred_eval(
    pretrain_config:str|dict[str,Any]|AttrDict|None=None,
    train_config:str|None=None,
    log:str|None=None, # TODO
    path_encoder:str|None=None,
    freeze_encoder:bool=False,
    model_encoder:bool=False, # if it is a model encoder (UNet) or just an encoder
    path_in:str|None=None,
    path_out:str|None=None,
    path_lab:str|None=None,
    )->None:
    """
    Run a full pipeline including pretraining, training, inference, and evaluation.

    This function is designed to execute the four main stages of a segmentation workflow:
    1. Pretrain a model or encoder using a pretraining configuration.
    2. Train a segmentation model using a training configuration. Optionally initialize with a pretrained encoder.
    3. Generate predictions on a test set (from `path_in`) and save the predicted segmentations to `path_out`.
    4. If ground truth labels are available at `path_lab`, compute evaluation metrics on the predictions.

    Parameters
    ----------
    pretrain_config : str, dict or biom3d.utils.AttrDict, optional
        Path to the configuration file or dictionary for pretraining the encoder or model.
    train_config : str
        Path to the training configuration file (python or yaml).
    log : str, optional
        Existing model directory.
    path_encoder : str, optional
        Path to the pretrained encoder  to be used in training.
    freeze_encoder : bool, default=False
        Whether to freeze the encoder during training (useful for transfer learning).
    model_encoder : bool, default=False
        If True, `path_encoder` points to a full model checkpoint. If False, it is an encoder checkpoint only.
    path_in : str, optional
        Path to collection containing images for inference (test set).
    path_out : str, optional
        Path to collection to store the predicted segmentation masks.
    path_lab : str, optional
        Path to collection containing the ground truth masks for evaluation after inference.

    Returns
    -------
    None

    Notes
    -----
    - If `path_in` or `path_out` is `None`, then this function is equivalent to `train`
    - If `path_lab` is `None`, then evaluation will not be done.
    - Evaluation result is only printed in terminal.
    """
    # pretraining
    print("Start pretraining")
    builder = Builder(config=pretrain_config,path=log)
    if path_encoder is None:
        builder.run_training()
    print("Pretraining is done!")

    # train
    print("Start training")
    cfg = load_python_config(train_config)

    if path_encoder and not model_encoder:
        cfg.MODEL.kwargs.encoder_ckpt = path_encoder
    elif path_encoder and model_encoder:
        cfg.MODEL.kwargs.model_ckpt = path_encoder
    elif not model_encoder and os.path.exists(os.path.join(builder.model_dir,builder.config.DESC+"_best.pth")):
        cfg.MODEL.kwargs.encoder_ckpt = os.path.join(builder.model_dir,builder.config.DESC+"_best.pth")
    elif model_encoder and os.path.exists(os.path.join(builder.model_dir,builder.config.DESC+"_best.pth")):
        cfg.MODEL.kwargs.model_ckpt = os.path.join(builder.model_dir,builder.config.DESC+"_best.pth")
    builder_train = Builder(config=cfg,path=None)
    if freeze_encoder:
        builder_train.model.freeze_encoder()
    builder_train.run_training()

    train_base_dir=builder_train.base_dir
    del builder_train
    print("Training done!")

    # pred
    if path_in is not None and path_out is not None:
        print("Start inference")
        builder_pred = Builder(
            config=cfg,
            path=train_base_dir, 
            training=False)

        path_out = os.path.join(path_out,os.path.split(log[0] if isinstance(log,list) else log)[-1]) # name the prediction folder with the last model folder name

        out = builder_pred.run_prediction_folder(path_in=path_in, path_out=path_out, return_logit=False)
        print("Inference done!")


        if path_lab is not None:
            # eval
            print("Start evaluation")
            eval(path_lab,out,builder_pred.config.NUM_CLASSES) 


#---------------------------------------------------------------------------

if __name__=='__main__':

    # methods names 
    valid_names = {
        "train":                  train,
        "seg_pred_eval":          main_seg_pred_eval,
        "pretrain_seg_pred_eval": main_pretrain_seg_pred_eval,
        # "seg_monai":            lambda log: _main(cfg=config_unet_monai, log=log),
        # "seg_patch":            main_seg_patch,
        # "single":               main_single,
        # "genesis":              lambda log: _main(cfg=config_genesis, log=log),
        # "unet_genesis":         lambda log: _main(cfg=config_unet_genesis, log=log),
        # "denoiseg":             lambda log: _main(cfg=config_denoiseg, log=log),
        # "triplet":              lambda log: _main(cfg=config_triplet, log=log),
        # "arcface":              lambda log: _main(cfg=config_arcface, log=log),
        # "adverse":              lambda log: _main(cfg=config_adverse, log=log),
        # "unet_triplet":         main_unet_triplet,
        # "cotrain":              main_cotrain,
        # "cotrain_and_single":   main_cotrain_and_single,
    }

    # parser
    parser = argparse.ArgumentParser(description="Main training file.")
    parser.add_argument("-n", "--name", type=str, default="train",
        help="Name of the tested method. Valid names: {}".format(valid_names.keys()))
    parser.add_argument("-c", "--config", type=str, default=None,
        help="Name of the python or yaml configuration file")
    parser.add_argument("-pc", "--pretrain_config", type=str, default=None,
        help="Name of the python or yaml configuration file for the pretraining")
    parser.add_argument("-l", "--log", type=str, default=None,
        help="Name of the log folder. Used to resume model training")
    parser.add_argument("-le","--path_encoder", type=str, default=None,
        help="Path for the encoder model (.pth). Used to load the encoder")
    parser.add_argument("-me", "--model_encoder", default=False,  action='store_true', dest='model_encoder',
        help="Whether the encoder is a model encoder or a simple encoder.") 
    parser.add_argument("-fr", "--freeze_encoder", default=False,  action='store_true', dest='freeze_encoder',
        help="Whether to freeze or not the encoder.") 
    parser.add_argument("-i", "--path_in","--dir_in",dest="path_in", type=str, default=None,
        help="Path to the input image collection")
    parser.add_argument("-o", "--path_out","--dir_out",dest="path_out", type=str, default=None,
        help="Path to the output prediction collection")  
    parser.add_argument("-a", "--path_lab","--dir_lab",dest="path_lab", type=str, default=None,
        help="Path to the label image collection")  
    args = parser.parse_args()

    # run the method
    if args.name=="seg_pred_eval":
        valid_names[args.name](
            config_path=args.config,
            path=args.log,
            path_in=args.path_in,
            path_out=args.path_out,
            path_lab=args.path_lab,
            freeze_encoder=args.freeze_encoder,
            )
    elif args.name=='pretrain_seg_pred_eval':
        valid_names[args.name](
            pretrain_config=args.pretrain_config,
            train_config=args.config,
            log=args.log,
            path_in=args.path_in,
            path_encoder=args.path_encoder,
            model_encoder=args.model_encoder,
            freeze_encoder=args.freeze_encoder,
            path_out=args.path_out,
            path_lab=args.path_lab,
            )
    else:
        train(config=args.config, path=args.log)

#---------------------------------------------------------------------------