Configuration Classes#

Configuration dataclasses for model and training setup.

ModelConfig#

Configuration for model architecture.

class torchTextClassifiers.torchTextClassifiers.ModelConfig(embedding_dim, num_classes, categorical_vocabulary_sizes=None, categorical_embedding_dims=None, attention_config=None, n_heads_label_attention=None)[source]#

Bases: object

Base configuration class for text classifiers.

Attributes

embedding_dim: int#: Dimension of text embeddings.

categorical_vocabulary_sizes: List[int] | None#: Vocabulary sizes for categorical variables (optional).

categorical_embedding_dims: List[int] | int | None#: Embedding dimensions for categorical variables (optional).

num_classes: int | None#: Number of output classes (optional, inferred from data if not provided).

attention_config: AttentionConfig | None#: Configuration for attention mechanism (optional).

embedding_dim: int#

num_classes: int#

categorical_vocabulary_sizes: Optional[List[int]] = None#

categorical_embedding_dims: Union[List[int], int, None] = None#

attention_config: Optional[AttentionConfig] = None#

n_heads_label_attention: Optional[int] = None#

to_dict()[source]#

Return type:: Dict[str, Any]

classmethod from_dict(data)[source]#

Return type:: ModelConfig

__init__(embedding_dim, num_classes, categorical_vocabulary_sizes=None, categorical_embedding_dims=None, attention_config=None, n_heads_label_attention=None)#

Example#

from torchTextClassifiers import ModelConfig
from torchTextClassifiers.model.components import AttentionConfig

# Simple configuration
config = ModelConfig(
    embedding_dim=128,
    num_classes=3
)

# With categorical features
config = ModelConfig(
    embedding_dim=128,
    num_classes=5,
    categorical_vocabulary_sizes=[10, 20, 5],  # 3 categorical variables
    categorical_embedding_dims=[8, 16, 4]      # Their embedding dimensions
)

# With attention
attention_config = AttentionConfig(
    n_embd=128,
    n_head=4,
    n_layer=2,
    dropout=0.1
)
config = ModelConfig(
    embedding_dim=128,
    num_classes=2,
    attention_config=attention_config
)

TrainingConfig#

Configuration for training process.

class torchTextClassifiers.torchTextClassifiers.TrainingConfig(num_epochs, batch_size, lr, loss=<factory>, optimizer=<class 'torch.optim.adam.Adam'>, scheduler=None, accelerator='auto', num_workers=12, patience_early_stopping=3, dataloader_params=None, trainer_params=None, optimizer_params=None, scheduler_params=None, save_path='my_ttc')[source]#

Bases: object

Attributes

num_epochs: int#: Number of training epochs.

batch_size: int#: Batch size for training.

lr: float#: Learning rate.

loss: torch.nn.Module#: Loss function (default: CrossEntropyLoss).

optimizer: Type[torch.optim.Optimizer]#: Optimizer class (default: Adam).

scheduler: Type[torch.optim.lr_scheduler._LRScheduler] | None#: Learning rate scheduler class (optional).

accelerator: str#: Accelerator type: “auto”, “cpu”, “gpu”, or “mps” (default: “auto”).

num_workers: int#: Number of data loading workers (default: 12).

patience_early_stopping: int#: Early stopping patience in epochs (default: 3).

dataloader_params: dict | None#: Additional DataLoader parameters (optional).

trainer_params: dict | None#: Additional PyTorch Lightning Trainer parameters (optional).

optimizer_params: dict | None#: Additional optimizer parameters (optional).

scheduler_params: dict | None#: Additional scheduler parameters (optional).

num_epochs: int#

batch_size: int#

lr: float#

loss: Module#

optimizer#: alias of Adam

scheduler: Optional[Type[_LRScheduler]] = None#

accelerator: str = 'auto'#

num_workers: int = 12#

patience_early_stopping: int = 3#

dataloader_params: Optional[dict] = None#

trainer_params: Optional[dict] = None#

optimizer_params: Optional[dict] = None#

scheduler_params: Optional[dict] = None#

save_path: Optional[str] = 'my_ttc'#

to_dict()[source]#

Return type:: Dict[str, Any]

__init__(num_epochs, batch_size, lr, loss=<factory>, optimizer=<class 'torch.optim.adam.Adam'>, scheduler=None, accelerator='auto', num_workers=12, patience_early_stopping=3, dataloader_params=None, trainer_params=None, optimizer_params=None, scheduler_params=None, save_path='my_ttc')#

Example#

from torchTextClassifiers import TrainingConfig
import torch.nn as nn
import torch.optim as optim

# Basic configuration
config = TrainingConfig(
    num_epochs=20,
    batch_size=32,
    lr=1e-3
)

# Advanced configuration
config = TrainingConfig(
    num_epochs=50,
    batch_size=64,
    lr=5e-4,
    loss=nn.CrossEntropyLoss(weight=torch.tensor([1.0, 2.0, 1.5])),
    optimizer=optim.AdamW,
    scheduler=optim.lr_scheduler.CosineAnnealingLR,
    accelerator="gpu",
    patience_early_stopping=10,
    optimizer_params={"weight_decay": 0.01},
    scheduler_params={"T_max": 50}
)

Configuration Classes#

ModelConfig#

Example#

TrainingConfig#

Example#

See Also#