legacy_text_validator

Validator for legacy text generation format to ensure convert.py compatibility.

This module ensures that legacy text generation data synced to GitHub matches the validation rules and transformations applied by scripts/legacy_text/convert.py.

Delegates record-level validation to TextModelWriteProcessor and duplicate generation to TextModelDuplicateManager. This class orchestrates the batch operation: stripping incoming duplicates, validating base records, and re-generating duplicates.

SettingsValue

SettingsValue = JsonValue

SettingsDict

SettingsDict = dict[str, SettingsValue]

LegacyRecordValue

LegacyRecordValue = JsonValue

LegacyRecordDict

LegacyRecordDict = dict[str, LegacyRecordValue]

GenerationParamsDict

GenerationParamsDict = dict[
    str, int | float | str | bool | list[int]
]

GenerationDefaultsDict

GenerationDefaultsDict = dict[str, LegacyRecordValue]

LegacyTextValidator

Validator for legacy text generation format ensuring convert.py compatibility.

Delegates per-record validation to TextModelWriteProcessor and duplicate generation to TextModelDuplicateManager.

Source code in src/horde_model_reference/sync/legacy_text_validator.py

class LegacyTextValidator:
    """Validator for legacy text generation format ensuring convert.py compatibility.

    Delegates per-record validation to TextModelWriteProcessor and
    duplicate generation to TextModelDuplicateManager.
    """

    def __init__(
        self,
        *,
        generation_params_path: str | None = None,
        defaults_path: str | None = None,
    ) -> None:
        """Initialize the legacy text validator.

        Args:
            generation_params_path: Ignored, kept for API compatibility.
            defaults_path: Ignored, kept for API compatibility.

        """
        self._processor = TextModelWriteProcessor()

        logger.debug(
            f"Initialized LegacyTextValidator with "
            f"generation_params.json ({len(self._processor.generation_params)} keys), "
            f"defaults.json ({len(self._processor.defaults)} keys)"
        )

    @property
    def generation_params(self) -> GenerationParamsDict:
        """Expose processor's generation_params for external access."""
        return self._processor.generation_params

    @property
    def defaults(self) -> GenerationDefaultsDict:
        """Expose processor's defaults for external access."""
        return self._processor.defaults

    def validate_and_transform(
        self,
        data: dict[str, LegacyRecordDict],
    ) -> dict[str, LegacyRecordDict]:
        """Validate and transform legacy text generation data.

        Strips incoming backend-prefixed entries, validates base records,
        and re-generates backend duplicates.

        Args:
            data: Dictionary of model records in legacy format.

        Returns:
            Transformed dictionary with validation rules applied,
            including regenerated backend prefix duplicates.

        Raises:
            ValueError: If validation fails (invalid settings keys, missing required fields, etc.)

        """
        logger.debug(f"Validating {len(data)} legacy text generation records (grouped format)")

        result: dict[str, LegacyRecordDict] = {}
        backend_duplicates: dict[str, LegacyRecordDict] = {}
        for model_name, record in data.items():
            if has_legacy_text_backend_prefix(model_name):
                logger.debug(
                    f"Skipping backend-prefixed entry {model_name} (backend prefixes are not stored internally)"
                )
                continue

            try:
                validated_record = self._processor.validate_and_transform(model_name, record)
                result[model_name] = validated_record
                backend_duplicates.update(TextModelDuplicateManager.generate_duplicates(model_name, validated_record))
            except ValueError as e:
                logger.error(f"Validation failed for {model_name}: {e}")
                raise

        combined_result = dict(result)
        for duplicate_name, duplicate_record in backend_duplicates.items():
            if duplicate_name in combined_result:
                logger.warning(f"Skipping duplicate entry {duplicate_name} to avoid overriding an existing record")
                continue
            combined_result[duplicate_name] = duplicate_record

        logger.debug(
            "Validated %d base records and generated %d backend duplicates",
            len(result),
            len(backend_duplicates),
        )

        return combined_result

_processor `instance-attribute`

_processor = TextModelWriteProcessor()

generation_params `property`

generation_params: GenerationParamsDict

Expose processor's generation_params for external access.

defaults `property`

defaults: GenerationDefaultsDict

Expose processor's defaults for external access.

init

__init__(
    *,
    generation_params_path: str | None = None,
    defaults_path: str | None = None,
) -> None

Initialize the legacy text validator.

Parameters:

generation_params_path (str | None, default: None ) –

Ignored, kept for API compatibility.
defaults_path (str | None, default: None ) –

Ignored, kept for API compatibility.

Source code in src/horde_model_reference/sync/legacy_text_validator.py

def __init__(
    self,
    *,
    generation_params_path: str | None = None,
    defaults_path: str | None = None,
) -> None:
    """Initialize the legacy text validator.

    Args:
        generation_params_path: Ignored, kept for API compatibility.
        defaults_path: Ignored, kept for API compatibility.

    """
    self._processor = TextModelWriteProcessor()

    logger.debug(
        f"Initialized LegacyTextValidator with "
        f"generation_params.json ({len(self._processor.generation_params)} keys), "
        f"defaults.json ({len(self._processor.defaults)} keys)"
    )

validate_and_transform

validate_and_transform(
    data: dict[str, LegacyRecordDict],
) -> dict[str, LegacyRecordDict]

Validate and transform legacy text generation data.

Strips incoming backend-prefixed entries, validates base records, and re-generates backend duplicates.

Parameters:

data (dict[str, LegacyRecordDict]) –

Dictionary of model records in legacy format.

Returns:

dict[str, LegacyRecordDict] –

Transformed dictionary with validation rules applied,
dict[str, LegacyRecordDict] –

including regenerated backend prefix duplicates.

Raises:

ValueError –

If validation fails (invalid settings keys, missing required fields, etc.)

Source code in src/horde_model_reference/sync/legacy_text_validator.py

def validate_and_transform(
    self,
    data: dict[str, LegacyRecordDict],
) -> dict[str, LegacyRecordDict]:
    """Validate and transform legacy text generation data.

    Strips incoming backend-prefixed entries, validates base records,
    and re-generates backend duplicates.

    Args:
        data: Dictionary of model records in legacy format.

    Returns:
        Transformed dictionary with validation rules applied,
        including regenerated backend prefix duplicates.

    Raises:
        ValueError: If validation fails (invalid settings keys, missing required fields, etc.)

    """
    logger.debug(f"Validating {len(data)} legacy text generation records (grouped format)")

    result: dict[str, LegacyRecordDict] = {}
    backend_duplicates: dict[str, LegacyRecordDict] = {}
    for model_name, record in data.items():
        if has_legacy_text_backend_prefix(model_name):
            logger.debug(
                f"Skipping backend-prefixed entry {model_name} (backend prefixes are not stored internally)"
            )
            continue

        try:
            validated_record = self._processor.validate_and_transform(model_name, record)
            result[model_name] = validated_record
            backend_duplicates.update(TextModelDuplicateManager.generate_duplicates(model_name, validated_record))
        except ValueError as e:
            logger.error(f"Validation failed for {model_name}: {e}")
            raise

    combined_result = dict(result)
    for duplicate_name, duplicate_record in backend_duplicates.items():
        if duplicate_name in combined_result:
            logger.warning(f"Skipping duplicate entry {duplicate_name} to avoid overriding an existing record")
            continue
        combined_result[duplicate_name] = duplicate_record

    logger.debug(
        "Validated %d base records and generated %d backend duplicates",
        len(result),
        len(backend_duplicates),
    )

    return combined_result

legacy_text_validator

SettingsValue

SettingsDict

LegacyRecordValue

LegacyRecordDict

GenerationParamsDict

GenerationDefaultsDict

LegacyTextValidator

_processor instance-attribute

generation_params property

defaults property

__init__

validate_and_transform

_processor `instance-attribute`

generation_params `property`

defaults `property`

init