save_artifact

The save_artifact() function allows you to manually upload and publish artifacts outside of step outputs.

Signature

def save_artifact(
    data: Any,
    name: str,
    version: Optional[Union[int, str]] = None,
    artifact_type: Optional[ArtifactType] = None,
    tags: Optional[List[str]] = None,
    extract_metadata: bool = True,
    include_visualizations: bool = True,
    user_metadata: Optional[Dict[str, MetadataType]] = None,
    materializer: Optional[MaterializerClassOrSource] = None,
    uri: Optional[str] = None,
) -> ArtifactVersionResponse

Parameters

data

Any

required

The artifact data to save.

name

str

required

The name of the artifact.

version

Union[int, str]

The version of the artifact. If not provided, a new auto-incremented version will be used.

artifact_type

ArtifactType

The artifact type. If not given, the type will be determined by the materializer used to save the artifact.

Returns

artifact

ArtifactVersionResponse

The saved artifact version response object.

Examples

Save a Simple Artifact

from zenml import save_artifact
import pandas as pd

df = pd.DataFrame({"col1": [1, 2, 3], "col2": [4, 5, 6]})

artifact = save_artifact(
    data=df,
    name="my_dataframe"
)

print(f"Saved artifact with ID: {artifact.id}")

Save with Version and Tags

from zenml import save_artifact
import numpy as np

array = np.array([[1, 2], [3, 4], [5, 6]])

artifact = save_artifact(
    data=array,
    name="training_data",
    version="v1.0.0",
    tags=["training", "preprocessed", "2024-01"]
)

Save with Metadata

from zenml import save_artifact
import pandas as pd

df = pd.DataFrame({"feature": range(1000)})

artifact = save_artifact(
    data=df,
    name="feature_dataset",
    user_metadata={
        "source": "external_api",
        "collection_date": "2024-01-15",
        "num_features": len(df.columns),
        "quality_score": 0.95
    },
    tags=["features", "validated"]
)

Save with Custom Artifact Type

from zenml import save_artifact
from zenml.enums import ArtifactType
from sklearn.ensemble import RandomForestClassifier

model = RandomForestClassifier(n_estimators=100)
model.fit(X_train, y_train)

artifact = save_artifact(
    data=model,
    name="random_forest_model",
    artifact_type=ArtifactType.MODEL,
    tags=["sklearn", "classification"],
    user_metadata={
        "accuracy": 0.92,
        "n_estimators": 100
    }
)

Save Inside a Step

from zenml import step, save_artifact
import pandas as pd

@step
def process_and_save_data() -> None:
    # Load and process data
    df = pd.read_csv("data.csv")
    processed_df = df.dropna()
    
    # Save intermediate result
    save_artifact(
        data=processed_df,
        name="intermediate_data",
        tags=["intermediate", "cleaned"]
    )
    
    # Continue with more processing
    final_df = processed_df.reset_index(drop=True)
    
    # Save final result
    save_artifact(
        data=final_df,
        name="final_processed_data",
        tags=["final", "ready-for-training"]
    )

Save with Custom Materializer

from zenml import save_artifact
from zenml.materializers import BuiltInMaterializer
import pickle

class CustomObject:
    def __init__(self, data):
        self.data = data

custom_obj = CustomObject(data={"key": "value"})

artifact = save_artifact(
    data=custom_obj,
    name="custom_object",
    materializer=BuiltInMaterializer
)

Save Multiple Artifacts

from zenml import save_artifact
import pandas as pd
import numpy as np

# Save training data
train_df = pd.DataFrame({"x": range(800), "y": range(800)})
train_artifact = save_artifact(
    data=train_df,
    name="experiment_data",
    version="train",
    tags=["training"]
)

# Save test data
test_df = pd.DataFrame({"x": range(200), "y": range(200)})
test_artifact = save_artifact(
    data=test_df,
    name="experiment_data",
    version="test",
    tags=["testing"]
)

# Save model weights
weights = np.random.rand(10, 10)
weights_artifact = save_artifact(
    data=weights,
    name="model_weights",
    tags=["experiment"]
)

Optimize Performance for Large Artifacts

from zenml import save_artifact
import pandas as pd

# For very large datasets, disable metadata extraction and visualization
large_df = pd.DataFrame({"data": range(10000000)})

artifact = save_artifact(
    data=large_df,
    name="huge_dataset",
    extract_metadata=False,  # Skip metadata extraction
    include_visualizations=False,  # Skip visualization generation
    tags=["large", "raw"]
)

Version Management

from zenml import save_artifact
import pandas as pd

df = pd.DataFrame({"data": [1, 2, 3]})

# Save version 1
v1 = save_artifact(data=df, name="dataset", version="1")

# Update data
df_updated = pd.DataFrame({"data": [1, 2, 3, 4, 5]})

# Save version 2
v2 = save_artifact(data=df_updated, name="dataset", version="2")

# Save with auto-increment (becomes version 3)
v3 = save_artifact(data=df_updated, name="dataset")

Save and Link to Model

from zenml import step, save_artifact, link_artifact_to_model, Model
import pandas as pd

@step(model=Model(name="my_model", version="1.0"))
def create_and_link_artifact() -> None:
    # Create artifact
    df = pd.DataFrame({"predictions": [0.1, 0.9, 0.3]})
    
    artifact = save_artifact(
        data=df,
        name="prediction_results",
        tags=["predictions"]
    )
    
    # Link to model
    link_artifact_to_model(artifact)

Use Cases

Save intermediate results during complex processing without making them official step outputs
Store debug information for troubleshooting
Archive experiment results for later analysis
Create versioned datasets outside of pipeline runs
Share data between teams by saving to a known artifact name
Checkpoint long-running processes to enable resumption

Important Notes

Artifacts saved with save_artifact() are stored in the artifact store under custom_artifacts/{name}/{uuid} by default
When called inside a step, the artifact is automatically linked to the current step run and model (if configured)
Each artifact gets a unique URI to prevent conflicts
Artifacts can be loaded later using load_artifact() with the artifact name and optional version

load_artifact

Load saved artifacts

register_artifact

link_artifact_to_model

Link artifacts to models

ExternalArtifact

Use artifacts as step inputs

Core API

Context & Metadata

Artifacts

Tags & Organization

Utilities

Stack Components

save_artifact

Signature

Parameters

Returns

Examples

Save a Simple Artifact

Save with Version and Tags

Save with Metadata

Save with Custom Artifact Type

Save Inside a Step

Save with Custom Materializer

Save Multiple Artifacts

Optimize Performance for Large Artifacts

Version Management

Save and Link to Model

Use Cases

Important Notes

load_artifact

register_artifact

link_artifact_to_model

ExternalArtifact

Build docs developers (and LLMs) love

Core API

Context & Metadata

Artifacts

Tags & Organization

Utilities

Stack Components

​Signature

​Parameters

​Returns

​Examples

​Save a Simple Artifact

​Save with Version and Tags

​Save with Metadata

​Save with Custom Artifact Type

​Save Inside a Step

​Save with Custom Materializer

​Save Multiple Artifacts

​Optimize Performance for Large Artifacts

​Version Management

​Save and Link to Model

​Use Cases

​Important Notes

​Related

load_artifact

register_artifact

link_artifact_to_model

ExternalArtifact

Build docs developers (and LLMs) love

Signature

Parameters

Returns

Examples

Save a Simple Artifact

Save with Version and Tags

Save with Metadata

Save with Custom Artifact Type

Save Inside a Step

Save with Custom Materializer

Save Multiple Artifacts

Optimize Performance for Large Artifacts

Version Management

Save and Link to Model

Use Cases

Important Notes

Related