%%capture
!pip install phiml


from phiml.math import Tensor, tensor, map

def expensive_to_compute(x: float) -> float:
    import time
    time.sleep(1)  # Simulate an expensive computation
    return 2 * x

data = tensor([1.0, 2.0, 3.0], "data:b")


map(expensive_to_compute, data)

(2.000, 4.000, 6.000) along dataᵇ float64


from dataclasses import dataclass
from functools import cached_property

@dataclass(frozen=True)
class SequentialComputation:
    data: Tensor

    @cached_property
    def result(self) -> Tensor:
        return map(expensive_to_compute, self.data)

SequentialComputation(data).result

(2.000, 4.000, 6.000) along dataᵇ float64


from typing import Union
from phiml.dataclasses import parallel_property, parallel_compute

@dataclass(frozen=True)
class ParallelComputation:
    data: Tensor

    @parallel_property
    def result(self) -> Union[Tensor, float]:
        return expensive_to_compute(float(self.data))


from parallel_compute import ParallelComputation  # identical to above cell, but can be imported by workers

if __name__ == "__main__":
    computation = ParallelComputation(data)
    parallel_compute(computation, [ParallelComputation.result], max_workers=3)
    print(computation.result)

(2.000, 4.000, 6.000) along dataᵇ float64


@dataclass(frozen=True)
class ParallelDepComputation:
    data: Tensor

    @cached_property
    def tmp_result(self) -> Union[Tensor, float]:
        return expensive_to_compute(float(self.data))

    @cached_property
    def result(self) -> Union[Tensor, float]:
        return self.tmp_result + 1


from parallel_compute import ParallelDepComputation  # identical to above cell, but can be imported by workers
if __name__ == "__main__":
    computation = ParallelDepComputation(data)
    parallel_compute(computation, [ParallelDepComputation.result], max_workers=3)
    print(computation.result)

(3.000, 5.000, 7.000) along dataᵇ float64


computation.__dict__

{'data': (1.000, 2.000, 3.000) along dataᵇ,
 'result': (3.000, 5.000, 7.000) along dataᵇ float64}


import os
from phiml import mean, batch

@dataclass(frozen=True)
class ParallelMeanComputation:
    data: Tensor

    @parallel_property
    def individual_result(self) -> Union[Tensor, float]:
        print(f"Computing individual_result pid={os.getpid()}")
        return expensive_to_compute(float(self.data))

    @parallel_property(requires=batch)
    def mean(self) -> Union[Tensor, float]:
        print(f"Computing mean, pid={os.getpid()}")
        return mean(self.individual_result, batch)


from parallel_compute import ParallelMeanComputation  # identical to above cell, but can be imported by workers
if __name__ == "__main__":
    print(f"Host pid={os.getpid()}")
    computation = ParallelMeanComputation(data)
    parallel_compute(computation, [ParallelMeanComputation.mean], max_workers=3)
    print(computation.mean)

Host pid=3383
Computing individual_result pid=3444Computing individual_result pid=3446Computing individual_result pid=3445


Computing mean, pid=3383
float64 4.0


@dataclass(frozen=True)
class ParallelNormComputation:
    data: Tensor

    @parallel_property
    def individual_result(self) -> Union[Tensor, float]:
        print(f"Computing individual_result pid={os.getpid()}")
        return expensive_to_compute(float(self.data))

    @parallel_property(requires=batch)
    def mean(self) -> Union[Tensor, float]:
        print(f"Computing mean, pid={os.getpid()}")
        return mean(self.individual_result, batch)

    @parallel_property
    def normalized_result(self) -> Union[Tensor, float]:
        print(f"Computing normalized_result pid={os.getpid()}")
        return self.individual_result - self.mean


from parallel_compute import ParallelNormComputation
if __name__ == "__main__":
    print(f"Host pid={os.getpid()}")
    computation = ParallelNormComputation(data)
    parallel_compute(computation, [ParallelNormComputation.normalized_result], max_workers=3)
    print(computation.normalized_result)

Host pid=3383
Computing individual_result pid=3462Computing individual_result pid=3461Computing individual_result pid=3463


Computing normalized_result pid=3462Computing normalized_result pid=3461Computing normalized_result pid=3463


Computing mean, pid=3383
(-2.000, 0.000, 2.000) along dataᵇ

Parallel Computation in Φ_ML¶

Parallelization with `@parallel_property` and `parallel_compute`¶

Property Dependencies¶

Non-parallelizable Properties¶

Caching Properties on Disk¶

Parallel Computation in ΦML¶

Parallelization with @parallel_property and parallel_compute¶

Property Dependencies¶

Non-parallelizable Properties¶

Caching Properties on Disk¶

Parallel Computation in Φ_ML¶

Parallelization with `@parallel_property` and `parallel_compute`¶