Merge pull request #434 from medecau/multiprocessing-fold

eriknw · web-flow · commit 0434ddda9f9d · 2019-07-09T10:53:41.000-05:00
refactor parallel.fold
diff --git a/.gitignore b/.gitignore
@@ -4,3 +4,5 @@ dist/
 *.egg-info/
 bench/shakespeare.txt
 .coverage
+
+\.tox/
diff --git a/toolz/sandbox/parallel.py b/toolz/sandbox/parallel.py
@@ -1,8 +1,16 @@
+import functools
 from toolz.itertoolz import partition_all
 from toolz.compatibility import reduce, map
 from toolz.utils import no_default
 
 
+def _reduce(func, seq, initial=None):
+    if initial is None:
+        return functools.reduce(func, seq)
+    else:
+        return functools.reduce(func, seq, initial)
+
+
 def fold(binop, seq, default=no_default, map=map, chunksize=128, combine=None):
     """
     Reduce without guarantee of ordered reduction.
@@ -43,16 +51,22 @@ def fold(binop, seq, default=no_default, map=map, chunksize=128, combine=None):
     >>> fold(add, [1, 2, 3, 4], chunksize=2, map=map)
     10
     """
+    assert chunksize > 1
+
     if combine is None:
         combine = binop
 
     chunks = partition_all(chunksize, seq)
 
     # Evaluate sequence in chunks via map
     if default == no_default:
-        results = map(lambda chunk: reduce(binop, chunk), chunks)
+        results = map(
+            functools.partial(_reduce, binop),
+            chunks)
     else:
-        results = map(lambda chunk: reduce(binop, chunk, default), chunks)
+        results = map(
+            functools.partial(_reduce, binop, initial=default),
+            chunks)
 
     results = list(results)  # TODO: Support complete laziness
 
diff --git a/toolz/sandbox/tests/test_parallel.py b/toolz/sandbox/tests/test_parallel.py
@@ -2,13 +2,16 @@
 from toolz import reduce
 from operator import add
 from pickle import dumps, loads
+from multiprocessing import Pool
+
 
 # is comparison will fail between this and no_default
 no_default2 = loads(dumps('__no__default__'))
 
 
 def test_fold():
     assert fold(add, range(10), 0) == reduce(add, range(10), 0)
+    assert fold(add, range(10), 0, map=Pool().map) == reduce(add, range(10), 0)
     assert fold(add, range(10), 0, chunksize=2) == reduce(add, range(10), 0)
     assert fold(add, range(10)) == fold(add, range(10), 0)