Contents
- Measurements
- Observations
- Incremental reads + withUnsafeBytes is unequivocally the best method
- AsyncBytes (bytes(from:)) is surprisingly not bad – in this specific case
- withUnsafeBytes is way faster than “safe” access to Data‘s contents
- withUnsafeBytes doubles the memory usage of the target Data
- Reading a file with URLSession takes more than one CPU core
- for loops are faster than forEach & reduce
- forEach & reduce perform the same
- Similar performance characteristics between [old] Intel Xeons and Apple Silicon
- You’re probably not going to be I/O limited on Apple SSDs
What’s the best way to read a stream of bytes with URLSession
? That’s the simple question I set out to answer. I wrote some benchmarks. They read a 128 MiB file and perform a contrived aggregation of its content bytes (a joking “hash” of them, merely to ensure the actual reads aren’t optimised out).
⚠️ In a nutshell, the results here demonstrate the best-case performance for each of the methods evaluated. These benchmarks are very simple, which makes them relatively easy for the Swift compiler to optimise well. In less trivial, real-world code, the optimiser might not do so great. So these benchmarks and their results are merely one collective data point in the bigger picture of just how the heck to read files efficiently.
There’s two key decisions you must make: which specific URLSession
API will you use, and how will you access the bytes themselves.
Measurements
Each benchmark was run a hundred times or for 30 seconds (whichever limit was hit first). I’m highlighting here just the medians (in general there wasn’t much variation anyway), but you can dig into the other percentiles & metrics via the disclosure triangles, if you like.
I’m pretty sure the reads were all served out of the kernel’s in-memory file system cache, judging by the lack of SSD read I/O reported by iStat Menus. But I didn’t go out of my way to verify this.
⚠️ “Peak RAM” is as reported by the Benchmark package, based on (if I understand it correctly) periodic sampling of the process RSS. As such it’s not necessarily completely accurate, due to the potential to miss brief peaks.
M2 MacBook Air
Method | Wall time (ms) | CPU time (ms) | Throughput (MiB/s) | Peak RAM (MB) |
---|---|---|---|---|
bytes(from:) and for loop | 79 | 138 | 1,620 | 91 |
bytes(from:) and reduce | 79 | 138 | 1,620 | 84 |
data(from:) and for loop | 605 | 641 | 212 | 265 |
data(from:) and for loop inside withUnsafeBytes | 60 | 95 | 2,133 | 338 |
data(from:) and forEach | 765 | 800 | 167 | 262 |
data(from:) and reduce | 750 | 784 | 171 | 290 |
dataTask(with:) and an incremental delegate with for loop | 560 | 617 | 229 | 53 |
dataTask(with:) and an incremental delegate with for loop inside withUnsafeBytes | 36 | 75 | 3,556 | 26 |
dataTask(with:) and an incremental delegate with forEach | 719 | 775 | 178 | 51 |
dataTask(with:) and an incremental delegate with reduce | 709 | 765 | 167 | 45 |
dataTask(with:completionHandler:) and for loop | 590 | 630 | 217 | 442 |
dataTask(with:completionHandler:) and for loop inside withUnsafeBytes | 57 | 98 | 2,246 | 504 |
dataTask(with:completionHandler:) and forEach | 742 | 783 | 173 | 470 |
dataTask(with:completionHandler:) and reduce | 742 | 786 | 173 | 485 |
Full results (raw text)
bytewise read using bytes(from:) and for loop
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 35 │ 36 │ 37 │ 37 │ 37 │ 67 │ 69 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 68 │ 91 │ 91 │ 91 │ 94 │ 94 │ 94 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases │ 1841 │ 1869 │ 1883 │ 1911 │ 1925 │ 1939 │ 1953 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains │ 1312 │ 1332 │ 1342 │ 1362 │ 1372 │ 1382 │ 1392 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 24 │ 25 │ 25 │ 25 │ 25 │ 25 │ 25 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 136 │ 137 │ 138 │ 138 │ 138 │ 139 │ 140 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 79 │ 79 │ 79 │ 79 │ 80 │ 81 │ 81 │ 100 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using bytes(from:) and reduce
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 35 │ 36 │ 37 │ 37 │ 37 │ 67 │ 69 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 68 │ 83 │ 84 │ 85 │ 88 │ 88 │ 88 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases │ 1840 │ 1869 │ 1897 │ 1911 │ 1925 │ 1953 │ 1967 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains │ 1312 │ 1332 │ 1352 │ 1362 │ 1372 │ 1392 │ 1402 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 24 │ 25 │ 25 │ 25 │ 25 │ 25 │ 25 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 137 │ 138 │ 138 │ 138 │ 138 │ 139 │ 140 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 79 │ 79 │ 79 │ 79 │ 80 │ 80 │ 81 │ 100 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using data(from:) and for loop
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 40 │ 43 │ 44 │ 45 │ 47 │ 76 │ 76 │ 50 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 167 │ 230 │ 265 │ 278 │ 286 │ 297 │ 297 │ 50 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 50 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 50 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 21 │ 23 │ 23 │ 23 │ 23 │ 23 │ 23 │ 50 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 631 │ 639 │ 641 │ 647 │ 659 │ 676 │ 676 │ 50 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 600 │ 603 │ 605 │ 610 │ 625 │ 642 │ 642 │ 50 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using data(from:) and for loop inside withUnsafeBytes
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 39 │ 44 │ 44 │ 45 │ 47 │ 75 │ 76 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 150 │ 293 │ 338 │ 398 │ 419 │ 439 │ 445 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases │ 11 │ 11 │ 11 │ 11 │ 11 │ 11 │ 11 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains │ 5 │ 5 │ 5 │ 5 │ 5 │ 5 │ 5 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 21 │ 22 │ 22 │ 23 │ 23 │ 23 │ 23 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 79 │ 93 │ 95 │ 96 │ 98 │ 106 │ 110 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 49 │ 59 │ 60 │ 61 │ 62 │ 68 │ 71 │ 100 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using data(from:) and forEach
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 41 │ 43 │ 44 │ 45 │ 47 │ 77 │ 77 │ 40 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 145 │ 228 │ 262 │ 279 │ 292 │ 296 │ 296 │ 40 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 40 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 40 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 22 │ 22 │ 23 │ 23 │ 23 │ 23 │ 23 │ 40 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 782 │ 794 │ 800 │ 805 │ 806 │ 816 │ 816 │ 40 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 750 │ 760 │ 765 │ 771 │ 773 │ 783 │ 783 │ 40 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using data(from:) and reduce
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 41 │ 44 │ 44 │ 45 │ 47 │ 77 │ 77 │ 40 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 165 │ 254 │ 290 │ 338 │ 353 │ 361 │ 361 │ 40 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 40 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 40 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 22 │ 22 │ 22 │ 23 │ 23 │ 23 │ 23 │ 40 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 771 │ 777 │ 784 │ 789 │ 792 │ 796 │ 796 │ 40 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 738 │ 742 │ 750 │ 756 │ 758 │ 760 │ 760 │ 40 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using dataTask(with:) and an incremental delegate with for loop
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 34 │ 35 │ 36 │ 36 │ 37 │ 69 │ 69 │ 54 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 52 │ 52 │ 53 │ 57 │ 57 │ 57 │ 57 │ 54 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 54 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 54 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 26 │ 26 │ 27 │ 27 │ 27 │ 27 │ 27 │ 54 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 616 │ 616 │ 617 │ 617 │ 617 │ 620 │ 620 │ 54 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 559 │ 559 │ 560 │ 560 │ 560 │ 564 │ 564 │ 54 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using dataTask(with:) and an incremental delegate with for loop inside withUnsafeBytes
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 47 │ 51 │ 53 │ 55 │ 57 │ 87 │ 87 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 22 │ 26 │ 26 │ 27 │ 27 │ 27 │ 27 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases │ 6135 │ 6147 │ 6147 │ 6147 │ 6150 │ 6150 │ 6150 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains │ 2046 │ 2051 │ 2051 │ 2051 │ 2051 │ 2051 │ 2051 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 35 │ 35 │ 35 │ 35 │ 35 │ 35 │ 35 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 73 │ 74 │ 75 │ 75 │ 76 │ 76 │ 76 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 35 │ 36 │ 36 │ 36 │ 36 │ 37 │ 37 │ 100 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using dataTask(with:) and an incremental delegate with forEach
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 34 │ 35 │ 36 │ 36 │ 37 │ 68 │ 68 │ 42 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 47 │ 50 │ 51 │ 51 │ 51 │ 51 │ 51 │ 42 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 42 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 42 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 26 │ 27 │ 27 │ 27 │ 27 │ 27 │ 27 │ 42 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 773 │ 774 │ 775 │ 775 │ 776 │ 779 │ 779 │ 42 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 717 │ 718 │ 719 │ 719 │ 719 │ 722 │ 722 │ 42 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using dataTask(with:) and an incremental delegate with reduce
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 34 │ 35 │ 36 │ 36 │ 37 │ 70 │ 70 │ 43 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 45 │ 45 │ 45 │ 45 │ 45 │ 45 │ 45 │ 43 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 43 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 43 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 26 │ 26 │ 27 │ 27 │ 27 │ 27 │ 27 │ 43 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 763 │ 764 │ 765 │ 766 │ 766 │ 768 │ 768 │ 43 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 707 │ 709 │ 709 │ 710 │ 710 │ 714 │ 714 │ 43 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using dataTask(with:completionHandler:) and for loop
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 39 │ 43 │ 44 │ 47 │ 50 │ 79 │ 79 │ 51 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 378 │ 410 │ 442 │ 471 │ 496 │ 528 │ 528 │ 51 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 51 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 51 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 27 │ 27 │ 28 │ 28 │ 28 │ 28 │ 28 │ 51 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 624 │ 627 │ 630 │ 632 │ 634 │ 640 │ 640 │ 51 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 587 │ 589 │ 590 │ 594 │ 597 │ 601 │ 601 │ 51 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using dataTask(with:completionHandler:) and for loop inside withUnsafeBytes
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 38 │ 43 │ 45 │ 46 │ 48 │ 76 │ 76 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 394 │ 462 │ 504 │ 525 │ 547 │ 583 │ 587 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases │ 5 │ 5 │ 5 │ 5 │ 5 │ 5 │ 5 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains │ 3 │ 3 │ 3 │ 3 │ 3 │ 3 │ 3 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 27 │ 27 │ 28 │ 28 │ 28 │ 28 │ 28 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 92 │ 96 │ 98 │ 100 │ 102 │ 105 │ 106 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 55 │ 57 │ 57 │ 58 │ 59 │ 61 │ 63 │ 100 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using dataTask(with:completionHandler:) and forEach
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 38 │ 41 │ 44 │ 47 │ 51 │ 74 │ 74 │ 41 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 391 │ 430 │ 470 │ 560 │ 587 │ 617 │ 617 │ 41 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 41 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 41 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 27 │ 28 │ 28 │ 28 │ 28 │ 28 │ 28 │ 41 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 773 │ 776 │ 783 │ 789 │ 790 │ 795 │ 795 │ 41 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 734 │ 737 │ 742 │ 749 │ 751 │ 755 │ 755 │ 41 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using dataTask(with:completionHandler:) and reduce
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 38 │ 43 │ 44 │ 46 │ 51 │ 77 │ 77 │ 41 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 348 │ 408 │ 451 │ 485 │ 499 │ 548 │ 548 │ 41 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 41 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 41 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 27 │ 28 │ 28 │ 28 │ 28 │ 28 │ 28 │ 41 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 770 │ 776 │ 786 │ 788 │ 793 │ 796 │ 796 │ 41 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 732 │ 737 │ 742 │ 749 │ 752 │ 755 │ 755 │ 41 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
10-core iMac Pro
Method | Wall time (ms) | CPU time (ms) | Throughput (MiB/s) | Peak RAM (MB) |
---|---|---|---|---|
bytes(from:) and for loop | 138 | 250 | 928 | 54 |
bytes(from:) and reduce | 139 | 251 | 921 | 53 |
data(from:) and for loop | 953 | 1,023 | 134 | 257 |
data(from:) and for loop inside withUnsafeBytes | 140 | 208 | 914 | 344 |
data(from:) and forEach | 1,181 | 1,254 | 108 | 236 |
data(from:) and reduce | 1,163 | 1,233 | 110 | 232 |
dataTask(with:) and an incremental delegate with for loop | 848 | 964 | 151 | 40 |
dataTask(with:) and an incremental delegate with for loop inside withUnsafeBytes | 56 | 140 | 2,286 | 23 |
dataTask(with:) and an incremental delegate with forEach | 1,066 | 1,181 | 120 | 35 |
dataTask(with:) and an incremental delegate with reduce | 1,072 | 1,185 | 119 | 43 |
dataTask(with:completionHandler:) and for loop | 948 | 1,026 | 135 | 375 |
dataTask(with:completionHandler:) and for loop inside withUnsafeBytes | 137 | 215 | 934 | 591 |
dataTask(with:completionHandler:) and forEach | 1,179 | 1,258 | 109 | 370 |
dataTask(with:completionHandler:) and reduce | 1,176 | 1,254 | 109 | 416 |
Full results (raw text)
bytewise read using bytes(from:) and for loop
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 36 │ 37 │ 37 │ 37 │ 37 │ 68 │ 69 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 45 │ 51 │ 54 │ 56 │ 62 │ 66 │ 66 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases │ 1952 │ 2023 │ 2051 │ 2079 │ 2093 │ 2135 │ 2135 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains │ 1392 │ 1442 │ 1462 │ 1482 │ 1492 │ 1522 │ 1522 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 21 │ 21 │ 21 │ 21 │ 21 │ 21 │ 21 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 245 │ 248 │ 250 │ 251 │ 254 │ 259 │ 267 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 136 │ 138 │ 138 │ 140 │ 141 │ 145 │ 146 │ 100 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using bytes(from:) and reduce
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 36 │ 37 │ 37 │ 37 │ 37 │ 67 │ 69 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 48 │ 52 │ 53 │ 54 │ 56 │ 58 │ 60 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases │ 1953 │ 2009 │ 2037 │ 2065 │ 2079 │ 2121 │ 2121 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains │ 1392 │ 1432 │ 1452 │ 1472 │ 1482 │ 1512 │ 1512 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 21 │ 21 │ 21 │ 21 │ 21 │ 21 │ 21 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 246 │ 249 │ 251 │ 253 │ 256 │ 274 │ 278 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 136 │ 138 │ 139 │ 140 │ 141 │ 150 │ 151 │ 100 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using data(from:) and for loop
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 41 │ 42 │ 43 │ 43 │ 72 │ 76 │ 76 │ 32 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 188 │ 243 │ 257 │ 266 │ 279 │ 316 │ 316 │ 32 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 32 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 32 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 18 │ 18 │ 19 │ 19 │ 19 │ 19 │ 19 │ 32 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 1010 │ 1015 │ 1023 │ 1031 │ 1040 │ 1060 │ 1060 │ 32 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 941 │ 946 │ 953 │ 958 │ 968 │ 985 │ 985 │ 32 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using data(from:) and for loop inside withUnsafeBytes
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 38 │ 42 │ 43 │ 44 │ 47 │ 72 │ 73 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 244 │ 328 │ 344 │ 352 │ 358 │ 369 │ 370 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases │ 11 │ 11 │ 11 │ 11 │ 11 │ 11 │ 11 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains │ 5 │ 5 │ 5 │ 5 │ 5 │ 5 │ 5 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 18 │ 18 │ 18 │ 18 │ 18 │ 19 │ 19 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 203 │ 207 │ 208 │ 210 │ 213 │ 221 │ 234 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 135 │ 139 │ 140 │ 141 │ 143 │ 148 │ 159 │ 100 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using data(from:) and forEach
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 41 │ 42 │ 43 │ 43 │ 73 │ 75 │ 75 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 171 │ 225 │ 236 │ 263 │ 283 │ 288 │ 288 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 18 │ 18 │ 18 │ 19 │ 19 │ 19 │ 19 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 1247 │ 1250 │ 1254 │ 1266 │ 1271 │ 1284 │ 1284 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 1177 │ 1179 │ 1181 │ 1194 │ 1199 │ 1211 │ 1211 │ 26 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using data(from:) and reduce
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 39 │ 42 │ 43 │ 43 │ 72 │ 79 │ 79 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 207 │ 226 │ 232 │ 243 │ 260 │ 278 │ 278 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 18 │ 18 │ 18 │ 19 │ 19 │ 19 │ 19 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 1225 │ 1228 │ 1233 │ 1243 │ 1250 │ 1269 │ 1269 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 1157 │ 1160 │ 1163 │ 1172 │ 1178 │ 1198 │ 1198 │ 26 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using dataTask(with:) and an incremental delegate with for loop
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 35 │ 35 │ 36 │ 36 │ 65 │ 68 │ 68 │ 36 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 32 │ 36 │ 40 │ 45 │ 48 │ 52 │ 52 │ 36 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 36 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 36 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 23 │ 23 │ 23 │ 23 │ 23 │ 23 │ 23 │ 36 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 954 │ 958 │ 964 │ 965 │ 975 │ 992 │ 992 │ 36 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 841 │ 845 │ 848 │ 851 │ 857 │ 871 │ 871 │ 36 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using dataTask(with:) and an incremental delegate with for loop inside withUnsafeBytes
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 47 │ 51 │ 53 │ 54 │ 56 │ 83 │ 84 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 17 │ 20 │ 23 │ 24 │ 25 │ 25 │ 25 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases │ 5895 │ 6067 │ 6087 │ 6099 │ 6111 │ 6123 │ 6123 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains │ 1966 │ 2024 │ 2031 │ 2035 │ 2039 │ 2043 │ 2043 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 32 │ 32 │ 32 │ 32 │ 33 │ 33 │ 33 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 137 │ 139 │ 140 │ 142 │ 147 │ 152 │ 155 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 55 │ 55 │ 56 │ 56 │ 58 │ 60 │ 62 │ 100 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using dataTask(with:) and an incremental delegate with forEach
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 35 │ 35 │ 36 │ 36 │ 65 │ 69 │ 69 │ 29 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 29 │ 33 │ 35 │ 37 │ 39 │ 41 │ 41 │ 29 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 29 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 29 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 23 │ 23 │ 23 │ 23 │ 23 │ 23 │ 23 │ 29 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 1169 │ 1179 │ 1181 │ 1184 │ 1190 │ 1205 │ 1205 │ 29 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 1056 │ 1065 │ 1066 │ 1069 │ 1074 │ 1086 │ 1086 │ 29 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using dataTask(with:) and an incremental delegate with reduce
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 35 │ 35 │ 35 │ 36 │ 65 │ 68 │ 68 │ 28 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 30 │ 35 │ 43 │ 46 │ 48 │ 52 │ 52 │ 28 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 28 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 28 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 23 │ 23 │ 23 │ 23 │ 23 │ 23 │ 23 │ 28 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 1176 │ 1182 │ 1185 │ 1190 │ 1198 │ 1200 │ 1200 │ 28 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 1061 │ 1067 │ 1072 │ 1075 │ 1080 │ 1083 │ 1083 │ 28 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using dataTask(with:completionHandler:) and for loop
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 40 │ 42 │ 43 │ 43 │ 72 │ 75 │ 75 │ 32 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 356 │ 368 │ 375 │ 386 │ 400 │ 407 │ 407 │ 32 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 32 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 32 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 23 │ 24 │ 24 │ 24 │ 24 │ 24 │ 24 │ 32 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 1016 │ 1023 │ 1026 │ 1032 │ 1041 │ 1048 │ 1048 │ 32 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 940 │ 946 │ 948 │ 952 │ 961 │ 967 │ 967 │ 32 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using dataTask(with:completionHandler:) and for loop inside withUnsafeBytes
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 40 │ 42 │ 43 │ 43 │ 44 │ 74 │ 74 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 370 │ 580 │ 591 │ 599 │ 607 │ 613 │ 614 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases │ 5 │ 5 │ 5 │ 5 │ 5 │ 5 │ 5 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains │ 3 │ 3 │ 3 │ 3 │ 3 │ 3 │ 3 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 23 │ 23 │ 24 │ 24 │ 24 │ 24 │ 24 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 210 │ 213 │ 215 │ 217 │ 220 │ 236 │ 238 │ 100 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 133 │ 135 │ 137 │ 138 │ 140 │ 153 │ 154 │ 100 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using dataTask(with:completionHandler:) and forEach
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 41 │ 42 │ 42 │ 43 │ 71 │ 75 │ 75 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 332 │ 364 │ 370 │ 384 │ 415 │ 418 │ 418 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 23 │ 24 │ 24 │ 24 │ 24 │ 24 │ 24 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 1243 │ 1253 │ 1258 │ 1268 │ 1270 │ 1277 │ 1277 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 1164 │ 1175 │ 1179 │ 1188 │ 1190 │ 1201 │ 1201 │ 26 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
bytewise read using dataTask(with:completionHandler:) and reduce
╒════════════════════════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╤═════════╕
│ Metric │ p0 │ p25 │ p50 │ p75 │ p90 │ p99 │ p100 │ Samples │
╞════════════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ Malloc (total) (K) │ 40 │ 42 │ 42 │ 43 │ 72 │ 75 │ 75 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Memory (resident peak) (M) │ 353 │ 392 │ 416 │ 452 │ 472 │ 473 │ 473 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Releases (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Retains (K) │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 4194 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Syscalls (total) (K) │ 23 │ 24 │ 24 │ 24 │ 24 │ 24 │ 24 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (total CPU) (ms) │ 1241 │ 1250 │ 1254 │ 1266 │ 1278 │ 1281 │ 1281 │ 26 │
├────────────────────────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┤
│ Time (wall clock) (ms) │ 1164 │ 1172 │ 1176 │ 1185 │ 1195 │ 1200 │ 1200 │ 26 │
╘════════════════════════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╧═════════╛
☝️ I didn’t include it in these initial results, but there’s also enumerateBytes
, carried over from NSData
. It performs identically to withUnsafeBytes
. However, it is officially deprecated (Apple claims that for-loops are the replacement, even though they’re an order of magnitude slower 🤨).
🤔 I also tried to test the NSData
bytes
property, but no matter how it’s used, it always results in the benchmark crashing. It seems like it is actually unusable from Swift due to a memory management bug in the bridging layer and/or Swift compiler…?
Observations
Incremental reads + withUnsafeBytes is unequivocally the best method
It’s dramatically faster than any other approach – both in wall time and overall CPU usage – and uses the least amount of memory by far.
Within the Data
-centric methods this doesn’t surprise me – with the incremental approach URLSession
can just hand data back as it comes in, in whatever chunk sizes are most convenient. In the other Data
-based approaches it has to aggregate everything into one final contiguous blob.
🤔 This is all assuming that URLSession
never memory-maps files, which I did not actually verify but does seem to be the case based on the performance and behaviour. This strikes me as very odd, however, because memory-mapping the files would very likely be significantly faster, in the cases where it has to provide the entire contents as a single Data
instance. And Data
already supports memory-mapping a file, very easily.
Of course, if your use-case doesn’t involve local files, then memory-mapping probably doesn’t apply anyway (unless URLSession
uses a disk cache and the file is already in the cache – but I don’t know if it supports that).
Implementation note
I utilised the incremental API by basically adapting it to invoke a closure (shown below), mainly because it made it easier to then test different byte enumeration approaches within it, but the results should hold for typical implementations of URLSessionDataDelegate
.
⚠️ This isn’t a robust implementation; it’s not suitable for use in a real program, merely sufficient for this very specific application in these benchmarks. It doesn’t communicate failures correctly, behaves very poorly if misused (e.g. by using it for more than one operation), naively blocks the thread that’s awaiting the data, etc. Please don’t use it as-is, but feel free to evolve it into a real solution for your own uses.
class IncrementalDataDelegate: NSObject, URLSessionDataDelegate {
private let task: URLSessionTask
private let handler: (Data) -> ()
private let done = NSCondition()
init(_ task: URLSessionTask,
handler: @escaping (Data) -> ()) {
self.task = task
self.handler = handler
super.init()
}
func urlSession(_ session: URLSession, dataTask: URLSessionDataTask, didReceive data: Data) {
precondition(self.task == dataTask)
self.handler(data)
}
func urlSession(_ session: URLSession, task: URLSessionTask, didCompleteWithError error: (any Error)?) {
precondition(self.task == task)
if let error {
preconditionFailure("Error: \(error)")
}
self.done.broadcast()
}
func wait() {
self.done.wait()
}
}
AsyncBytes (bytes(from:)) is surprisingly not bad – in this specific case
This was surprising to me because generally I’ve seen Swift’s AsyncSequence
stuff – especially for operating on individual bytes – being unusably slow and inefficient. It’s actually what prompted me to do these benchmarks, because I stubbornly tried using bytes(from:)
in a current project and the performance in that real app was god-awful. These benchmarks demonstrate that it doesn’t necessarily have to be, and there’s something more complicated going on. I’m yet to get to the bottom of that.
The problem seems to be that async code in general – but especially anything involving AsyncSequence
s – is terribly dependent on the compiler’s optimiser. If the optimiser does anything less than an astounding job on it, the performance can drop off a cliff.
So, while these results nominally recommend bytes(from:)
as a decent way to use URLSession
– being a respectable second-fastest in these benchmarks and noticeably easier to use than the fastest method – I’d be very cautious about it and test the performance early and often.
withUnsafeBytes
is way faster than “safe” access to Data
‘s contents
It’s an order of magnitude faster an Apple Silicon, and ‘merely’ seven to nine times faster on Intel.
This isn’t surprising – Data
‘s regular APIs involve actual function calls (if not also Objective-C message sends, depending on what exactly is being returned by URLSession
(native Data
or actual NSData
) and how Swift imports NSData
from Objective-C. withUnsafeBytes
provides basically direct memory access, with practically zero overhead.
However, it has one notable downside…
withUnsafeBytes
doubles the memory usage of the target Data
This surprised and disappointed me – Data
is supposed to already be a contiguous array of bytes, internally, so accessing those bytes with withUnsafeBytes
should be nothing more than returning a pointer to that internal storage. But in at least some cases, it doesn’t – instead, it allocates a whole new memory allocation, copies its contents to that allocation, and then provides that instead (and releases it afterwards – so repeated calls will incur this overhead every time).
This isn’t a huge issue when the Data
s in question are small – clearly it doesn’t hamper performance all that much, since it’s still the fastest way to access the bytes of even a 128 MiB Data
– but it can be an issue when the Data
s in question are not small. If you run out of free RAM, the cost of the kernel’s in-memory compression or swapping is very likely going to cripple the performance far beyond the degrees seen here by using the slow APIs.
Reading a file with URLSession takes more than one CPU core
I pointedly included both wall time and CPU time to highlight that there’s multiple cores engaged simultaneously for a single read. This isn’t surprising, but it’s important to remember if you’re doing lots of parallel I/O – you can’t just naively allocate one read operation per CPU core and expect linear scaling (notwithstanding CPU frequency scaling etc anyway).
Though, that’s generally true anyway because most systems don’t have enough disk or network I/O to keep up with the CPU anyway.
for loops are faster than forEach
& reduce
This might surprise some folks. It’s surely a bit of a sore point with functional programming dogmatists. The difference isn’t massive – in these benchmarks it’s only about 20%. Still, it’s measurable and noticeable.
I find the for-loop approach easier to write and read anyway, so IMO this is just another reason to favour that instead of functional programming styles. But not a reason to unilaterally favour one over the other.
forEach
& reduce
perform the same
Not surprising or news, but worth noting. In principle the optimiser should reduce them to the exact same machine code in the end.
Similar performance characteristics between [old] Intel Xeons and Apple Silicon
The M2 was faster, of course, but maybe not as much faster than one would expect – at best only twice as fast, which (subjectively) feels underwhelming given Apple’s numerous manufacturing and design advantages versus my iMac Pro’s old Xeon.
What I mean, though, is that the relative performance of the different methods is about the same irrespective of the platform. What’s good (or bad) on an M2 is likewise on an Intel CPU. Which is worth appreciating – although x86 is rapidly fading into irrelevance, it’s not quite there yet, and it’s always unpleasant when optimising for one architecture has the opposite effect on another.
You’re probably not going to be I/O limited on Apple SSDs
(for a single read at a time, that is)
Even in the very best case shown here – and despite the very light workload these benchmarks impose, on the actual file data – the best throughput was merely ~3.6 GB/s. That’s not bad, of course – only a few years ago that would have easily saturated any consumer storage device, even a big Thunderbolt RAID array of SSDs. But these days most of Apple’s computers have PCIe 4, quad-lane SSDs that have read speeds of about 7 GB/s.
And, this is all ignoring the fact that actually reading from an SSD has more overhead than merely reading from the kernel’s file system cache, as these benchmarks almost certainly did. So actual SSD read performance is very likely lower than what these benchmarks achieved.
That all said, it doesn’t necessarily take much to be I/O-limited – two or three concurrent reads, efficiently implemented, would probably do it. Certainly if you just spin up an operation per CPU core and they all try to do I/O at once, even a rather inefficient implementation will hit the SSD’s limits.