Avoid char array allocation in Starlark `format` #23763

fmeum · 2024-09-25T14:09:04Z

Positional access via String#charAt is slightly faster than precreating the char array for Latin-1 strings and much faster for UTF-8 strings. It allocates less in both cases.

Also adds a --latin1 flag to the Benchmarks tool that allows benchmarking against Bazel's way of parsing Starlark files.

Before:

INFO: Running command line: bazel-bin/src/test/java/net/starlark/java/eval/Benchmarks --filter bench_format --seconds 20
File src/test/java/net/starlark/java/eval/testdata/bench_string.star:
benchmark                        ops     cpu/op    wall/op   steps/op   alloc/op
bench_format                16777215     1.46µs     1.46µs          7     2.26KB

INFO: Running command line: bazel-bin/src/test/java/net/starlark/java/eval/Benchmarks --filter bench_format --seconds 20 --latin1
File src/test/java/net/starlark/java/eval/testdata/bench_string.star:
benchmark                        ops     cpu/op    wall/op   steps/op   alloc/op
bench_format                16777215     1.47µs     1.46µs          7     2.26KB

After:

INFO: Running command line: bazel-bin/src/test/java/net/starlark/java/eval/Benchmarks --filter bench_format --seconds 20
File src/test/java/net/starlark/java/eval/testdata/bench_string.star:
benchmark                        ops     cpu/op    wall/op   steps/op   alloc/op
bench_format                16777215     1.79µs     1.79µs          7     1.67KB

INFO: Running command line: bazel-bin/src/test/java/net/starlark/java/eval/Benchmarks --filter bench_format --seconds 20 --latin1
File src/test/java/net/starlark/java/eval/testdata/bench_string.star:
benchmark                        ops     cpu/op    wall/op   steps/op   alloc/op
bench_format                16777215     1.37µs     1.37µs          7     1.67KB

fmeum · 2024-11-21T13:22:31Z

@tetromino Friendly ping

tetromino

Based on some internal testing on bazel query $VERY_LARGE_TARGET, this delivers a measurable CPU time savings, but does not translate into a statistically significant effect on overall wall time.

My only concern is in bench_string.star - you were running "".format(...), so the measurements you showed are probably not representative.

src/test/java/net/starlark/java/eval/testdata/bench_string.star

fmeum · 2024-11-25T19:38:50Z

Thanks, I fixed and reran the benchmark. It now shows that the new implementation is only better with the Latin-1 string encoding, but worse in UTF-8 standalone Starlark. Not sure whether that makes it a good idea.

tetromino · 2024-11-25T20:07:47Z

Interesting. In that case, we may want different behavior depending on whether the string is Latin1...

fmeum · 2024-11-25T21:31:08Z

Interesting. In that case, we may want different behavior depending on whether the string is Latin1...

You will probably be interested in #24417 :-)

Positional access via `String#charAt` is slightly faster than precreating the char array for Latin-1 strings and much faster for UTF-8 strings. It allocates less in both cases. Also adds a `--latin1` flag to the `Benchmarks` tool that allows benchmarking against Bazel's way of parsing Starlark files. Before: ``` INFO: Running command line: bazel-bin/src/test/java/net/starlark/java/eval/Benchmarks --filter bench_format --seconds 20 File src/test/java/net/starlark/java/eval/testdata/bench_string.star: benchmark ops cpu/op wall/op steps/op alloc/op bench_format 134217727 169ns 168ns 7 495B INFO: Running command line: bazel-bin/src/test/java/net/starlark/java/eval/Benchmarks --filter bench_format --seconds 20 --latin1 File src/test/java/net/starlark/java/eval/testdata/bench_string.star: benchmark ops cpu/op wall/op steps/op alloc/op bench_format 268435455 122ns 121ns 7 495B ``` After: ``` INFO: Running command line: bazel-bin/src/test/java/net/starlark/java/eval/Benchmarks --filter bench_format --seconds 20 File src/test/java/net/starlark/java/eval/testdata/bench_string.star: benchmark ops cpu/op wall/op steps/op alloc/op bench_format 268435455 110ns 109ns 7 479B INFO: Running command line: bazel-bin/src/test/java/net/starlark/java/eval/Benchmarks --filter bench_format --seconds 20 --latin1 File src/test/java/net/starlark/java/eval/testdata/bench_string.star: benchmark ops cpu/op wall/op steps/op alloc/op bench_format 268435455 113ns 112ns 7 479B ```

fmeum requested review from brandjon and tetromino as code owners September 25, 2024 14:09

github-actions bot added the awaiting-review PR is awaiting review from an assigned reviewer label Sep 25, 2024

iancha1992 added team-Remote-Exec Issues and PRs for the Execution (Remote) team team-Starlark-Interpreter Issues involving the Starlark interpreter used by Bazel and removed team-Remote-Exec Issues and PRs for the Execution (Remote) team labels Sep 25, 2024

tetromino requested changes Nov 21, 2024

View reviewed changes

src/test/java/net/starlark/java/eval/testdata/bench_string.star Outdated Show resolved Hide resolved

fmeum force-pushed the format-string branch from 31bba84 to cbec9b7 Compare November 26, 2024 09:22

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Avoid char array allocation in Starlark `format` #23763

Avoid char array allocation in Starlark `format` #23763

fmeum commented Sep 25, 2024 •

edited

Loading

fmeum commented Nov 21, 2024

tetromino left a comment

fmeum commented Nov 25, 2024

tetromino commented Nov 25, 2024

fmeum commented Nov 25, 2024

Avoid char array allocation in Starlark format #23763

Are you sure you want to change the base?

Avoid char array allocation in Starlark format #23763

Conversation

fmeum commented Sep 25, 2024 • edited Loading

fmeum commented Nov 21, 2024

tetromino left a comment

Choose a reason for hiding this comment

fmeum commented Nov 25, 2024

tetromino commented Nov 25, 2024

fmeum commented Nov 25, 2024

Avoid char array allocation in Starlark `format` #23763

Avoid char array allocation in Starlark `format` #23763

fmeum commented Sep 25, 2024 •

edited

Loading