R-Bench expands on the classic strawberry problem and focuses on extra logic and recall problems for LLMs centered around the letter R. Counting the number of letter R's in words has proven tricky for many LLMs. Especially non-reasoning models. This test takes that to a new level by including extra scenarios related to counting letters in strings.
Generated on 2025-04-14 18:19:46
Model | Pass Rate | Token Usage | Cost |
---|---|---|---|
openai/o3-mini |
|
15,184 (in: 13,541, out: 1,643) | $0.1237 (Solving: $0.0735, Grading: $0.0503) |
openai/o1-mini |
|
15,557 (in: 13,849, out: 1,708) | $0.2269 (Solving: $0.1752, Grading: $0.0517) |
openai/gpt-4.1 |
|
15,730 (in: 13,937, out: 1,793) | $0.0890 (Solving: $0.0363, Grading: $0.0528) |
openai/gpt-4.1-mini |
|
14,440 (in: 12,640, out: 1,800) | $0.0548 (Solving: $0.0052, Grading: $0.0496) |
anthropic/claude-3-7-sonnet-latest |
|
14,201 (in: 12,402, out: 1,799) | $0.0981 (Solving: $0.0491, Grading: $0.0490) |
openai/gpt-4o-mini |
|
13,894 (in: 12,108, out: 1,786) | $0.0498 (Solving: $0.0016, Grading: $0.0481) |
openai/gpt-4o |
|
14,158 (in: 12,144, out: 2,014) | $0.0779 (Solving: $0.0274, Grading: $0.0505) |
openai/gpt-4.1-nano |
|
14,132 (in: 12,289, out: 1,843) | $0.0503 (Solving: $0.0012, Grading: $0.0492) |
anthropic/claude-3-5-sonnet-latest |
|
13,251 (in: 11,396, out: 1,855) | $0.0795 (Solving: $0.0324, Grading: $0.0470) |
ollama/gemma2:latest |
|
13,594 (in: 11,604, out: 1,990) | $0.0489 (Solving: $0.0000, Grading: $0.0489) |
ollama/phi4:latest |
|
15,630 (in: 13,355, out: 2,275) | $0.0561 (Solving: $0.0000, Grading: $0.0561) |
ollama/llama3.2:latest |
|
13,755 (in: 11,642, out: 2,113) | $0.0502 (Solving: $0.0000, Grading: $0.0502) |
ollama/gemma3:12b |
|
13,849 (in: 11,901, out: 1,948) | $0.0492 (Solving: $0.0000, Grading: $0.0492) |
openai/gpt-3.5-turbo |
|
12,474 (in: 10,516, out: 1,958) | $0.0477 (Solving: $0.0018, Grading: $0.0459) |
ollama/cogito:8b |
|
13,644 (in: 11,444, out: 2,200) | $0.0506 (Solving: $0.0000, Grading: $0.0506) |
ollama/phi3.5:latest |
|
16,739 (in: 14,320, out: 2,419) | $0.0600 (Solving: $0.0000, Grading: $0.0600) |
ollama/qwen2.5-coder:3b |
|
14,182 (in: 12,056, out: 2,126) | $0.0514 (Solving: $0.0000, Grading: $0.0514) |
ollama/cogito:3b |
|
14,151 (in: 12,046, out: 2,105) | $0.0512 (Solving: $0.0000, Grading: $0.0512) |
Index | Problem Name | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 |
Rs - StrawberryProblem Text:how many letter R's are in the word strawberry?
Grading Rules:must state the correct answer
Correct Answer:3
Model Results:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2 |
Rs - ComplexProblem Text:how many letter R's are in the sentence "ravens roost on a berry colored rangerover"?
Grading Rules:must state the correct answer
Correct Answer:8
Model Results:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3 |
Count Rs - Ignore Last WordProblem Text:Ignoring the last word, how many letter R's are in the phrase "rural road runner" ignoring vowels?
Grading Rules:must correctly ignore vowels and count R's
Correct Answer:3
Model Results:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
4 |
Count Rs - Ignore first wordProblem Text:Ignoring the first word, how many letter R's are in the phrase "red roses rarely ripen right"?
Grading Rules:must correctly ignore first word
Correct Answer:5
Model Results:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
5 |
Count Rs - Only first and last wordProblem Text:Counting letters in only the first and last words, how many R's are in "royal ravens rarely roam"?
Grading Rules:must correctly count only first and last words
Correct Answer:2
Model Results:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
6 |
Count Rs - Capital letters onlyProblem Text:How many uppercase letter R's are in "Rural Roaming Rancho"?
Grading Rules:must count only uppercase letters
Correct Answer:3
Model Results:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
7 |
Count Rs - Exclude repeated wordsProblem Text:Excluding duplicate words, how many R's are in "rare rare rabbits run run rapidly"?
Grading Rules:must count only unique words
Correct Answer:5
Model Results:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
8 |
Count Rs - Ignore letters after SProblem Text:Ignoring letters in words after the first S appears in the word, how many R's are in "restored servers start readily"?
Grading Rules:must correctly ignore letters after S
Correct Answer:2
Model Results:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
9 |
Count Rs - Only middle wordProblem Text:Only looking at the middle word in the phrase, how many R's are there in "rapid rain rarely"?
Grading Rules:must correctly identify middle word
Correct Answer:1
Model Results:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
10 |
Count Rs next to number charactersProblem Text:Count all the letter R's in the following phrase where the R is next to a number character: "1R1RRRPPPR5"?
Grading Rules:must correctly ignore numbers
Correct Answer:3
Model Results:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
11 |
Count Rs in the Longest WordProblem Text:Count the letter R's in the longest word in the phrase: "Rapid runner races"?
Grading Rules:must correctly count the letters
Correct Answer:2
Model Results:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
12 |
Count Rs - No R's ExistProblem Text:Count the letter R's in the phrase: "This Sentance is a Fancy Message"?
Grading Rules:must correctly count the letters
Correct Answer:0
Model Results:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
13 |
Count Rs - No R's ExistProblem Text:Count the letter R's in the phrase: "This Sentance is a Fancy Message"?
Grading Rules:must correctly count the letters
Correct Answer:0
Model Results:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
14 |
Count Rs followed by vowelsProblem Text:How many letter R's in the sentence "Ravens roost on a berry colored rangerover" are immediately followed by a vowel (a, e, i, o, u)?
Grading Rules:must correctly count only the R's followed by vowels
Correct Answer:5
Model Results:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
15 |
Count internal RsProblem Text:How many letter R's in the word "rearrange" are not at the beginning or the end of the word?
Grading Rules:must correctly count only the R's that are not the first or last letter
Correct Answer:2
Model Results:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
16 |
Count Rs in every second wordProblem Text:In the sentence "Red roses are rarely red," count the number of letter R's in every second word, starting from the first word.
Grading Rules:must correctly identify every second word and count the R's in those
Correct Answer:3
Model Results:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
17 |
Count Rs in words with SProblem Text:In the sentence "Ravens and sparrows share resources," count the number of letter R's in words that also contain the letter S.
Grading Rules:must correctly identify words containing S and count the R's in those words
Correct Answer:6
Model Results:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
18 |
Count Rs in repeated wordsProblem Text:In the sentence "Rare rabbits run rapidly, but rare rabbits rest rarely," count the number of letter R's in unique words that appear more than once.
Grading Rules:must identify unique words that appear more than once and count the R's in those words
Correct Answer:3
Model Results:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
19 |
Count Rs in even-length wordsProblem Text:In the sentence "river rowers raft happily" count the number of letter R's in words that have an even number of letters.
Grading Rules:must correctly identify words with even number of letters and count the R's in those
Correct Answer:3
Model Results:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
20 |
Count Rs in words starting with a vowelProblem Text:In the sentence "Eagles and ostriches are birds," count the number of letter R's in words that start with a vowel.
Grading Rules:must correctly identify words starting with a vowel and count the R's in those
Correct Answer:2
Model Results:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
21 |
Count Rs in long wordsProblem Text:In the sentence "The remarkable researcher presented revolutionary results," count the number of letter R's in words that have MORE THAN 10 letters.
Grading Rules:must correctly identify that revolutionary is the only word with more than 10 letters or say the answer is 2
Correct Answer:2
Model Results:
|