ML Wiki

Tag: reasoning

11 items with this tag.

May 09, 2026
CodeAct: Executable Code Actions Elicit Better LLM Agents
Apr 28, 2026
Where does RL-on-verifiable-rewards stop generalizing?
Apr 24, 2026
Self-Consistency
Apr 17, 2026
From Prompting to Agency — Reasoning and Tool-Using LLMs
Apr 17, 2026
Self-Consistency Improves Chain of Thought Reasoning in Language Models
Apr 17, 2026
Tree of Thoughts: Deliberate Problem Solving with Large Language Models
Apr 16, 2026
RL for Reasoning (Test-Time Compute Scaling)
Apr 16, 2026
DeepSeek-R1: Incentivizing Reasoning via Reinforcement Learning
Apr 16, 2026
ReAct: Synergizing Reasoning and Acting in Language Models
Apr 05, 2026
Chain-of-Thought (CoT) Prompting
Apr 05, 2026
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models