생각의 사슬
생각의 사슬(Chain of Thought, CoT)은 거대 언어 모델(LLM)이 복잡한 추론 작업을 수행할 때, 최종 답변을 도출하기 전 중간 논리 및 추론 단계를 명시적으로 생성하도록 유도하는 프롬프트 엔지니어링 기법이다.
-
핵심 개념 및 메커니즘 전통적인 프롬프트 방식이 입력(질문)에 대한 직접적인 출력(답변)을 즉각적으로 요구한다면, CoT는 문제를 여러 개의 논리적 단계로 분할한다. 모델은 중간 연산 및 추론 과정을 텍스트로 전개하며, 이를 통해 수학적 추론, 상식 추론, 기호 추론 등에서 발생하는 논리적 비약과 환각(Hallucination) 현상을 감소시킨다.
-
주요 분류
- Few-Shot CoT (소수 샷 생각의 사슬): 사용자가 프롬프트 내에 문제와 답변뿐만 아니라, 그 해답에 도달하는 중간 추론 과정이 상세히 적힌 예시(Demonstrations)를 제공하는 방식이다. 모델은 제공된 예시의 논리 전개 패턴을 모방하여 새로운 문제에 적용한다. (Wei et al., 2022)
- Zero-Shot CoT (제로 샷 생각의 사슬): 사전 예시 제공 없이, 프롬프트의 지시문 끝에 “Let’s think step by step(단계별로 생각해보자)“과 같은 트리거 문구를 삽입하는 방식이다. 이 문구는 모델이 자체적으로 문제를 분해하고 순차적으로 접근하도록 강제한다. (Kojima et al., 2022)
- 원리 및 실무적 효용 인지 과학의 인간 사고 과정에서 착안된 이 기법은, 모델에게 연산을 수행할 ‘물리적(토큰적) 시간 및 공간’을 확보해 주는 역할을 한다. 서구권 주요 인공지능 연구 기관 및 기업에서는 복잡한 과업 지시 시 모델의 즉각적인 응답 생성을 지양하고, CoT를 활용하여 논리적 정확성을 담보할 것을 권장한다.
출처 및 참고문헌(Sources)
- Wei, J., Wang, X., Schuurmans, D., Bosma, M., Xia, F., Chi, E., Le, Q. V., & Zhou, D. (2022). “Chain-of-Thought Prompting Elicits Reasoning in Large Language Models.” Advances in Neural Information Processing Systems (NeurIPS). (Google Research)
- Kojima, T., Gu, S. S., Reid, M., Matsuo, Y., & Iwasawa, Y. (2022). “Large Language Models are Zero-Shot Reasoners.” Advances in Neural Information Processing Systems (NeurIPS).
- OpenAI. “Prompt engineering strategy: Give models time to ‘think’.” OpenAI API Documentation. Retrieved from https://platform.openai.com/docs/guides/prompt-engineering