'RunnableGenerator' 태그의 글 목록

LLM 스트리밍 취소 RunnableGenerator

LLM(대규모 언어 모델) 기반 애플리케이션을 개발할 때, 스트리밍은 사용자 경험을 크게 향상시키는 핵심 요소입니다. 마치 GPT-4가 한 글자씩 타이핑되듯 응답하는 것을 보는 것과 같죠. 하지만 때로는 사용자가 너무 길거나 원치 않는 응답을 받을 때, 중간에 생성을 중단하고 싶어 할 수 있습니다. 이때, 단순히 프로세스를 강제 종료하는 것이 아니라 우아하게(gracefully) 중단하는 방법이 필요합니다. 여러분은 다음과 같은 상황을 겪어본 적이 있을 겁니다:긴 응답 대기: LLM이 너무 긴 답변을 생성하느라 사용자가 하염없이 기다려야 하는 경우.잘못된 방향: LLM이 엉뚱한 방향으로 답변을 생성하고 있어, 더 이상 기다릴 필요가 없는 경우.리소스 절약: 불필요한 연산을 중단하여 비용과 서버 리소스를 ..

LLM 2025.11.20

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

일찍자기

RunnableGenerator 1

티스토리툴바