Meta에서 지난 해 11월 SAM3 모델을 출시했다. SAM3는 세그멘테이션 성능 향상을 넘어, 사람의 의도를 이해하고 반복적으로 문제 해결을 시도하는 것에 의의가 있다. Segmentation 에이전트 개념의 도입SAM2 모델과 비교하여, 기존의 SAM1, SAM2 모델은 "사람", "차", "의자"와 같은 명확한 객체에 강했다. 그러나, 추론이 필요한 요청은 사용자가 직접 프롬프트를 쪼개서 단계적으로 줘야했다. 이에 따른 SAM3의 핵심 변화는 에이전트를 도입했다는 것이다. SAM3는 멀티모달 LLM이 계획을 세우고 → SAM3가 실제로 마스크를 생성하고 → 결과를 보고 판단하고 재생성하는 프로세스를 만족할 때까지 반복한다. 이를 통해, 한 번 마스크를 생성하고 마는 것이 아니라, 사람처럼 시도와 ..